Showing:accelerationDevelopersClear ×
Hugging Face 宣布與 RapidFire AI 合作,在 TRL(Transformer Reinforcement Learning)庫中實現高達 20 倍的微調加速。TRL 是用於 LLM 對齊(如 DPO、PPO)的核心工具,此次整合透過最佳化訓練流程與算子,顯著降低了強化學習微調的時間與算力成本,讓開發者能更高效地進行模型對齊。