Hugging Face BlogJan 28, 2025, 12:00 AM重要 90
Open-R1: a fully open reproduction of DeepSeek-R1
Hugging Face 推出 Open-R1 專案,旨在以完全開源的方式重現 DeepSeek-R1 的推理模型與訓練流程。
Hugging Face 宣布啟動 Open-R1 專案,目標是完全重現 DeepSeek-R1 的推理能力。該專案將開源所有訓練配方、資料集與模型權重,並利用 TRL 框架中的 GRPO 演算法進行強化學習。這項計畫將降低開發者構建高效推理模型的門檻,推動開源 AI 社群的推理模型民主化。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。