Hugging Face BlogJul 10, 2025, 12:54 PM重要 82

Kimina-Prover: Applying Test-time RL Search on Large Formal Reasoning Models

Hugging Face AI-MO 團隊推出 Kimina-Prover,將測試時強化學習搜尋(Test-time RL Search)應用於大型形式化推理模型。

Hugging Face 的 AI-MO 團隊發表 Kimina-Prover,這是一項針對大型形式化推理模型的創新研究。該系統在推理階段(Test-time)引入強化學習搜尋機制,讓模型在面對複雜數學證明時能動態探索與自我修正。透過與形式化證明工具互動,Kimina-Prover 顯著提升了自動定理證明的成功率,為開源數學推理 AI 帶來重大突破。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。