Hugging Face BlogJul 1, 2024, 12:00 AM重要 80
Our Transformers Code Agent beats the GAIA benchmark 🏅
Hugging Face 推出基於程式碼執行的 Transformers Code Agent,在難度極高的 GAIA 基準測試中刷新紀錄。
Hugging Face 發表全新的 Transformers Code Agent,透過讓 AI 撰寫並執行 Python 程式碼來解決複雜任務。該方法在評估通用 AI 助理能力的 GAIA 基準測試上取得了 SOTA(當前最佳)表現,證明了「程式碼執行」作為 Agent 推理工具,遠比傳統的 JSON 工具調用(Tool Calling)更具彈性與效率。此專案已完全開源,為開發者提供構建高效能 Agent 的新選擇。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。