Hugging Face BlogSep 22, 2025, 12:00 AM重要 85
Gaia2 and ARE: Empowering the community to study agents
Hugging Face 推出全新 Agent 基準測試 Gaia2 與安全運行環境 ARE,打造標準化且可複現的 AI Agent 研究生態系。
Hugging Face 正式發表 Gaia2 基準測試與 ARE (Agent Run Environment) 框架。Gaia2 延續前代精神,設計了更複雜、防污染且貼近真實世界的多模態任務;而 ARE 則提供安全沙盒化的執行環境,解決了 Agent 測試中重現性低與安全風險的痛點。這套組合將大幅降低社群研究與評估 AI Agent 的門檻。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。