Hugging Face BlogMay 18, 2026, 2:12 PM重要 80

The Open Agent Leaderboard

Hugging Face 與 IBM Research 聯手推出 Open Agent Leaderboard,為 AI 智能體(Agent)的工具調用與規劃能力提供標準化評測。

Hugging Face 與 IBM Research 合作發表「Open Agent Leaderboard」,這是一個專為 AI 智能體(Agent)設計的全新開源排行榜。傳統的 LLM 評測難以衡量模型在實際任務中的多步驟規劃與工具調用能力,該排行榜整合了多個主流 Agent 評測集,提供客觀、標準化的評估標準,推動開源 Agent 生態系的發展。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。