Google DeepMind BlogOct 23, 2025, 6:52 PM重要 78
Rethinking how we measure AI intelligence
Google DeepMind 推出開源評測平台 Game Arena,透過具備明確勝負條件的遊戲環境,對前沿 AI 模型進行兩兩對決的嚴格評估。
Google DeepMind 發表全新開源平台「Game Arena」,旨在解決傳統 AI 基準測試逐漸失效的問題。該平台讓不同的前沿 AI 模型在具有明確勝負規則的遊戲環境中進行直接對決。透過這種動態且具對抗性的方式,Game Arena 能更精準、客觀地評估 AI 的決策與推理能力,為 AI 領域提供更具公信力的衡量標準。
想看英文原文 / 完整內容?
前往 Google DeepMind Blog 原文 →摘要由 AI 整理,以原文為準。