Hugging Face BlogFeb 10, 2025, 12:00 AM
The Open Arabic LLM Leaderboard 2
Hugging Face 推出 Open Arabic LLM Leaderboard 2,全面升級評測基準,精準評估阿拉伯語模型的推理與文化適應力。
Hugging Face 宣布推出「開源阿拉伯語大語言模型排行榜 2.0」。本次更新旨在解決舊版基準過時與數據污染問題,引入了更具挑戰性的評測數據集,涵蓋推理、數學、文化理解等維度。新版本採用 Lighteval 評估工具並加強防作弊機制,為阿拉伯語 AI 研究提供更具公信力的評估標準。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。