Hugging Face BlogFeb 10, 2025, 12:00 AM

The Open Arabic LLM Leaderboard 2

Hugging Face 推出 Open Arabic LLM Leaderboard 2,全面升級評測基準,精準評估阿拉伯語模型的推理與文化適應力。

Hugging Face 宣布推出「開源阿拉伯語大語言模型排行榜 2.0」。本次更新旨在解決舊版基準過時與數據污染問題,引入了更具挑戰性的評測數據集,涵蓋推理、數學、文化理解等維度。新版本採用 Lighteval 評估工具並加強防作弊機制,為阿拉伯語 AI 研究提供更具公信力的評估標準。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。