Hugging Face BlogApr 8, 2025, 12:00 AM

Arabic Leaderboards: Introducing Arabic Instruction Following, Updating AraGen, and More

Hugging Face 推出阿拉伯語 LLM 評估更新,引入阿拉伯語版指令遵循(IFEval)並升級 AraGen 基準。

Hugging Face 宣布升級其阿拉伯語大語言模型(LLM)評估體系。本次更新重點引入了「阿拉伯語指令遵循(Arabic IFEval)」評估,用以測試模型執行特定格式與約束指令的能力;同時更新了阿拉伯語生成基準「AraGen」。這些舉措旨在解決非英語系評估資源不足的問題,為全球開源社群提供更精準的阿拉伯語模型評估工具。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。