Hugging Face BlogAug 1, 2025, 2:25 PM
📚 3LM: A Benchmark for Arabic LLMs in STEM and Code
TII 推出 3LM 基準測試,專門評估阿拉伯語大語言模型(LLM)在 STEM 與程式碼領域的表現。
阿聯酋技術創新研究所(TII)在 Hugging Face 發布了名為「3LM」的全新評估基準。該基準專為阿拉伯語大語言模型(LLM)設計,旨在測試其在科學、技術、工程、數學(STEM)以及程式碼編寫等高難度領域的能力。這填補了目前多語言 AI 評估中,阿拉伯語技術性評測工具不足的空白。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。