IBM 發布全新開源多語言嵌入模型 Granite Embedding Multilingual R2。該模型採用寬鬆的 Apache 2.0 授權,支援高達 32K 的上下文長度。在參數小於 1 億(Sub-100M)的同量級模型中,它展現出最頂尖的資訊檢索品質,非常適合用於建構高效能且低資源消耗的 RAG(檢索增強生成)系統。
第 20 期《Open Artifacts》開源週報帶來了多個全新組織與新型態開源模型的發布。 重點亮點包含 NVIDIA 的 Nemotron Super 系列、專注於印度語系的 Sarvam AI,以及 Cohere 推出的 Transcribe 語音轉寫相關模型。 這波釋出展示了開源生態系正朝向更多元、更具特定領域專業化(如多語言與語音)的方向快速演進。
Hugging Face 宣布升級其 Open ASR Leaderboard,正式引入「多語言」與「長音訊」兩大全新評測賽道。這項更新解決了過去 ASR 評測過於依賴短英文語音的痛點。新賽道不僅能更客觀地評估模型在全球多語系環境下的實用性,還能考驗模型在處理會議、播客等長篇語音時的幻覺控制與分段對齊能力,為開源語音社群提供更具實戰價值的參考基準。
Hugging Face 與社群合作推出 mmBERT,這是基於 ModernBERT 架構的多語言版本。mmBERT 繼承了 ModernBERT 的現代化改進(如 FlashAttention、RoPE 與 8192 token 長文本支持),旨在取代傳統的 mBERT 與 XLM-RoBERTa。它能顯著提升多語言文本分類、命名實體識別(NER)及檢索(RAG)等任務的運算效率,為開發者提供更強大且省資源的開源選擇。
NVIDIA 在 Hugging Face 上正式發布了包含 600 萬個樣本的全新「多語言推理數據集」(Multi-Lingual Reasoning Dataset)。 該數據集旨在解決當前 AI 模型在非英語系語言中邏輯推理能力不足的痛點,提供大規模且高質量的訓練素材。 此開源資源將顯著降低開發多語言推理模型(如 Reasoning LLM)的門檻,對開源社群具有重要推動作用。
Hugging Face 正式發表 SmolLM3 輕量級模型系列。延續前代小巧好部署的特色,SmolLM3 這次特別強化了「多語言支援」、「長上下文處理」以及「推理能力(Reasoner)」。這使得開發者能在資源受限的設備或本地端,運行具備複雜邏輯推理與長文本理解的多語言 AI 應用。
巴塞隆納超級電腦中心(BSC-LT)正式發布 Visual Salamandra 7B 多模態模型。該模型以其自主研發的 Salamandra 7B 語言模型為基礎,融合了先進的視覺編碼器,旨在提升圖像理解、視覺問答及 OCR 能力。特別的是,它承襲了 Salamandra 家族在西班牙語、加泰隆尼亞語等多語言環境下的優異表現,為開源多模態社群注入新選擇。
Hugging Face 宣布升級其阿拉伯語大語言模型(LLM)評估體系。本次更新重點引入了「阿拉伯語指令遵循(Arabic IFEval)」評估,用以測試模型執行特定格式與約束指令的能力;同時更新了阿拉伯語生成基準「AraGen」。這些舉措旨在解決非英語系評估資源不足的問題,為全球開源社群提供更精準的阿拉伯語模型評估工具。
Google 推出全新一代開源模型 Gemma 3,具備強大的多模態(視覺與語音)理解能力、廣泛的多語言支持以及長文本處理能力。本次發布涵蓋多種參數規格,並與 Hugging Face 生態系統深度整合,開發者可立即透過 Transformers、vLLM 等工具進行部署與微調,為開源社群注入強大動力。
Cohere For AI 發表全新開源多語言多模態模型「Aya Vision」(提供 8B 與 32B 版本)。該模型旨在解決現有視覺語言模型(VLM)嚴重偏向英語的問題,大幅提升了對全球多種語言(特別是低資源語言)的圖像理解與文字生成能力。在多項多語言多模態基準測試中,Aya Vision 展現出超越同量級開源模型的優異性能,並已於 Hugging Face 平台上開源。
Hugging Face 宣布與印度頂尖研究機構印度科學理工學院(IISc)展開合作。雙方將結合 IISc 的學術研究實力與 Hugging Face 的開源生態系,致力於解決印度多元語言(包含多種低資源語言)的 AI 模型開發挑戰。此舉旨在為印度本土語言建立更完善的開源數據集與語言模型,促進在地化的 AI 技術普及。
Google 與 Hugging Face 聯合發表 SigLIP 2 視覺語言編碼器。作為經典 SigLIP 的升級版,SigLIP 2 引入了動態解析度、自監督學習(SSL)輔助任務與更強的多語言支援。它在零樣本分類、圖文檢索及定位等任務上表現優異,並提供多種尺寸的模型,非常適合用作新一代多模態大模型(VLM)的視覺骨幹網路(Vision Backbone)。
Hugging Face 發表全新的 VDR-2B-multilingual 模型,專為視覺文件檢索(VDR)設計。傳統檢索依賴繁瑣的 OCR 步驟,而該模型能直接將文件頁面視為圖像進行向量化,保留排版、圖表與插圖資訊。本次更新重點在於擴展至多語言支持(包含中英日韓等),大幅提升跨國企業與多語系文檔的檢索效率與準確度。
本文介紹了首屆多語言大型語言模型(LLM)辯論賽。傳統的靜態評估方法(如多選題)已難以衡量模型的深層推理與說服力,因此研究人員設計了讓模型針對特定議題進行多輪多語言辯論的機制。透過這種動態對抗,不僅能更精準地評估模型在非英語環境下的邏輯一致性,也為 LLM 的安全性和對齊(Alignment)提供了全新的評估維度。
Cohere For AI 發表全新開源多語言模型家族 Aya Expanse(包含 8B 與 32B 參數版本),支援 23 種語言。該模型透過創新的資料套利、合成資料生成與多語言偏好對齊技術,在多項基準測試中擊敗了 Llama 3.1、Gemma 2 等同級甚至更大規模的模型,為全球多語言 AI 研究樹立了新標竿。
Hugging Face 發表了專為捷克語設計的全新大型語言模型(LLM)評估基準「BenCzechMark」。由於多數主流基準測試皆以英語為主,此項目旨在填補捷克語在 AI 評估領域的空白。該基準涵蓋多種語言理解與生成任務,能更準確地衡量模型在捷克語語境與文化背景下的實際表現。
Hugging Face 宣布推出「Open Arabic LLM Leaderboard」,這是一個專為阿拉伯語大語言模型設計的開源評測排行榜。該平台旨在解決阿拉伯語在 AI 評測上的資源匱乏問題,透過多維度的基準測試(如文化理解、推理與語言生成),幫助社群客觀評估並推動阿拉伯語 AI 模型的發展。
Hugging Face 宣布推出「希伯來語 LLM 開放排行榜」(Open Leaderboard for Hebrew LLMs)。該平台旨在為希伯來語的大型語言模型提供客觀、標準化且開源的評估基準,解決非英語系語言在主流評測中資源匱乏的問題,有助於開發者評估與優化特定語系模型的表現。
Hugging Face 發表「Huggy Lingo」專案,旨在解決 Hub 上許多模型和數據集缺乏或標記錯誤語言元數據(Metadata)的問題。該系統利用機器學習(如語言識別模型)分析 README 內容與數據集樣本,自動預測並補全正確的語言標籤(如 ISO 639 代碼)。這項改進將大幅提升全球開發者在 Hub 上搜尋、篩選特定語言資源的效率,特別是針對低資源語言的發掘。
Hugging Face 協同 BigScience 社群正式發表 BLOOM,這是一個擁有 1760 億參數的開源多語言大模型。該模型由全球 70 多國、上千名研究人員歷時一年多共同協作完成,並在法國 Jean Zay 超級電腦上進行訓練。BLOOM 支援 46 種自然語言與 13 種程式語言,旨在打破科技巨頭壟斷,推動 AI 學術研究的民主化與開放合作。