本文為 Nathan Lambert 的《Latest open artifacts》第 19 期。隨著農曆馬年的到來,阿里 Qwen 3.5、智譜 GLM 5 以及 MiniMax 2.5 等模型相繼亮相。這些最新釋出的開放權重(open-weights)模型,展示了中國 AI 實驗室在開源與前沿領域的強勁實力,並進一步縮小了與美國頂尖模型之間的差距,為全球開發者提供更多元的高性能選擇。
Enterprise AI 公司 Writer 在 Hugging Face 上推出了全新的「Palmyra-mini」模型系列。該系列主打輕量化與強大效能,並特別強調具備「推理(reasoning)」能力。這使得開發者能在資源受限的環境中,部署具備複雜邏輯思考與問題解決能力的 AI 模型,為邊緣運算與企業應用提供新選擇。
Google DeepMind 發表全新開放模型 Gemma 3n 預覽版,專為行動裝置與端側(on-device)快速多模態 AI 設計。該模型不僅優化了執行效能,還引入獨特的「二合一(2-in-1)」彈性架構,並擴展了對音訊的理解能力。這將賦能開發者構建即時互動、以語音為核心的全新應用體驗。
Google 推出全新一代開源模型 Gemma 3,具備強大的多模態(視覺與語音)理解能力、廣泛的多語言支持以及長文本處理能力。本次發布涵蓋多種參數規格,並與 Hugging Face 生態系統深度整合,開發者可立即透過 Transformers、vLLM 等工具進行部署與微調,為開源社群注入強大動力。
Cohere For AI 發表全新開源多語言模型家族 Aya Expanse(包含 8B 與 32B 參數版本),支援 23 種語言。該模型透過創新的資料套利、合成資料生成與多語言偏好對齊技術,在多項基準測試中擊敗了 Llama 3.1、Gemma 2 等同級甚至更大規模的模型,為全球多語言 AI 研究樹立了新標竿。
由 Stable Diffusion 原班人馬創立的 Black Forest Labs 推出全新圖像生成模型家族 FLUX.1。該模型包含 Schnell、Dev 和 Pro 三個版本,在文字生成、複雜指令遵循以及人體細節上展現出驚人實力。Replicate 平台第一時間上架並進行深度實測,認為其美學風格與寫實度已能與 Midjourney v6 匹敵,為開源 AI 繪圖立下新標竿。