Hugging Face 旗下的 Gradio 宣布重大更新,允許開發者將 Gradio 單獨作為後端服務(Gradio Server)。開發者將不再受限於 Gradio 預設的 UI 組件,可自由使用 React、Vue、Svelte 或原生 JS 打造完全客製化的前端,同時保留 Gradio 內建的狀態管理、請求佇列、串流(Streaming)等強大後端優勢,大幅提升 AI 應用的開發彈性。
IBM 於 Hugging Face 發布全新 Granite 4.0 3B Vision 模型。這款僅有 30 億參數的輕量級多模態模型,專為企業級文件理解、圖表分析與 OCR 數據提取而設計。其小巧的體積不僅大幅降低了部署門檻與運算成本,更在處理複雜商業報表與 PDF 文件時展現出極高的實用性,是企業本地化部署的理想選擇。
Hugging Face 發表 OpenMed 的最新成果,展示僅需 165 美元即可跨 25 個物種訓練 mRNA 語言模型。此研究證明了生物學基礎模型不一定需要天文數字的算力預算,透過優化架構與訓練策略,中小型實驗室與獨立研究員也能進行前沿的基因組學 AI 研究,為 mRNA 疫苗與藥物開發帶來新契機。
Hugging Face 旗下熱門的 Transformer 強化學習庫 TRL 正式迎來 v1.0 版本。此版本確立了穩定的 API 設計,並將定位聚焦於「後訓練(Post-Training)」生態系。TRL v1.0 整合了監督微調(SFT)、直接偏好優化(DPO)以及因 DeepSeek 爆紅的群體相對策略優化(GRPO)等主流對齊技術,旨在為開發者提供一個能與快速變革的 AI 領域並肩同行的標準化工具。
第 20 期《Open Artifacts》開源週報帶來了多個全新組織與新型態開源模型的發布。 重點亮點包含 NVIDIA 的 Nemotron Super 系列、專注於印度語系的 Sarvam AI,以及 Cohere 推出的 Transcribe 語音轉寫相關模型。 這波釋出展示了開源生態系正朝向更多元、更具特定領域專業化(如多語言與語音)的方向快速演進。
本文探討如何「解放」開源 CLI 開發 Agent 工具 OpenClaw。隨著類似 Claude Code 的終端機 Agent 工具興起,Hugging Face 介紹了如何將 OpenClaw 與 Llama、Qwen 等開源模型整合。透過 Hugging Face 的推論 API 或本地部署,開發者可以不再受限於單一閉源 API,實現高自由度、低成本且隱私安全的自主開發流程。
ServiceNow AI 在 Hugging Face 上發布了名為「EVA」(Evaluating Voice Agents)的全新開源評估框架。該框架旨在解決傳統文字 LLM 評估無法涵蓋語音互動特性的痛點,專注於即時延遲、語音打斷、輪替(Turn-taking)及語意理解等多維度指標。這為開發下一代即時語音助理(如類似 GPT-4o 或 Gemini Live 的應用)提供了標準化的測試基準。
本指南展示如何利用 Hugging Face 的 sentence-transformers 庫與 NVIDIA 的 GPU 加速技術,在一天內構建專屬領域的向量嵌入(Embedding)模型。內容涵蓋利用 LLM 生成合成數據、選擇基底模型、使用對比學習(Contrastive Learning)進行微調,以及如何評估與部署。這套流程能有效解決通用模型在特定專業領域(如醫療、法律、金融)檢索率不佳的問題,是優化 RAG 系統的關鍵步驟。
Hugging Face 發布 2026 年春季開源報告,揭示開源 AI 生態的最新趨勢。報告指出,具備推理能力的開源模型(如 DeepSeek 與 Qwen 系列)已成為社群主流;同時,以 smolagents 為首的輕量級 Agent 框架與本機端(On-Device)小模型正快速普及。此外,開源多模態與影片生成技術的下載量也創下歷史新高,展現出開源社群強大的創新動能。
Hcompany 在 Hugging Face 上推出了 Holotron-12B 開源模型,專為「電腦操作(Computer Use)」設計。該模型具備 120 億參數,主打「高吞吐量」特性,旨在提升 AI 代理在操作作業系統與應用程式時的反應速度與執行效率,為輕量高效的 Agent 邁出重要一步。
隨著語言模型走向工業化生產,開源模型正迎來全新轉型。本文深入分析開源生態在市場競爭、模型能力提升上的最新趨勢,並探討開發者與研究者如何應對閉源巨頭的壓力,以及在技術快速變遷下的集體困惑。這標誌著開源 AI 已從實驗室走向資本與算力密集的大規模產業化時代。
Vercel 宣布支援部署熱門開源 LLM 閘道工具 LiteLLM 伺服器。這讓開發者能直接在 Vercel 的無伺服器(Serverless)環境中,快速建置一個相容 OpenAI 格式的統一 API 接口,藉此整合、負載均衡並監控超過 100 種不同的 LLM 服務。此舉大幅降低了維護自建 AI 閘道的基礎設施成本與複雜度。
Jack Clark 在本期電子報中探討了三個技術趨勢與一個社會政治議題。技術上,LLM 訓練其他 LLM(合成資料與自我提升)正成為主流;社群成功完成了 72B 參數模型的分散式訓練,展示了去中心化算力的潛力;同時指出電腦視覺因物理世界的複雜性,比文本生成更具挑戰性。最後,他思考了 AI 的快速崛起是否會導致現有政治體制進入混亂的「過渡期」。
Hugging Face 宣布在 Hub 上推出「Storage Buckets」儲存桶功能。這項新服務為開發者提供相容 S3 的物件儲存空間,旨在解決傳統 Git LFS 在處理超大型資料集、模型權重與訓練暫存檔時的效能與容量限制。用戶可以直接透過 Hugging Face SDK 進行高效讀寫,並與 Spaces、Datasets 等生態系無縫整合。
隨著 LLM 強化學習(RL)成為顯學,如何優化訓練效率成為關鍵。Hugging Face 評估了 16 個開源 RL 函式庫,指出傳統同步訓練因「生成」與「訓練」運算特性不同,會導致嚴重的 GPU 閒置。本文總結了非同步 RL 訓練(Async RL)的最新技術趨勢,探討如何透過解耦架構與高效記憶體管理,讓 Token 持續流動並最大化吞吐量。
Hugging Face 發表開源機器人庫 LeRobot v0.5.0 重大更新。本次更新以「全面擴展(Scaling Every Dimension)」為核心,大幅提升了數據集規模、支援更多樣的模型架構(如 Diffusion Policy 與 ACT)、擴展了相容的實體硬體與模擬環境。這標誌著開源社群在具身智能(Embodied AI)領域邁出關鍵一步,降低了開發者進入實體機器人研究的門檻。
Hugging Face 詳細介紹了 Ulysses 序列平行化(USP)技術。該技術透過在注意力計算前後進行 All-to-All 集合通訊,將序列維度與注意力頭維度進行轉置,使每個 GPU 能在本地高效計算完整序列的子集注意力。相較於傳統的 Megatron-SP 或 Ring Attention,Ulysses SP 具有極低的通訊開銷,並能與 ZeRO-3 完美結合,是訓練百萬級(Million-Token)超長上下文大模型的高效首選方案。
本文探討政策專家 Dean Ball 對於「Anthropic 訴 戰爭部(DoW)」一案的觀察。他指出,這場涉及國家安全與 AI 技術控制的法律戰,其判決與和解過程將釋放微妙的先例信號。這些信號不僅影響封閉原始碼巨頭,更會直接衝擊開源模型的生存空間,若政府以國安為由限制模型權重,將對整個開源生態帶來嚴重的監管效應。
Allen Institute for AI (AI2) 近期推出 OLMo Hybrid 模型,引發對未來 LLM 架構的廣泛討論。本文深入分析混合架構(如結合 Transformer 與狀態空間模型 SSM/Mamba)在提升效率與長文本處理上的潛力。同時,探討了開源社群在後訓練(Post-training)工具上的最新進展,指出開源生態正逐步縮小與閉源頂尖模型在對齊與強化學習上的差距。
本指南介紹 Hugging Face 與 NXP 的合作成果,展示如何將視覺-語言-動作(VLA)模型應用於嵌入式機器人平台。內容涵蓋使用 LeRobot 進行資料集錄製、對 VLA 模型進行客製化微調,以及利用 NXP eIQ 工具包在 i.MX 晶片上進行量化與硬體加速優化,實現低延遲、低功耗的邊緣端機器人控制。
Hugging Face 發表「Modular Diffusers」,旨在解決過去 Diffusers 管線過於單一、難以客製化的痛點。新架構將擴散模型(如 Stable Diffusion、Flux 等)的各個步驟與組件拆解為獨立、可重複使用的模組。開發者現在可以像堆積木一樣,輕鬆混合搭配不同的編碼器、去噪網路與排程器,極大地簡化了自定義圖像與視訊生成工作流的開發難度。
本文為 Nathan Lambert 的《Latest open artifacts》第 19 期。隨著農曆馬年的到來,阿里 Qwen 3.5、智譜 GLM 5 以及 MiniMax 2.5 等模型相繼亮相。這些最新釋出的開放權重(open-weights)模型,展示了中國 AI 實驗室在開源與前沿領域的強勁實力,並進一步縮小了與美國頂尖模型之間的差距,為全球開發者提供更多元的高性能選擇。
Hugging Face 深入解析 Transformer 中的混合專家模型 (MoE) 架構。MoE 透過稀疏門控網路將 Token 分流至特定「專家」FFN,實現「高總參數、低計算量」的優勢。本文探討其核心組件、訓練與推理挑戰(如 VRAM 佔用與路由失衡),是理解 Mixtral 與 DeepSeek 等主流模型的必讀指南。
本文探討知識蒸餾(Distillation)在中國大語言模型(如 DeepSeek、Qwen)發展中扮演的角色。針對 Anthropic 近期將蒸餾視為「安全攻擊」的報告,作者指出,雖然蒸餾確實加速了模型對齊,但中國 LLM 的成功更多歸功於其強大的預訓練底座與強化學習(RL)創新。將蒸餾單純簡化為「抄襲」或「攻擊」,忽略了其作為標準機器學習技術的本質,也低估了中國團隊的工程實力。
Vercel 發表全新 npm 套件 `chat`(透過 `npm i chat` 安裝),旨在簡化跨平台 AI 聊天應用的開發。開發者只需編寫一次邏輯,即可將聊天機器人無縫部署至 Web 網頁、Slack、Discord、WhatsApp 等多個平台。該套件與 Vercel AI SDK 深度整合,支援多種主流大語言模型,並具備 Edge 運算優化與開箱即用的狀態管理功能。
Hugging Face 宣布與極速微調工具 Unsloth 合作,推出免費的 AI 模型訓練方案。使用者可以透過 Hugging Face Jobs 平台,直接在雲端免費運行 Unsloth 的高效微調任務。這項合作大幅降低了個人開發者與研究人員微調 Llama 3、Gemma 等開源大模型的門檻與成本。
開源 AI 領域迎來震撼消息,主導本地端 LLM 推理的開源專案 GGML 與 llama.cpp 正式宣布加入 Hugging Face。此舉旨在為本地端與邊緣端 AI 技術提供長期且穩定的資源支持。雙方將深化 GGUF 格式與 Hugging Face 平台的整合,確保開源社群能更輕鬆地在消費級硬體上運行高效能模型,持續推動去中心化與隱私優先的 AI 發展。
Vercel 宣布其 AI Gateway 正式支援影片生成模型。開發者現在可以透過統一的 Gateway 介面進行影片生成請求,並享有快取、速率限制(Rate Limiting)與詳細的調用監控。這項更新解決了影片生成成本高昂且非同步處理複雜的痛點,大幅簡化了 AI 影片應用的開發流程。
Vercel 宣布其 AI Gateway 服務正式支援開源影片生成模型 Wan。這項更新讓開發者能夠透過 Vercel 的統一 API 閘道,輕鬆調用、快取、限制速率並監控 Wan 模型的影片生成請求,大幅降低了在 Web 應用中整合先進開源影片生成技術的門檻與運維成本。
IBM 研究中心與柏克萊加州大學(UC Berkeley)合作發表了 IT-Bench 基準測試與 MAST 診斷框架。IT-Bench 模擬了真實的企業 IT 運維環境,而 MAST 則專門用來剖析 AI Agent 在執行多步驟任務時失敗的深層原因。研究指出,企業級 Agent 的失敗往往源於工具調用錯誤、狀態追蹤失效及錯誤累積,而非單純的 LLM 能力不足,這為未來 AIOps 的優化提供了明確方向。