Hugging Face 宣布推出「Community Evals」計畫,旨在解決當前 AI 領域中「黑箱排行榜」缺乏透明度與容易被操弄的問題。該計畫強調開源、可重現性與社群驅動,讓全球開發者能共同參與評測標準的制定與驗證。這標誌著 AI 模型評估將從單一機構主導,走向更具公信力的集體智慧時代。
適逢 DeepSeek 震撼科技界一週年,Hugging Face 發文回顧這一關鍵轉折點對全球開源生態系的深遠影響。 文章指出,DeepSeek 證明了高性價比開源推理模型的可行性,並加速了去中心化與開源社群的協同創新。 展望未來,開源 AI 將從單一模型競爭轉向「AI+」時代,強調多模態、Agent 應用與各行各業的深度整合。
Vercel 官方宣布推出「Vercel OSS 漏洞賞金計畫」,鼓勵全球安全研究人員與開發者協助找出其開源專案(如 Next.js、Turborepo 等)的安全漏洞。該計畫將依漏洞嚴重性提供獎金,旨在強化開源生態系的供應鏈安全,保障數百萬使用其技術的網站。
在「DeepSeek 時刻」屆滿一週年之際,Hugging Face 發文探討中國開源 AI 生態系的技術演進。文章深入分析了中國各大 AI 團隊(如 Qwen、GLM、Yi 等)如何超越 DeepSeek 的既有框架,在混合專家模型(MoE)、多頭潛在注意力(MLA)以及強化學習(GRPO)等架構上進行抉擇與創新。這些技術選擇不僅是為了應對算力限制,更重塑了全球開源 AI 的高效率與低成本標準。
本文探討如何針對開源 GPT 模型(GPT-OSS)導入自主 Agent 強化學習(Agentic RL)訓練。LinkedIn 團隊分享了他們在訓練過程中的實務經驗與挑戰,包含如何建立有效的獎勵機制、克服訓練不穩定性,並提供了一套可供開發者與研究人員參考的實作回顧,旨在推動開源模型在複雜 Agent 任務中的表現。
2025 年初的「DeepSeek 時刻」以超低訓練成本與強大推理能力震驚全球。一年過去,Hugging Face 回顧了這場變革對開源社群的深遠影響,包括 GRPO 強化學習演算法的普及、MoE 架構的廣泛應用,以及全球開發者如何擺脫對閉源巨頭的依賴,走向更自主、高效的本地部署與微調時代。這標誌著 AI 發展從「算力軍備競賽」走向「演算法與效率至上」的新紀元。
Microsoft 於 Hugging Face 發表 Differential Transformer V2(Diff-Transformer V2)。延續 V1 透過雙注意力地圖相減來消除雜訊的設計,V2 重點解決了計算與記憶體開銷問題。新版本引入了高度優化的 CUDA 核心與 FlashAttention 整合,並釋出預訓練模型與 Hugging Face 整合,讓開發者能以更低成本部署具備強大長文本與抗噪能力的模型。
Hugging Face 發布「Open Responses」專題,整理其向全球政府機構(如美、歐監管單位)提交的政策諮詢回應。文章深入探討開源 AI 面臨的監管挑戰、版權爭議與安全評估,並說明這些政策將如何形塑未來的 AI 開發環境,呼籲社群共同關注與參與。
IBM Research 宣佈在 Hugging Face 上推出 CUGA(可配置用戶引導代理)框架。CUGA 旨在簡化 AI Agent 的自定義與部署流程,讓開發者無需複雜的程式碼或微調,即可透過結構化配置引導 Agent 的行為與決策。此舉結合了 Hugging Face 的開源生態,將促進安全、可控的 Agentic AI 技術走向大眾化。
Hugging Face 釋出最新消息,指出 Codex 正在開源其 AI 模型。此舉結合了 Hugging Face 的開源生態與 Codex 在技能培訓(Skills Training)領域的專長,旨在為全球開發者、學生及研究人員提供更具可及性的 AI 工具,進一步推動 AI 實作技能的普及與教育發展。
Hugging Face 正式發布 Transformers v5,核心聚焦於「簡化模型定義」。新版本解決了過去因「單一檔案原則」導致的程式碼冗餘問題,引入更具模組化且易讀的架構。這讓開發者能更輕鬆地修改、擴充與部署模型,同時保持與現有生態系的相容性,為 AI 社群帶來更高效的開發體驗。
Hugging Face 與 Google Cloud 達成全新戰略合作,旨在為開發者提供更便利的開源 AI 開發環境。 開發者現在可以直接在 Google Cloud 的 Vertex AI 和 GKE 上一鍵部署 Hugging Face 的數十萬個開源模型。 此合作還整合了 Google Cloud Marketplace,並支援 TPU 與 GPU 加速,大幅降低企業與個人開發者訓練與部署 AI 的門檻。
Hugging Face 官方 Python 庫 huggingface_hub 迎來 v1.0 穩定版。歷經五年的持續演進,該庫已成為全球開發者下載、上傳與管理開源模型及資料集的標準工具。v1.0 的推出象徵著 API 的高度穩定與成熟,承諾了更好的向後相容性,為未來的開源機器學習生態系奠定更堅實的基礎。
Google DeepMind 發表全新生物聲學模型「Perch」,旨在協助保育人士快速分析野外錄音。該模型能自動識別夏威夷蜜旋木雀等瀕危鳥類及珊瑚礁生態系統的聲音,大幅縮短人工監聽時間。這項技術讓科學家能在大範圍內進行長期的生態監測,為全球生物多樣性保護提供關鍵支持。
Google DeepMind 發表全新開源平台「Game Arena」,旨在解決傳統 AI 基準測試逐漸失效的問題。該平台讓不同的前沿 AI 模型在具有明確勝負規則的遊戲環境中進行直接對決。透過這種動態且具對抗性的方式,Game Arena 能更精準、客觀地評估 AI 的決策與推理能力,為 AI 領域提供更具公信力的衡量標準。
Google DeepMind 發表了 VaultGemma,這是全球首款從頭開始(from scratch)使用差分隱私(Differential Privacy, DP)技術訓練的高性能大語言模型。透過嚴格的數學隱私保證,VaultGemma 能有效防止訓練數據洩露與敏感資訊記憶,同時在多項基準測試中保持極高的實用性,為醫療、金融等高隱私需求領域帶來全新突破。
Google DeepMind 宣布推出一款基於 Gemma 開源模型家族、擁有 270 億參數的全新單細胞分析基礎模型。該模型專為生物醫學研究設計,能深入分析單細胞數據,並已成功協助研究人員發現了一條全新的潛在癌症治療途徑,展現了開源大模型在生醫領域的巨大潛力。
Hugging Face 正式推出 OpenEnv 計劃,旨在解決 AI Agent 在執行任務時面臨的環境不一致與安全隱憂。OpenEnv 提供了一個標準化、安全隔離的沙盒環境,讓 Agent 能安全地執行程式碼、操作檔案與進行網頁互動。此舉將促進開源社群在 Agent 評估與部署上的協作,共同打造更安全且一致的開放 Agent 生態系統。
廣受開發者歡迎的開源嵌入向量庫 Sentence Transformers 宣布正式加入 Hugging Face。未來該專案將移至 Hugging Face 的 GitHub 組織下管理,獲得更多官方資源支持。這項合作將深化其與 Hugging Face Hub 的整合,提升模型託管、文檔與效能優化,為 RAG 與語意搜尋應用提供更穩定的開源基石。
Hugging Face 與 BigCode 合作推出全新評測平台「BigCodeArena」。該平台主打「端到端實際執行(Execution-based)」評測機制,將模型生成的程式碼置於安全沙盒中運行並進行單元測試。這解決了傳統「LLM 當裁判」或靜態分析無法驗證程式碼真實可用性的痛點,為開發者與研究人員提供更具公信力的 Code LLM 排行榜。
Hugging Face 正式發表 Gaia2 基準測試與 ARE (Agent Run Environment) 框架。Gaia2 延續前代精神,設計了更複雜、防污染且貼近真實世界的多模態任務;而 ARE 則提供安全沙盒化的執行環境,解決了 Agent 測試中重現性低與安全風險的痛點。這套組合將大幅降低社群研究與評估 AI Agent 的門檻。
Hugging Face 介紹了 RiskRubric.ai 平台,旨在將 AI 安全評估民主化。該平台提供標準化的風險評估量表(Rubrics),幫助開發者與研究人員量化評估 AI 模型在偏見、毒性及隱私等維度的風險。透過開源與社群驅動的方式,它降低了中小型團隊進行 AI 安全測試與紅隊演練的門檻,並能與 Hugging Face 生態系無縫整合。
Vercel 宣布推出「x402-mcp」,這是一個針對模型上下文協議(MCP)工具的開放式支付協議。該協議旨在解決 AI Agent 與工具互動時的付費與授權問題,靈感源自 HTTP 402(Payment Required)狀態碼。透過 x402-mcp,開發者可以更輕鬆地為其 MCP 工具整合計費與支付機制,促進 AI 工具生態系的商業化發展。
Hugging Face 宣布與 Together AI 深度整合,推出全新微調解決方案。開發者現在可以直接從 Hugging Face Hub 選擇任何開源大語言模型,並利用 Together AI 的高效能 GPU 叢集與微調 API 進行訓練。此合作大幅簡化了微調的工作流程,免去繁瑣的硬體設定,並提供極具成本效益的無伺服器微調體驗。
NVIDIA 在 Hugging Face 上正式發布了包含 600 萬個樣本的全新「多語言推理數據集」(Multi-Lingual Reasoning Dataset)。 該數據集旨在解決當前 AI 模型在非英語系語言中邏輯推理能力不足的痛點,提供大規模且高質量的訓練素材。 此開源資源將顯著降低開發多語言推理模型(如 Reasoning LLM)的門檻,對開源社群具有重要推動作用。
Replicate 宣布推出遠端 MCP(Model Context Protocol)伺服器,將其平台上的數萬個開源模型直接接入開發工作流。使用者現在無需離開編輯器或聊天介面,即可在 Claude Desktop、Cursor 和 VS Code 等工具中,直接搜尋、比較並執行 Replicate 上的模型。這項更新大幅簡化了開發者測試與整合各種開源 AI 模型(如 Llama、Flux 等)的流程,提升開發效率。
Hugging Face 官方宣布迎來 OpenAI 的全新開源模型家族「GPT OSS」。這項合作打破了 OpenAI 長期以來以閉源為主的策略,將其強大的 GPT 技術以開源形式提供給全球開發者。社群現在可以直接在 Hugging Face 上下載、微調並部署這些模型,預計將對開源 AI 生態系產生深遠的影響。
NVIDIA 在 Hugging Face 部落格分享了其開源且可移植的深度研究 Agent 成果。透過在 DeepResearch Bench 基準測試上評估開源的 Llama Nemotron 模型,該系統展現出極佳的研究與推理能力。此研究證明了開源模型在複雜、多步驟的研究任務中,已具備與閉源頂尖模型競爭的實力,為開發者提供了一個強大且可本地部署的 Deep Research 解決方案。
Hugging Face 發表全新的輕量級開源實驗追蹤工具 Trackio。旨在解決現有 MLOps 工具過於臃腫的問題,Trackio 提供在地優先(Local-first)的架構與極簡 API,並能與 Hugging Face Hub 及 Transformers 生態系無縫整合。開發者只需幾行程式碼即可記錄參數、指標與模型權重,並能透過輕量網頁介面進行可視化,是 AI 研究者的全新輕量化選擇。
Hugging Face 宣布與 NVIDIA 深度整合,推出支援多種 LLM 的 NVIDIA NIM(推理微服務)。開發者現在可以直接在 Hugging Face 平台上,利用經 TensorRT-LLM 優化的 NIM 容器,輕鬆部署 Llama、Mistral 等熱門開源模型,大幅提升推理吞吐量並降低延遲,簡化企業級 AI 應用的落地流程。