Google DeepMind 發表了 Gemma 3n 的開發者指南。Gemma 3n 是專為那些協助塑造與改進 Gemma 模型的開發者社群所設計。此指南旨在幫助開發者更輕鬆地整合與應用此模型,延續了 Google 對於開源與開放權重(open-weights)AI 社群的承諾。
Hugging Face 旗下的開源機器人學習庫 LeRobot 迎來 v0.4.0 重大更新。本次版本專注於降低機器人 AI 的開發門檻,優化了從資料收集、模型訓練到實體部署的完整工作流。新版本擴展了對多種平價開源硬體的支援,並加強了與 Hugging Face Hub 的整合,讓開發者能更輕鬆地共享機器人資料集與預訓練模型,加速機器人領域的開源生態發展。
Google DeepMind 宣布在 Gemma 3 工具包中加入全新成員「Gemma 3 270M」。這款僅有 2.7 億(270M)參數的極致輕量級模型,專為需要超高效率、低延遲以及資源受限的邊緣設備(On-device)運算場景所設計,為開發者在極端硬體限制下部署 AI 提供了全新的高效能選擇。
Google DeepMind 發表了 VaultGemma,這是全球首款從頭開始(from scratch)使用差分隱私(Differential Privacy, DP)技術訓練的高性能大語言模型。透過嚴格的數學隱私保證,VaultGemma 能有效防止訓練數據洩露與敏感資訊記憶,同時在多項基準測試中保持極高的實用性,為醫療、金融等高隱私需求領域帶來全新突破。
Hugging Face 正式推出 OpenEnv 計劃,旨在解決 AI Agent 在執行任務時面臨的環境不一致與安全隱憂。OpenEnv 提供了一個標準化、安全隔離的沙盒環境,讓 Agent 能安全地執行程式碼、操作檔案與進行網頁互動。此舉將促進開源社群在 Agent 評估與部署上的協作,共同打造更安全且一致的開放 Agent 生態系統。
Hugging Face 與知名安全平台 VirusTotal 展開合作,旨在提升開源 AI 生態系的安全性。雙方將針對託管在 Hugging Face 上的模型進行深度安全掃描,特別是防範利用 PyTorch pickle 格式等漏洞傳播的惡意代碼。此舉將幫助開發者更安全地下載與部署開源模型,降低供應鏈攻擊風險。
廣受開發者歡迎的開源嵌入向量庫 Sentence Transformers 宣布正式加入 Hugging Face。未來該專案將移至 Hugging Face 的 GitHub 組織下管理,獲得更多官方資源支持。這項合作將深化其與 Hugging Face Hub 的整合,提升模型託管、文檔與效能優化,為 RAG 與語意搜尋應用提供更穩定的開源基石。
Hugging Face 宣布為其試算表 AI 工具「AI Sheets」引入影像處理功能。使用者現在可以直接在試算表儲存格中插入影像,並調用各類視覺語言模型(VLM)進行批次處理,例如自動生成描述、提取文字(OCR)、進行圖像分類或物件偵測。這項更新大幅降低了非開發人員處理大量影像資料的門檻,將試算表的便利性與先進的電腦視覺技術完美結合。
Hugging Face 發表「Hugging Science」專題文章,探討 AI 在食物過敏領域的應用。內容涵蓋利用自然語言處理(NLP)解析複雜成分表、透過電腦視覺識別潛在過敏原食品,以及運用生物資訊模型預測新型蛋白質的致敏性。Hugging Face 呼籲社群共同開發開源數據集與模型,以提升過敏患者的生活品質與食品安全。
Google Cloud 與 Intel、Hugging Face 合作,在搭載第五代 Intel Xeon 處理器的 C4 實例上運行開源 GPT 模型。透過 Intel AMX 硬體加速與 Hugging Face Optimum 軟體優化,顯著提升推論效能。這項整合為企業帶來高達 70% 的總體擁有成本(TCO)改善,提供更具性價比的 CPU 推論選擇。
Hugging Face 介紹如何利用 OpenVINO 在 Intel CPU 上優化並運行視覺語言模型(VLM)。開發者只需透過安裝環境、轉換模型、執行推論三個簡單步驟,即可在無獨立顯卡的 Intel 硬體上實現高效的多模態處理,大幅降低 VLM 的本地部署門檻,非常適合邊緣運算與個人開發環境。
NVIDIA 推出「Nemotron-Personas-India」計畫,旨在解決印度多語言與多元文化訓練數據不足的問題。該項目利用 Nemotron 模型生成具備印度各省分、語言及文化背景的「合成角色(Personas)」數據。這項開源成果將助力印度推動「主權 AI(Sovereign AI)」,讓本土語言模型能更精準地理解在地脈絡。
Arm 宣佈將參與即將舉行的 PyTorch Conference。本次參展重點將聚焦於如何透過 Arm 架構優化 PyTorch 效能,包含針對伺服器端(如 AWS Graviton)與邊緣裝置(如 ExecuTorch)的加速方案。此外,Arm 也將展示其開源的 KleidiAI 函式庫如何與 PyTorch 深度整合,提升 AI 模型在 Arm 處理器上的執行效率。
Hugging Face 與 BigCode 合作推出全新評測平台「BigCodeArena」。該平台主打「端到端實際執行(Execution-based)」評測機制,將模型生成的程式碼置於安全沙盒中運行並進行單元測試。這解決了傳統「LLM 當裁判」或靜態分析無法驗證程式碼真實可用性的痛點,為開發者與研究人員提供更具公信力的 Code LLM 排行榜。
IBM 的最新一代開源 AI 模型 Granite 4.0 正式登陸 Replicate 平台。開發者現在無需自行維護基礎設施,即可透過 Replicate 的雲端 API 快速調用 Granite 4.0 模型。這款模型主打企業級應用,在程式碼生成、文本理解與安全合規上皆有出色表現,為開發者在尋求商用與開源模型時,提供更具性價比的新選擇。
Hugging Face 發表最新技術,展示如何在 Intel Core Ultra 平台上加速 Qwen3-8B Agent。該方法採用「深度剪枝(Depth-Pruning)」技術製作輕量化的草稿模型,並結合投機解碼(Speculative Decoding)技術。這使得在個人電腦(Edge AI)上運行複雜的 Agent 任務時,能獲得更高的 Token 生成效率與更低的延遲,為本地端 AI 應用帶來突破。
Hugging Face 發表 VibeGame 專案,深入探討「氛圍編碼(Vibe Coding)」在遊戲開發中的應用。創作者只需透過自然語言與 LLM 對話,無需手寫程式碼即可生成、修改並在 Hugging Face Spaces 上一鍵部署互動遊戲。這項探索展示了 AI 如何將開發重心從「語法除錯」轉移至「創意與玩法設計」,大幅降低遊戲創作門檻。
Hugging Face 發表 Smol2Operator,這是一套針對「電腦操作(Computer Use)」設計的後訓練 GUI 代理方案。基於輕量級視覺語言模型(如 SmolVLM),透過特定的監督微調(SFT)與強化學習,使其能精準識別螢幕元素並執行點擊、輸入等操作。此項目開源了模型權重與訓練方法,讓開發者能在消費級硬體上部署隱私安全、低延遲的本地 GUI 代理。
Replicate 發布影像編輯模型終極指南,系統性比較 Inpainting(區域重繪)、Instruct-based(指令編輯)與 ControlNet 等不同技術路徑。文章針對 FLUX.1-fill、Stable Diffusion XL、CosXL 等熱門模型進行實測,幫助開發者與設計師依據「精準度」、「操作難易度」與「影像保留度」選擇最適合的 AI 影像編輯工具。
ServiceNow AI 在 Hugging Face 發表了全新開源框架「SyGra」,旨在解決 LLM 與 SLM 訓練中高質量資料不足與成本高昂的痛點。該框架提供一站式的合成資料生成方案,結合了結構化控制與生成模型的優勢,能產生高多樣性、高精確度的訓練樣本。這對於需要微調特定領域小模型(SLM)的開發者與研究人員來說,是一個極具價值的工具。
Hugging Face 正式發表 Gaia2 基準測試與 ARE (Agent Run Environment) 框架。Gaia2 延續前代精神,設計了更複雜、防污染且貼近真實世界的多模態任務;而 ARE 則提供安全沙盒化的執行環境,解決了 Agent 測試中重現性低與安全風險的痛點。這套組合將大幅降低社群研究與評估 AI Agent 的門檻。
Hugging Face 宣布歐洲知名雲端服務商 Scaleway 正式加入其「推理提供商(Inference Providers)」生態系。開發者現在可以直接在 Hugging Face Hub 上,一鍵選擇 Scaleway 作為後端 API 來部署與運行開源 AI 模型。這項合作為重視數據隱私與歐盟 GDPR 合規性的企業與開發者,提供了更具性價比且符合法規的歐洲本土 GPU 推理新選擇。
Hugging Face 宣佈與 Public AI 合作,正式將其整合至「推理提供商(Inference Providers)」生態系中。開發者現在可以直接在 Hugging Face Hub 上,選擇由 Public AI 提供的無伺服器(Serverless)API 來運行 Llama、Mistral 等熱門開源模型。此舉不僅簡化了 AI 應用的部署流程,也為開發者在尋求高效能、低延遲且具成本效益的推理基礎設施時,提供了全新的選擇。
AI 模型託管平台 Replicate 宣布推出全新的搜尋 API。開發者現在不需透過網頁,即可直接使用 API 程式化搜尋平台上的數千個開源模型與主題合集(Collections)。這項更新大幅提升了動態整合模型的便利性,讓應用程式能根據需求自動尋找並調用最適合的 AI 模型。
Hugging Face 宣布推出 LeRobotDataset:v3.0,這是其開源機器人庫 LeRobot 的重大更新。新版本重新設計了數據集格式,旨在解決大規模機器人數據(如影像、關節狀態、動作)的儲存與 I/O 瓶頸。v3.0 提供了更高效的串流載入、統一的機器人本體架構 Schema,並無縫整合至 Hugging Face Hub,為訓練下一代具身智能(Embodied AI)奠定基礎。
Hugging Face 旗下的 Gradio 框架推出「視覺化浮水印」新功能。開發者現在能在部署圖像生成應用時,直接在輸出圖像上疊加自訂的浮水印或 Logo。這項更新不僅簡化了開發流程,更能有效保護創作者版權並防止 AI 內容被惡意濫用,是 AI 應用開發者必備的安全工具。
Vercel 宣布其 AI Gateway 已正式支援 Qwen3-Next 系列模型。開發者現在可以透過 Vercel 的統一 API 介面,輕鬆進行 Qwen3-Next 的呼叫、快取、流量限制與效能監控。這為建構多語言與開源 AI 應用的開發者提供了更具彈性且高效的基礎設施選擇。
Vercel 宣布推出「x402-mcp」,這是一個針對模型上下文協議(MCP)工具的開放式支付協議。該協議旨在解決 AI Agent 與工具互動時的付費與授權問題,靈感源自 HTTP 402(Payment Required)狀態碼。透過 x402-mcp,開發者可以更輕鬆地為其 MCP 工具整合計費與支付機制,促進 AI 工具生態系的商業化發展。
Vercel 宣布推出 402-mcp,在 Model Context Protocol (MCP) 中啟用 x402 付款機制。這允許 AI 代理(Agents)在調用 MCP 工具或數據時,直接透過 HTTP 402 進行自動化微付款,為 AI 代理經濟(Agentic Economy)奠定商業化基礎。
Enterprise AI 公司 Writer 在 Hugging Face 上推出了全新的「Palmyra-mini」模型系列。該系列主打輕量化與強大效能,並特別強調具備「推理(reasoning)」能力。這使得開發者能在資源受限的環境中,部署具備複雜邏輯思考與問題解決能力的 AI 模型,為邊緣運算與企業應用提供新選擇。