Vercel 宣布推出「x402-mcp」,這是一個針對模型上下文協議(MCP)工具的開放式支付協議。該協議旨在解決 AI Agent 與工具互動時的付費與授權問題,靈感源自 HTTP 402(Payment Required)狀態碼。透過 x402-mcp,開發者可以更輕鬆地為其 MCP 工具整合計費與支付機制,促進 AI 工具生態系的商業化發展。
Hugging Face 宣布與 Together AI 深度整合,推出全新微調解決方案。開發者現在可以直接從 Hugging Face Hub 選擇任何開源大語言模型,並利用 Together AI 的高效能 GPU 叢集與微調 API 進行訓練。此合作大幅簡化了微調的工作流程,免去繁瑣的硬體設定,並提供極具成本效益的無伺服器微調體驗。
Vercel 發表其「開放 SDK 策略」(Open SDK strategy),強調 Vercel AI SDK 的開放性與互操作性。該策略專注於提供跨模型供應商(如 OpenAI、Anthropic、Gemini)的統一 API,並支援多種前端框架與執行環境。透過社群驅動的 Provider 機制與標準化的工具調用(Tool Calling)及結構化輸出,Vercel 旨在降低 AI 應用的開發門檻,建立去中心化的 AI 開發生態系。
Vercel 推出全新開源工具 Streamdown,專為解決 AI 文本串流(Streaming)中的 Markdown 渲染痛點。傳統解析器在處理未完成的標記(如未閉合的粗體或程式碼區塊)時容易導致畫面閃爍或排版崩潰。Streamdown 透過漸進式解析技術,確保 AI 生成內容在傳輸過程中能平滑、無閃爍地即時呈現,極大提升了 AI 聊天介面的使用者體驗。
NVIDIA 在 Hugging Face 上正式發布了包含 600 萬個樣本的全新「多語言推理數據集」(Multi-Lingual Reasoning Dataset)。 該數據集旨在解決當前 AI 模型在非英語系語言中邏輯推理能力不足的痛點,提供大規模且高質量的訓練素材。 此開源資源將顯著降低開發多語言推理模型(如 Reasoning LLM)的門檻,對開源社群具有重要推動作用。
Replicate 宣布推出遠端 MCP(Model Context Protocol)伺服器,將其平台上的數萬個開源模型直接接入開發工作流。使用者現在無需離開編輯器或聊天介面,即可在 Claude Desktop、Cursor 和 VS Code 等工具中,直接搜尋、比較並執行 Replicate 上的模型。這項更新大幅簡化了開發者測試與整合各種開源 AI 模型(如 Llama、Flux 等)的流程,提升開發效率。
Hugging Face 官方宣布迎來 OpenAI 的全新開源模型家族「GPT OSS」。這項合作打破了 OpenAI 長期以來以閉源為主的策略,將其強大的 GPT 技術以開源形式提供給全球開發者。社群現在可以直接在 Hugging Face 上下載、微調並部署這些模型,預計將對開源 AI 生態系產生深遠的影響。
NVIDIA 在 Hugging Face 部落格分享了其開源且可移植的深度研究 Agent 成果。透過在 DeepResearch Bench 基準測試上評估開源的 Llama Nemotron 模型,該系統展現出極佳的研究與推理能力。此研究證明了開源模型在複雜、多步驟的研究任務中,已具備與閉源頂尖模型競爭的實力,為開發者提供了一個強大且可本地部署的 Deep Research 解決方案。
Vercel 官方宣布 2025 年夏季開源計畫(Open Source Program)的新一期梯隊(Summer cohort)。該計畫旨在透過提供 Vercel 的高效能託管、Pro 帳號權益及基礎設施資源,來支持全球優秀的開源專案。這對於尋求免費且強大託管資源的開源開發者與社群而言,是值得關注的資助管道。
Replicate 宣布上線全新開源影片生成模型 Wan 2.2。該模型被定位為目前平台上速度最快且成本最低的影片生成選擇,標誌著開源影片生成技術(Open Source Video)的重大進展。這項更新將大幅降低開發者與創作者生成高品質影片的門檻與運算成本。
Hugging Face 發表全新的輕量級開源實驗追蹤工具 Trackio。旨在解決現有 MLOps 工具過於臃腫的問題,Trackio 提供在地優先(Local-first)的架構與極簡 API,並能與 Hugging Face Hub 及 Transformers 生態系無縫整合。開發者只需幾行程式碼即可記錄參數、指標與模型權重,並能透過輕量網頁介面進行可視化,是 AI 研究者的全新輕量化選擇。
Vercel 宣布其 AI Gateway 正式支援最新一代的開源程式碼模型 Qwen3-Coder。開發者現在可以透過 Vercel AI Gateway 統一的 API 接口,進行 Qwen3-Coder 的調用、快取、速率限制與監控。這項更新為建構 AI 輔助編程應用的開發者提供了更具成本效益且高效的開源模型選擇。
Hugging Face 宣布與 NVIDIA 深度整合,推出支援多種 LLM 的 NVIDIA NIM(推理微服務)。開發者現在可以直接在 Hugging Face 平台上,利用經 TensorRT-LLM 優化的 NIM 容器,輕鬆部署 Llama、Mistral 等熱門開源模型,大幅提升推理吞吐量並降低延遲,簡化企業級 AI 應用的落地流程。
Hugging Face 宣布推出其 Model Context Protocol (MCP) 伺服器。這項工具讓支援 MCP 的 AI 客戶端(如 Claude Desktop、Cursor)能夠直接與 Hugging Face Hub 互動。使用者可以直接在對話中搜尋熱門模型、查詢資料集結構與讀取 Model Card,大幅簡化了 AI 開發者與研究人員的工作流程。
Hugging Face 宣布與 Featherless AI 合作,將其納入官方推理供應商(Inference Providers)名單。Featherless 專注於無冷啟動的無伺服器(Serverless)推理技術,能高效運行數千種開源與微調模型。開發者現在可以直接在 Hugging Face Hub 上,透過 Featherless 的高效能架構一鍵部署與調用各種利基型模型,大幅降低延遲與維運成本。
Hugging Face 發表了 nanoVLM 專案,旨在提供一個最簡單、無冗餘程式碼的純 PyTorch 框架,讓開發者與研究人員能輕鬆理解並動手訓練自己的視覺語言模型(VLM)。該專案仿照 nanoGPT 的極簡風格,去除了複雜的封裝,完整展示了從圖像編碼器、投影層到語言模型的整合與訓練流程,是學習與實驗 VLM 的絕佳起點。
Microsoft 與 Hugging Face 宣布深化合作,將 Hugging Face 的開源模型庫與 Azure AI Foundry(前身為 Azure AI Studio)進行深度整合。開發者現在可以直接在 Azure 安全且具備合規性的企業級環境中,輕鬆搜尋、部署與微調數十萬個 Hugging Face 的開源模型,大幅簡化企業導入開源 AI 的工作流程。
Hugging Face 針對其核心 `transformers` 函式庫進行重大架構更新,旨在標準化模型定義。過去為了易讀性而採用的「單一檔案政策」導致了嚴重的程式碼重複,難以進行全域優化。新標準化方案將引入模組化設計,統一常見組件(如 Attention、MLP),在保持可讀性的同時,大幅簡化新模型開發與硬體加速(如 Flash Attention)的整合。
Vercel 官方正式公布了 2025 年春季開源計畫(Open Source Program)的入選名單。該計畫旨在扶持推動 Web 開發、前端生態及 AI 應用的關鍵開源專案。入選專案將獲得 Vercel 提供的免費企業級託管服務、基礎設施支援以及社群推廣資源,幫助開發者專注於技術創新與社群建設。
Hugging Face 發布 2025 年視覺語言模型(VLM)趨勢報告。文章深入探討 VLM 在「更強(推理與 OCR)」、「更快(輕量化與推論優化)」與「更實用(多模態 Agent)」三大維度的演進。推薦了 Qwen2.5-VL、Llama-3.2-Vision 等主流開源模型,並介紹如何利用 Hugging Face 生態系進行高效部署與微調。
Hugging Face 旗下的開源機器人專案 LeRobot 致力於解決機器人領域缺乏標準化、大規模資料集的問題。本文探討如何透過社群協作,建立類似於電腦視覺界「ImageNet」的機器人資料集。文章介紹了 LeRobot 的資料格式標準、社群貢獻機制,以及如何克服硬體多樣性帶來的數據整合挑戰。
OpenAI 正式發表新一代推理模型 o3 與 o4-mini,強調透過 10 倍強化學習(RL)算力提升推理效率。o4-mini 不僅價格更便宜,在多項指標、視覺與工具調用能力上皆有顯著進步。此外,OpenAI 還驚喜推出了完全開源的終端機 AI 工具 Codex CLI,直接對標 Anthropic 的 Claude Code。
Hugging Face 與 AI 安全公司 Protect AI 合作滿六個月,宣布已完成平台上 400 萬個開源模型的安全掃描。此項合作旨在解決開源模型(特別是含有 pickle 反序列化風險的舊格式)中潛在的惡意代碼與安全漏洞。透過自動化安全掃描與漏洞標記,雙方共同為全球開發者建構更安全、更值得信賴的 AI 供應鏈生態。
巴塞隆納超級電腦中心(BSC-LT)正式發布 Visual Salamandra 7B 多模態模型。該模型以其自主研發的 Salamandra 7B 語言模型為基礎,融合了先進的視覺編碼器,旨在提升圖像理解、視覺問答及 OCR 能力。特別的是,它承襲了 Salamandra 家族在西班牙語、加泰隆尼亞語等多語言環境下的優異表現,為開源多模態社群注入新選擇。
Sam Altman 宣傳了 ChatGPT 的「記憶(Memory)」功能更新,同時市場傳出 o3、o4-mini 即將推出,以及 GPT-4o 將升級為 GPT-4.1 的洩露消息。 xAI 正式推出 Grok 3 與 Grok 3 mini 的 API,Epoch AI 曾短暫證實其具備 o1 等級的推理能力。 社群方面,Qwen3 宣布延期推出,而 AI Engineer World's Fair 2025 也正展開熱烈徵稿。
Together 與 Agentica Project(曾推出 DeepScaleR)聯合發表了全新 14B 程式碼推理模型「DeepCoder」。該模型完全開源,並採用 GPRO+(Group Relative Policy Optimization+)強化學習技術。在多項程式碼基準測試中,DeepCoder 展現出媲美 OpenAI o3-mini 的強大實力,是開源 AI 推理領域的重大突破。
Meta 正式於 Hugging Face 平台上架了備受矚目的 Llama 4 家族首批模型:Maverick 與 Scout。這標誌著開源大語言模型正式邁入 Llama 4 時代。雖然詳細技術細節仍待官方完整白皮書披露,但從命名來看,Scout 預期為輕量、高效率的「偵察型」模型,適合邊緣運算與 Agent 任務;而 Maverick 則可能是主打強大推理與複雜任務處理的「王牌」模型。這兩款模型的釋出將為開源社群注入全新動力。
Hugging Face 發表文章慶祝旗下開源機器學習網頁介面庫 Gradio 的使用者正式突破 100 萬人。文章回顧了 Gradio 自創立以來的成長軌跡,如何透過極簡的 Python 程式碼讓開發者快速部署 AI 互動 Demo,並探討其在 Hugging Face 生態系中扮演的關鍵角色與未來展望。
Hugging Face 針對美國白宮的 AI 行動計畫徵求意見稿(RFI)提交了官方回應。其核心訴求圍繞在保護與推廣「開源 AI」與「開放科學」。Hugging Face 強調,開放源碼不僅能加速技術創新、防止科技巨頭壟斷,更能透過社群的集體審查提升 AI 的安全性與透明度,呼籲政府在制定政策時應避免扼殺開源生態。
Cohere For AI 發表全新開源多語言多模態模型「Aya Vision」(提供 8B 與 32B 版本)。該模型旨在解決現有視覺語言模型(VLM)嚴重偏向英語的問題,大幅提升了對全球多種語言(特別是低資源語言)的圖像理解與文字生成能力。在多項多語言多模態基準測試中,Aya Vision 展現出超越同量級開源模型的優異性能,並已於 Hugging Face 平台上開源。