Vercel 宣布其 AI Gateway 已正式支援 Qwen3-Next 系列模型。開發者現在可以透過 Vercel 的統一 API 介面,輕鬆進行 Qwen3-Next 的呼叫、快取、流量限制與效能監控。這為建構多語言與開源 AI 應用的開發者提供了更具彈性且高效的基礎設施選擇。
Vercel 宣布推出「x402-mcp」,這是一個針對模型上下文協議(MCP)工具的開放式支付協議。該協議旨在解決 AI Agent 與工具互動時的付費與授權問題,靈感源自 HTTP 402(Payment Required)狀態碼。透過 x402-mcp,開發者可以更輕鬆地為其 MCP 工具整合計費與支付機制,促進 AI 工具生態系的商業化發展。
Vercel 更新了其命令列工具(CLI)的登入流程。新流程旨在簡化開發者在終端機進行身分驗證的步驟,提供更流暢、直覺且安全的登入體驗。這項更新將減少手動操作,讓開發者能更快速地連結 Vercel 帳戶並部署專案。
Vercel 宣布推出 402-mcp,在 Model Context Protocol (MCP) 中啟用 x402 付款機制。這允許 AI 代理(Agents)在調用 MCP 工具或數據時,直接透過 HTTP 402 進行自動化微付款,為 AI 代理經濟(Agentic Economy)奠定商業化基礎。
知名 AI 學者 Ethan Mollick 提出「與魔法師共事」的隱喻,指出當前 AI 並非傳統軟體,而是具備強大卻不穩定能力的魔法師。在「參差不齊的技術前沿(Jagged Frontier)」上,AI 可能在困難任務上表現驚人,卻在簡單任務上出錯。人類必須學會扮演「驗證者」,透過深度整合(如半人馬或賽博格模式)來駕馭這股魔法般的技術。
Enterprise AI 公司 Writer 在 Hugging Face 上推出了全新的「Palmyra-mini」模型系列。該系列主打輕量化與強大效能,並特別強調具備「推理(reasoning)」能力。這使得開發者能在資源受限的環境中,部署具備複雜邏輯思考與問題解決能力的 AI 模型,為邊緣運算與企業應用提供新選擇。
Vercel 宣布其 AI Gateway 正式支援 LongCat-Flash Chat 模型。 開發者現在可以透過 Vercel AI Gateway 統一的 API 介面,輕鬆整合並調用此模型。 這項更新將使開發者能利用 Vercel 的快取、速率限制與監控功能,來優化 LongCat-Flash Chat 的部署與使用體驗。
Hugging Face 官方解析了 OpenAI 最新開源項目 `gpt-oss` 的核心加速技術,並教導開發者如何將這些優化手段移植到現有的 `transformers` 庫中。重點技巧包含:利用 `torch.compile` 配合「靜態 KV 快取」消除 Python 執行期開銷、引入「投機性解碼」實現多倍速生成,以及透過 FP8/INT4 量化與 Triton 自訂核心緩解記憶體頻寬瓶頸。這些方法能讓開發者在不犧牲精度的情況下,極大化 GPU 的推論效率。
Hugging Face 宣布與 Together AI 深度整合,推出全新微調解決方案。開發者現在可以直接從 Hugging Face Hub 選擇任何開源大語言模型,並利用 Together AI 的高效能 GPU 叢集與微調 API 進行訓練。此合作大幅簡化了微調的工作流程,免去繁瑣的硬體設定,並提供極具成本效益的無伺服器微調體驗。
Vercel 宣布 MongoDB Atlas 正式加入 Vercel Marketplace。這項整合讓開發者能夠直接在 Vercel 平台中建立、配置和管理 MongoDB Atlas 資料庫,簡化了無伺服器(Serverless)應用的資料庫設定流程。透過統一的帳單與自動配置的環境變數,開發者能更專注於產品開發,提升 Next.js 等專案的部署效率。
Vercel 宣布 ChatGPT 正式支援其 Model Context Protocol (MCP) 伺服器。開發者現在可以授權 ChatGPT 存取 Vercel 的專案數據,直接在對話視窗中查詢部署狀態、讀取日誌或觸發重新部署。這項整合簡化了開發工作流,讓 AI 助理化身為雲端運維助手,提升開發與部署效率。
Vercel 官方更新指出,Vercel Sandbox 的最大持續執行時間已延長至 5 小時。這項更新解決了過去因執行時間限制而無法進行長時間運算的問題。對於需要執行複雜程式碼、長時間背景任務,或是建構需要持續運作之 AI Agent 的開發者而言,這是一項極具實用性的重大升級。
Vercel 宣布熱門的雲端資料庫 MongoDB Atlas 正式上架其 Marketplace。開發者現在可以直接在 Vercel 控制台內完成 MongoDB Atlas 的佈署、環境變數設定與單一帳單管理。此整合大幅簡化了全端應用的開發流程,讓前端與資料庫的連接更加無縫。
Hugging Face 發表 Jupyter Agents 研究,專注於訓練大型語言模型(LLM)在 Jupyter Notebook 環境中進行推理。透過整合程式碼執行反饋(REPL),模型能像人類資料科學家一樣,一邊執行程式碼、一邊根據錯誤訊息進行自我修正。此方法顯著提升了開源模型在數學、科學及程式設計等複雜任務上的表現。
Vercel 宣布 Pro 方案現在提供免費的「Viewer(僅限檢視)」席位。這項更新讓團隊在不增加額外成本的情況下,邀請設計師、產品經理或客戶加入專案,共同查看部署預覽與進行協作,大幅降低了跨部門溝通的門檻與團隊訂閱成本。
Vercel 官方 Changelog 宣布,即日起預設啟用「隨選並行建置(On-demand concurrent builds)」。過去當多個專案或 commit 同時觸發部署時,常需在佇列中排隊等待。新功能上線後,系統將自動隨選並行處理所有建置,徹底消除建置排隊的痛點,顯著提升開發團隊的 CI/CD 效率。
Vercel 調整了 Pro 方案的資源使用模式,將原本各項服務(如頻寬、Serverless 函式、圖片優化等)的獨立固定配額,統一改為「點數制(Credit-based)」。用戶不再受限於單一資源的硬性上限,而是能根據實際需求,彈性地將點數分配給最需要的服務,有效避免資源浪費並簡化帳單管理。
Vercel 官方宣布,其 Pro(專業版)方案現在將預設啟用「消費管理」(Spend Management)功能。此項重大更新旨在幫助開發者與企業團隊更輕鬆地監控雲端託管支出,有效避免因惡意流量攻擊、爬蟲或程式無窮迴圈所導致的意外高額帳單。用戶可以自由設定每月的預算上限,並在費用達到特定閾值時,自動觸發電子郵件警報或採取暫停 Serverless 服務等主動防護措施。
Vercel 發表了針對 Pro 方案的全新調整,主打「更具彈性」以符合現代團隊的需求。過去 Vercel 的 Pro 方案常因固定人頭計費或資源限制,讓中小型團隊在跨部門協作時面臨成本抉擇。本次調整預期將優化團隊成員權限管理、調整資源用量彈性,並降低非開發人員(如設計師、PM)參與專案的門檻,協助團隊更無縫地進行 Preview 部署與協作。
Vercel 宣布將 HIPAA 商業夥伴協定(BAA)的簽署權限開放給 Pro 團隊。過去此合規授權僅限 Enterprise 企業級客戶,此舉大幅降低了醫療、生技與數位健康領域新創在 Vercel 部署合規應用的門檻與成本,讓中小團隊能以更低預算建構安全的醫療科技產品。
Vercel 指出 Model Context Protocol (MCP) 正進入第二階段。第一階段是將現有工具連接至 LLM,而第二階段則是「為 LLM 量身打造 API」。開發者不再只是暴露傳統的 REST 接口,而是需要設計具備豐富語意描述、適合 Agent 推理與執行的 MCP 服務。這將徹底改變未來軟體架構與 API 開發的思維。
Hugging Face 與社群合作推出 mmBERT,這是基於 ModernBERT 架構的多語言版本。mmBERT 繼承了 ModernBERT 的現代化改進(如 FlashAttention、RoPE 與 8192 token 長文本支持),旨在取代傳統的 mBERT 與 XLM-RoBERTa。它能顯著提升多語言文本分類、命名實體識別(NER)及檢索(RAG)等任務的運算效率,為開發者提供更強大且省資源的開源選擇。
Vercel 宣布其 Serverless Functions 正式支援優雅停機(Graceful Shutdown)功能。當函數實例即將被銷毀或重置時,系統會發送訊號,讓開發者有時間關閉資料庫連線、將剩餘日誌寫入外部服務,並安全地結束進行中的任務。這項更新將大幅提升生產環境應用的穩定性並減少資源殘留。
Vercel 宣布其 AI 前端生成工具 v0 的構建流程迎來重大優化,套件安裝速度提升了約 70%。這項改進將顯著縮短用戶在 v0 中生成、修改和預覽網頁介面時的等待時間,讓 AI 輔助開發的即時反饋循環變得更加流暢與高效。
Vercel 宣布推出新功能,允許團隊管理員跨多個專案批次啟用「隨選並行建置(On-Demand Concurrent Builds)」。以往管理員必須逐一進入各個專案進行設定,現在則可在團隊設定中一次套用至多個專案。這項更新能有效避免多專案同時部署時的建置排隊問題,並大幅降低大型團隊的管理成本。
Vercel 宣布將 AI SDK 與 AI Gateway 整合至 GitHub Actions。開發者現在可以在 CI/CD 自動化流程中,直接利用 AI SDK 進行自動化測試、模型評估(Evals)或 PR 審查,並透過 AI Gateway 進行 API 呼叫的快取、監控與成本控制,有效降低 CI 期間的 LLM 呼叫成本並提升穩定性。
Vercel 於 2025 年 9 月 8 日發布緊急公告,針對一起重大的 npm 供應鏈攻擊事件做出回應。該事件影響了多個前端專案常用的 npm 套件,Vercel 已在平台端採取防護措施,並強烈建議開發者立即審查專案的 package-lock.json、更新受影響的依賴項,並啟用安全監控工具以確保部署安全。
Vercel 推出 Streamdown 2.2 更新,這款專為 Markdown 串流設計的工具現在支援「動畫式串流」,讓 AI 生成內容的呈現更加平滑自然。此外,新版本也優化了對自訂 HTML 的支援,讓開發者在構建 AI 聊天界面時能更彈性地嵌入自訂樣式與結構,顯著提升前端使用者體驗。
PyTorch 的 torch.compile 能顯著提升模型推論速度,但首次編譯的「冷啟動」時間往往令人頭痛。Replicate 介紹了如何透過快取(Caching)編譯後的模型成品,避免每次容器啟動時重複編譯。這項技術能有效縮短伺服器無預載(Serverless)部署時的啟動延遲,讓開發者在享受高效能推論的同時,也能擁有極速的部署與反應時間。
Vercel 宣布擴展其數據匯出(Drains)功能,用戶現在不僅能匯出日誌,還能將 OpenTelemetry Trace、Web Analytics 互動事件以及 Speed Insights(如 Core Web Vitals)等關鍵數據,即時傳送至任何自訂目的地或第三方觀測工具(如 Datadog、Axiom 等)。這項更新讓開發團隊能更輕鬆地集中管理應用程式的效能與用戶行為數據,擺脫單一平台的限制。