Vercel announced that Qwen 3.7 Plus is now available through AI Gateway. The provided source contains only the headline, so supported features, pricing, limits, and performance details cannot be confirmed. Developers using Vercel AI Gateway can consider adding the model to their evaluation list and verify its documented API capabilities before adoption.
AI infrastructure startups Fireworks and Baseten have reportedly reached massive valuations, reflecting intense investor interest in developer-focused inference and deployment platforms. OpenRouter, the popular LLM API aggregator, is also on a rapid growth trajectory. This funding wave highlights a major capital shift toward cost-effective, developer-friendly API and hosting solutions.
Google 在 I/O 大會上正式推出 Gemini 3.5 Flash,跳過預覽版直接進入一般可用階段,並將全面導入 Google 搜尋、Gemini App 及開發者平台。然而,新模型的 API 價格大幅上漲,輸入與輸出費用分別為每百萬代幣 1.5 美元與 9 美元,是前代 Flash 預覽版的 3 倍,顯示出各大 AI 廠商正開始測試市場對高定價的接受度。
Vercel 宣布其 AI Gateway 正式支援 Opus 4.7 模型的「快速模式」(Fast Mode)。此功能旨在為開發者提供更低的 API 延遲與更快的響應速度,非常適合需要即時互動的 AI 應用場景。開發者現在可以透過 Vercel AI Gateway 輕鬆啟用此模式,在維持 Opus 4.7 強大推理能力的同時,顯著提升終端用戶的使用體驗。
OpenAI 推出全新一代即時語音與音訊 API,包含 GPT-Realtime-2、GPT-Translate 以及 GPT-Whisper。這些 API 將 GPT-5 的強大能力導入語音領域,提供全新業界領先(SOTA)的即時語音互動、多語言翻譯與語音識別效能,展現了 OpenAI 將 GPT-5 架構全面鋪設至各類應用場景的野心。
Hugging Face 宣布將知名低成本、高效能的推理平台 DeepInfra 整合至其「推理服務商(Inference Providers)」計畫中。現在,開發者在 Hugging Face Hub 上瀏覽開源模型(如 Llama 3、Mistral 等)時,可以直接選擇 DeepInfra 作為後端託管 API,無需自行架設 GPU 基礎設施。這項合作為開發者提供了更多元、更具性價比的無伺服器(Serverless)推理選擇,進一步簡化了 AI 應用的部署流程。
Vercel 於 Changelog 宣布其 AI Gateway 服務已全面支援 OpenAI 的 GPT 5.5 模型。開發者現在可以透過 Vercel 的統一 API 介面輕鬆調用 GPT 5.5,並享有邊緣快取、速率限制、自動重試以及即時監控等功能。這項更新將大幅降低開發者在構建基於 GPT 5.5 應用時的基礎設施管理成本與延遲。
Vercel 宣布其 AI Gateway 正式支援 Anthropic 的最新旗艦模型 Claude 4.7 Opus。開發者現在可以透過 Vercel 的統一 API 網關輕鬆調用此模型,並享有內建的邊緣快取、速率限制、彈性重試以及詳細的用量分析功能。這項更新將大幅降低開發者在構建高效能、高可靠性 AI 應用程式時的基礎設施管理成本。
Hugging Face 旗下的 Gradio 宣布重大更新,允許開發者將 Gradio 單獨作為後端服務(Gradio Server)。開發者將不再受限於 Gradio 預設的 UI 組件,可自由使用 React、Vue、Svelte 或原生 JS 打造完全客製化的前端,同時保留 Gradio 內建的狀態管理、請求佇列、串流(Streaming)等強大後端優勢,大幅提升 AI 應用的開發彈性。
Vercel AI SDK 正式加入 WhatsApp 轉接器(Adapter)支援。這項更新讓開發者能利用 Vercel AI SDK 的統一 API,快速將 AI 模型(如 GPT、Claude 等)與 WhatsApp Business API 對接。開發者無需自行處理繁瑣的通訊協定轉換,即可輕鬆打造具備對話能力的 WhatsApp AI 助理與客服機器人。
Vercel 於 Changelog 宣布其 AI Gateway 已正式支援 xAI 的 Grok 4.20 模型。開發者現在可以透過統一的 API 介面調用 Grok 4.20,並直接享用 Vercel 提供的彈性快取、速率限制與調用分析等生產級功能,大幅簡化了將 Grok 模型整合至 Web 應用的流程。
Vercel 宣布其 AI Gateway 已正式支援 OpenAI 的 Responses API。這項更新讓開發者在使用 OpenAI 最新一代的統一響應接口(處理多模態與推理模型)時,能同樣享有 Vercel AI Gateway 提供的效能監控、邊緣快取、自動重試與速率限制等功能。這對於正在將應用程式過渡到 OpenAI 新 API 架構的開發者來說,是一項重要的基礎設施升級。
Vercel 旗下熱門 AI 開發工具 v0 的 API 迎來重大更新,正式支援自訂 Model Context Protocol (MCP) 伺服器。開發者現在可以將自訂的 MCP 伺服器與 v0 API 串接,讓 v0 在生成程式碼或解答問題時,能夠安全地存取企業內部資料庫、私有 API 或本地檔案。這項更新大幅提升了 v0 在特定業務場景下的實用性與上下文理解能力。
Vercel 於 Changelog 宣布,其 AI Gateway 服務已正式支援 GPT 5.3 Chat 模型。開發者現在可以透過 Vercel AI Gateway 輕鬆管理、快取、監控並限制對 GPT 5.3 Chat 的 API 請求,簡化了將最新一代 OpenAI 模型整合至 Web 應用程式的流程,並提升了效能與成本控制能力。
Vercel 宣布其 AI Gateway 正式整合 Kling 影片生成模型。 開發者現在可以透過 Vercel 的統一接口,輕鬆調用 Kling 的高品質影片生成能力。 此更新帶來了 AI Gateway 的核心優勢,包括請求監控、快取、重試機制與速率限制,大幅簡化了 AI 影片應用的開發流程。
Vercel 宣布推出全新 API 功能,讓企業與開發團隊能直接透過 API 讀取帳單使用量與成本數據。此更新解決了過去需要手動查看儀表板的痛點,開發者現在可以將這些數據整合至內部的監控系統、Slack 警報或自訂的財務報表中,實現更精細的雲端成本控制(FinOps)與自動化預算管理。
Vercel 宣布其 AI Gateway 服務正式支援開源影片生成模型 Wan。這項更新讓開發者能夠透過 Vercel 的統一 API 閘道,輕鬆調用、快取、限制速率並監控 Wan 模型的影片生成請求,大幅降低了在 Web 應用中整合先進開源影片生成技術的門檻與運維成本。
Vercel 宣布其 AI Gateway 已正式支援 Anthropic 的 Claude Opus 4.6 模型。開發者現在可以透過 Vercel 的統一 API 介面調用此旗艦模型,並享有 AI Gateway 提供的自動重試、快取、監控與成本控制等企業級功能。這簡化了多模型架構的部署流程,並提升了應用的可靠性。
Vercel 推出全新的 `vercel api` 命令行指令,旨在簡化開發者與 Vercel REST API 的互動。透過此指令,開發者可以直接利用 CLI 已登入的憑證進行驗證,免去手動管理 API Token 的繁瑣步驟。這項更新將大幅提升自動化腳本編寫、CI/CD 整合以及日常資源管理的效率。
Vercel 官方發布「Agent Skills」常見問答指南,解析如何定義與部署 AI 代理的「技能」(即工具呼叫)。透過 Vercel AI SDK,開發者能使用 Zod 定義 Schema,並在 Serverless 或 Edge 環境安全執行。本文涵蓋技能的運作原理、安全性設計以及如何結合 Generative UI 提升使用者體驗。
Vercel AI Gateway 正式支援 OpenResponses API 標準。這項更新允許開發者將符合該 API 規範的 AI 請求透過 Vercel Gateway 進行路由,從而輕鬆獲得自動重試、邊緣快取、速率限制(Rate Limiting)以及詳細的用量分析。這對於使用開源模型或自託管 LLM 的開發者來說,能大幅簡化多模型管理與效能優化的流程。
Vercel 宣布其 AI Gateway 現在支援將 Perplexity Web Search 整合至任何模型中。開發者不再受限於特定模型,即可在 API 呼叫中無縫加入即時網頁搜尋結果作為上下文。這項更新大幅簡化了 RAG(檢索增強生成)與即時搜尋應用的實作流程,提升了應用的資訊時效性。
Google DeepMind 宣布推出改進後的 Gemini 音訊模型,專為即時語音體驗進行優化。新模型採用原生多模態架構,無需經過「語音轉文字」的中介步驟,即可直接理解並生成語音,大幅降低延遲。這項升級將賦予開發者構建更具情感表現力、反應更迅速的語音助理與互動應用的能力,並已陸續在 Google AI Studio 與 Vertex AI 上線。
AI 雲端部署平台 Replicate 宣布支援全新 FLUX.2 模型。FLUX.2 帶來了專業級的圖像生成與編輯能力,具備前所未有的細節表現力,並新增了強大的「多重參考(multi-reference)」支援。此更新為企業與開發者提供更高效率的圖像生成解決方案,可直接透過 API 輕鬆整合。
Vercel 宣布在其 AI Gateway 中免費提供 MiniMax M2 模型的支援。開發者現在可以透過 Vercel 的統一 API 介面,免費呼叫 MiniMax M2 進行開發與測試。這項整合讓開發者能同時享有 Vercel AI Gateway 提供的效能監控、自動重試與邊緣快取等強大功能,大幅降低了多模型應用的開發與營運門檻。
Google DeepMind 發表全新的 Gemini 2.5 Computer Use 專用模型,目前已透過 API 提供預覽。該模型基於 Gemini 2.5 Pro 的強大能力進行微調,旨在賦能 AI 代理(Agents)直接與作業系統及應用程式的用戶介面(UI)進行互動。這項技術將加速自動化工作流程的開發,讓 AI 能夠像人類一樣執行點擊、輸入和導覽等電腦操作。
Vercel 發表全新的網域註冊商 API (Domains Registrar API),讓開發者能直接透過 API 進行網域搜尋、獲取即時定價、執行購買以及進行後續管理。這項新功能非常適合需要為其用戶提供自訂網域購買流程的 SaaS 平台或建站工具,能大幅簡化網域整合的開發工作。
IBM 的最新一代開源 AI 模型 Granite 4.0 正式登陸 Replicate 平台。開發者現在無需自行維護基礎設施,即可透過 Replicate 的雲端 API 快速調用 Granite 4.0 模型。這款模型主打企業級應用,在程式碼生成、文本理解與安全合規上皆有出色表現,為開發者在尋求商用與開源模型時,提供更具性價比的新選擇。
Vercel 於 Observability 觀測功能中新增了對外部 API 請求的查詢支援。開發者現在可以輕鬆追蹤、過濾並分析從 Vercel 部署的應用程式發往第三方服務(如 AI API、資料庫或外部 SaaS)的 HTTP 請求。這項更新有助於快速定位外部依賴造成的效能瓶頸與連線錯誤。
AI 模型託管平台 Replicate 宣布推出全新的搜尋 API。開發者現在不需透過網頁,即可直接使用 API 程式化搜尋平台上的數千個開源模型與主題合集(Collections)。這項更新大幅提升了動態整合模型的便利性,讓應用程式能根據需求自動尋找並調用最適合的 AI 模型。