NVIDIA 宣布將其輕量級視覺語言模型 Llama Nemotron Nano VLM 上架至 Hugging Face Hub。該模型結合了 Llama 架構與 NVIDIA 的 Nemotron 優化技術,專為邊緣運算與本機端部署設計。它能在低資源設備上高效執行圖像理解、視覺問答(VQA)與 OCR 等任務,為開發者提供更便利的開源多模態選擇。
Vercel 年度盛會 Ship 2025 發表多項重大更新,全面加速 AI 應用的開發與部署。本次焦點包含 v0 從 UI 生成演進為全端應用構建助手、Vercel AI SDK 針對 AI Agent 工作流的深度優化,以及 Next.js 基礎設施的效能提升。Vercel 展現了其從託管平台轉型為 AI 時代開發樞紐的野心。
Vercel 宣布推出針對「網域管理」的全新 Webhook 事件。這項更新讓開發者能夠在網域建立、配置或狀態變更時,即時接收通知並觸發自訂的後端流程。這對於構建需要動態自訂網域功能的 SaaS 應用程式或多租戶平台的開發者來說,是一項極具價值的自動化升級。
Google 最新推出的 Gemma 3n 模型系列已正式在 Hugging Face 開源社群全面上線。此版本針對端側部署(On-device)與高效能推論進行優化,Hugging Face 生態系已提供完整支援。開發者現在可以無縫使用 Transformers、vLLM、TRL 等工具進行部署、推論與微調,為輕量級與邊緣運算 AI 應用提供了全新的強大選擇。
Google DeepMind 發表全新 DNA 序列統一模型「AlphaGenome」,旨在深化人類對基因組功能的理解。該模型顯著提升了「調控變異效應(regulatory variant-effect)」的預測精準度,有助於疾病研究與基因療法開發。目前 AlphaGenome 已正式透過 API 開放給全球研究人員使用。
Vercel 宣布其機器人識別服務「Vercel BotID」正式進入全面開放(GA)階段。此功能運作於 Vercel 邊緣網路,能自動分析並分類傳入的請求,精準識別出 AI 訓練爬蟲、搜尋引擎、社交媒體抓取工具及惡意機器人。開發者可藉此在邊緣端直接阻擋未授權的 AI 爬蟲以保護原創內容,並有效降低無伺服器運算成本。
Vercel 宣布「滾動發布 (Rolling Releases)」功能正式進入一般可用性 (GA) 階段。此功能允許開發者在部署新版本時,逐步將流量從舊版本轉移到新版本,避免瞬間流量切換帶來的系統衝擊。這能有效降低生產環境的部署風險,並在偵測到異常時實現快速且無感的自動回滾。
Vercel 宣布針對其 Fluid Compute 運算服務推出全新的「活動 CPU (Active CPU)」計費機制。過去伺服器端運算通常依據整體的執行時間計費,而新機制讓用戶只需為 CPU 實際執行任務的時間付費。這項改變能有效避免因等待外部 API 或處於閒置狀態而產生的不必要開銷,為運行動態網站與 API 的開發者省下顯著的雲端成本。
Vercel 發表全新安全防護功能「BotID」,專為 API、登入及結帳等關鍵路由設計。該功能採用「無感(invisible)」過濾技術,無需傳統 CAPTCHA 驗證碼即可在背景識別並阻擋惡意機器人,有效防範爬蟲與濫用,同時維持流暢的用戶體驗。
Vercel 官方 Changelog 宣布「Vercel Agent」正式進入限量測試(Limited Beta)階段。這項新功能預期將與 Vercel AI SDK 及 v0 深度整合,協助全端開發者更輕鬆地在 Serverless 環境中部署、管理與運行具備長期執行與狀態保存能力的 AI Agent 應用。
Vercel 宣布其全新消息佇列服務「Vercel Queues」正式進入限量 Beta 測試階段。此服務旨在簡化 Serverless 環境下的非同步任務處理,讓開發者無需自行架設與維護複雜的 Message Queue 基礎設施,即可輕鬆實現背景作業、任務重試與流量削峰,提升應用程式的可靠性。
Vercel 宣布推出 Vercel Sandbox,這是一項專為安全執行不可信程式碼而設計的新功能。它提供輕量且高度隔離的沙箱環境,非常適合用於 AI Code Interpreter(程式碼口譯器)、線上程式碼編輯器或執行使用者自訂腳本。此功能與 Vercel 生態系深度整合,能有效防範惡意程式碼對系統造成的安全威脅。
Vercel 宣布為其 Fluid Compute 服務引進「活躍 CPU(Active CPU)」計費模式。此模式改變了傳統 Serverless 按整體執行時間計費的缺點,讓開發者只需為 CPU 實際進行運算的毫秒數付費。這對於需要長時間等待外部 API(如 LLM 串流回應)或進行 I/O 密集型操作的現代 AI 應用來說,能顯著降低託管成本。
Vercel 針對採用 Fluid compute 的 Vercel Functions 推出升級,調高了預設的資源配置與上限額度。這項更新讓開發者在部署無伺服器(Serverless)應用時,能獲得更高的記憶體、執行時間等運算資源,特別有利於需要高運算能力的 AI 應用或複雜的後端邏輯,且無需繁瑣的手動配置。
Vercel 正式推出 Vercel Microfrontends 限量測試版(Limited Beta)。此功能旨在解決大型前端專案的協作與部署痛點,允許團隊將單一大型應用拆分為多個獨立開發、測試與部署的微前端模組。透過 Vercel 的基礎設施,開發者能實現無縫的路由整合與高效的獨立部署,提升大型團隊的開發效率。
Vercel 宣布其 AI Gateway 服務正式進入 Beta 測試階段。此工具旨在簡化開發者整合多個 LLM 供應商的流程,提供統一的 API 接口。AI Gateway 具備邊緣快取(Edge Caching)、速率限制(Rate Limiting)、即時分析與自動重試等功能,能有效降低 AI 應用的延遲與 API 呼叫成本,並提升系統的穩定性。
Vercel 宣布其 Edge Middleware 與 Edge Functions 正式改由統一的 Vercel Functions 基礎設施驅動。此舉消除了過去 Serverless 與 Edge 運作環境之間的設定隔閡,為開發者提供單一且一致的開發、監控與計費體驗,大幅提升 Vercel 平台的整體開發效能。
Google DeepMind 宣布推出「Gemini Robotics On-Device」模型。這是一款專為本地(裝置端)運作設計的高效機器人 AI 模型,旨在賦予機器人通用的靈巧操作能力(general-purpose dexterity),並能針對新任務進行快速適應(fast task adaptation),大幅提升邊緣端機器人的自主與反應能力。
全球傳播巨擘 WPP 宣布與前端平台 Vercel 展開合作,旨在將 AI 技術深度整合至廣告與行銷的創意流程中。雙方將結合 Vercel 的 AI SDK 與 v0 等工具,協助 WPP 的創意與開發團隊快速構建、測試並部署 AI 驅動的數位體驗。此合作將大幅縮短從創意發想到網頁上線的時間,為客戶提供更具個人化與互動性的行銷解決方案。
Vercel 宣布推出「手動清除 CDN 快取(Manually purge the CDN cache)」功能。過去開發者若要更新快取內容,通常需要等待 TTL 到期或重新進行專案部署。現在,開發者可以直接透過 Vercel Dashboard 或 API,針對特定路徑或全站即時清除邊緣網路(Edge Network)上的快取。這項更新大幅提升了內容更新的靈活性,特別適合需要即時修正錯誤資訊、更新靜態生成(SSG/ISR)頁面或即時發布新內容的開發場景。
Vercel 宣布推出 Vercel Blob CLI,讓開發者能直接透過命令列介面管理物件儲存。此工具支援檔案上傳、下載、刪除與列表等基本操作,大幅簡化了開發階段的檔案管理流程。對於需要將檔案管理整合至 CI/CD 自動化流程或進行批次處理的開發者而言,這是一項極具實用性的更新。
知名 AI 學者 Ethan Mollick 整理了最新的 AI 實用指南,解答「該用哪款 AI」與「如何使用」的核心問題。他強調應直接使用最頂尖的 Frontier Models(如 GPT、Claude、Gemini),並將 AI 視為「聰明但缺乏常識的實習生」。指南涵蓋日常寫作、程式開發、資料搜尋與多媒體生成等四大領域的推薦工具與實戰心法。
前端與 AI 部署平台 Vercel 宣布 Keith Messick 正式加入並擔任首席行銷長(CMO)。Messick 過去曾於 HashiCorp、Docker 與 LaunchDarkly 等知名開發者平台擔任行銷要職。此人事任命顯示 Vercel 將進一步強化其在企業級市場及開發者生態系的行銷佈局,特別是推動其 AI 工具與雲端平台的商業化增長。
Vercel 於控制面板中新增了「全域搜尋(Universal Search)」功能。使用者現在可以透過統一的搜尋介面,快速跨團隊、跨專案進行檢索,甚至能直接跳轉到特定的設定或部署頁面。此更新大幅提升了多專案管理者的導覽效率,減少在不同頁面間手動切換的時間。
高效能 LLM 推理與結構化生成框架 SGLang 宣布正式整合 Hugging Face Transformers 作為其執行後端。此更新讓開發者能直接利用 SGLang 的結構化控制 API(如 gen、select 等)驅動任何 Hugging Face 上的模型,無需等待原生 CUDA 核心適配,為新架構模型的快速原型設計、除錯與相容性測試提供極大便利。
分散式 SQLite 數據庫服務 Turso Cloud 正式加入 Vercel Marketplace。現在開發者可以直接在 Vercel 控制台中一鍵建立、配置與管理 Turso 數據庫,並自動同步環境變數。這項整合大幅簡化了 Next.js 等前端框架在邊緣運算(Edge)環境下存取低延遲數據庫的開發流程。
Vercel 於其可觀測性(Observability)平台中推出全新的「Notebooks」功能。開發者現在可以像使用資料科學筆記本一樣,在 Vercel 中撰寫、執行並儲存資料查詢。此功能更支援團隊協作,讓開發人員能輕鬆分享查詢結果與脈絡,大幅提升除錯與系統監控的效率。
Vercel 宣布推出「團隊強制雙重驗證 (2FA)」功能。團隊管理員現在可以強制要求所有團隊成員啟用 2FA 才能存取團隊資源。此舉旨在提升團隊協作時的帳號安全性,防止因個人帳號遭破解而導致整個團隊的專案與代碼外洩,是企業與開發團隊的重要安全升級。
本文介紹如何在消費級硬體(如 RTX 3090/4090)上微調 Black Forest Labs 的 FLUX.1-dev 12B 圖像生成模型。透過 Hugging Face 的 PEFT 與 Diffusers 庫,結合 4-bit QLoRA 量化、梯度檢查點與 8-bit 優化器,開發者能將顯存需求降至 24GB 以下,讓個人創作者也能輕鬆客製化頂級開源圖像模型。
Google DeepMind 宣布擴展其 Gemini 2.5 模型家族。先前推出的 Gemini 2.5 Flash 與 Gemini 2.5 Pro 現已達到正式商用(GA)階段。同時,Google 還推出了全新的 Gemini 2.5 Flash-Lite,這是目前 Gemini 2.5 家族中速度最快、成本最低的模型,旨在為開發者提供極致的性價比與低延遲體驗。