Hugging Face 宣布將在即將推出的 Transformers v5 中,對核心的 Tokenization(分詞)系統進行重大重構。新版本旨在解決長期以來 Fast 與 Slow Tokenizer 行為不一致的痛點,簡化特殊 Token 與 Chat Template 的處理流程,並透過模組化設計讓開發者能更輕鬆地自定義分詞步驟,大幅提升開發體驗與模型部署的穩定性。
NVIDIA 與 Hugging Face 合作介紹「開放評測標準」,展示如何利用 NeMo Evaluator 工具對輕量級模型 Nemotron 3 Nano 進行系統化基準測試。此指南提供了一套可重現的評測食譜(Recipe),幫助開發者在邊緣設備或資源受限環境中,精確評估小模型的性能與偏差,推動開源社群的評測透明度。
Vercel 宣布在 Vercel Marketplace 中正式支援 AWS 資料庫服務。開發者現在可以直接透過 Vercel 控制台,快速佈署、配置並連結如 Amazon RDS 或 DynamoDB 等 AWS 資料庫。這項更新簡化了環境變數設定與憑證管理,大幅降低了在 Vercel 專案中整合 AWS 雲端基礎設施的門檻。
Vercel 針對多租戶(Multi-tenant)平台推出了優化的預覽網址(Preview URLs)功能。過去在開發多租戶 SaaS 應用時,測試不同子網域或自訂網域的預覽版本相當繁瑣。現在,Vercel 簡化了此流程,讓開發者能直接在預覽部署中無縫測試租戶專屬的路由與功能,大幅提升多租戶應用的開發與測試效率。
Vercel 宣布其 AI Gateway 已正式支援 Google 的 Gemini 3 Flash 模型。開發者現在可以透過 Vercel 的統一接口,輕鬆將這款高效能、低延遲的輕量級模型整合至應用程式中。這不僅簡化了 API 金鑰管理,還能利用 Vercel AI Gateway 提供的快取、速率限制與監控功能,優化 AI 應用的效能與成本。
Google DeepMind 正式發表新一代模型 Gemini 3 Flash。該模型旨在打破性能與速度的權衡,以極低的成本提供接近前沿(frontier)等級的智慧表現。這款模型專為需要高速度、低延遲以及高性價比的應用場景所設計,將為開發者帶來更高效、更實惠的開發體驗。
Vercel 宣布推出「Vercel Knowledge Base」功能,旨在簡化 RAG(檢索增強生成)應用的開發。開發者可以直接在 Vercel 平台上上傳或同步文件(如 Markdown、PDF 等),系統會自動處理分塊、向量化與儲存。這讓開發者無需自行架設與維護複雜的向量資料庫,即可快速為 AI 代理或聊天機器人提供精準的背景知識。
Vercel 宣布其 Observability 工具新增匯出功能,開發者可將查詢結果一鍵下載為 CSV 或 JSON 格式。此更新提升了數據處理彈性,便於將監控數據導入 Excel、BI 工具或自訂腳本中進行深度分析、共享或存檔。
開源 AI 編程助理 Cline(前身為 Claude Dev)現已正式支援 Vercel AI Gateway。這項整合讓開發者在 VS Code 中使用 Cline 進行自動化編程時,能透過 Vercel 的網關統一管理、快取並監控所有 LLM 請求。藉由內建的快取機制與詳細的用量分析,開發者不僅能顯著降低頻繁調用 API 的費用,還能提升回應速度與系統穩定性。
Google DeepMind 宣布推出 Gemma Scope 2,這是一套專為全新 Gemma 3 模型家族設計的稀疏自編碼器(SAE)工具包。Gemma Scope 2 旨在提供強大的「可解釋性」工具,讓研究人員能夠深入剖析模型內部的神經元激活狀態與決策邏輯。此舉將大幅降低 AI 安全與機制可解釋性(Mechanistic Interpretability)研究的門檻,協助社群理解複雜語言模型的行為。
IBM Research 宣佈在 Hugging Face 上推出 CUGA(可配置用戶引導代理)框架。CUGA 旨在簡化 AI Agent 的自定義與部署流程,讓開發者無需複雜的程式碼或微調,即可透過結構化配置引導 Agent 的行為與決策。此舉結合了 Hugging Face 的開源生態,將促進安全、可控的 Agentic AI 技術走向大眾化。
Vercel 推出 v0 與 Notion 的整合功能,旨在簡化以 Notion 作為後端的應用程式開發。開發者現在可以利用 v0 的生成式 UI 能力,直接讀取 Notion 的資料庫與頁面結構,快速生成對應的 React 組件、儀表板或自定義工作流。這項更新大幅降低了將 Notion 數據可視化與建立內部工具的門檻。
Vercel 官方發布 v0 提示詞(Prompt)最佳實踐指南。文章深入解析如何透過結構化描述、分步迭代、上傳設計截圖以及指定互動狀態,來引導 v0 生成精確且符合預期的 React、Tailwind CSS 與 shadcn/ui 組件。這份指南能幫助開發者與設計師大幅提升 UI 生成效率與程式碼品質。
Google DeepMind 宣布推出改進後的 Gemini 音訊模型,專為即時語音體驗進行優化。新模型採用原生多模態架構,無需經過「語音轉文字」的中介步驟,即可直接理解並生成語音,大幅降低延遲。這項升級將賦予開發者構建更具情感表現力、反應更迅速的語音助理與互動應用的能力,並已陸續在 Google AI Studio 與 Vertex AI 上線。
Vercel 官方 Changelog 宣布新增桌面與行動端的推送通知(Push Notifications)支援。開發者與團隊成員現在可以直接在電腦或手機上接收即時通知,包含專案部署成功或失敗、團隊協作評論等重要更新。這項功能讓用戶無需頻繁重新整理網頁或等待電子郵件,即可在第一時間掌握專案動態,大幅提升開發流程與團隊協作的效率。
Vercel 宣布在其執行階段日誌(Runtime Logs)中新增支援 HTTP `Referer` 資訊。開發者現在可以直接在 Vercel 控制台或匯出的日誌中,查看每個請求的來源網頁。這項改進將大幅提升除錯效率、安全分析能力,並有助於追蹤流量來源,無需再手動撰寫中間件(Middleware)來記錄此資訊。
Vercel 宣布其 Web Analytics 服務現在支援「依任意維度拆分數據」功能。開發者與產品團隊不再受限於單一維度的檢視,現在可以靈活地將流量數據結合多個維度(例如:特定路徑下的瀏覽器分佈、或特定推薦來源的國家分佈)進行交叉分析,大幅提升數據洞察力與除錯效率。
Vercel 宣布一項更新,現在不論使用何種前端框架,開發者都能直接從 Serverless 或 Edge Function 的 HTTP 回應中新增快取標籤(Cache Tags)。這項功能打破了以往與 Next.js 深度綁定的限制,讓 Nuxt、SvelteKit、Remix 等其他框架也能輕鬆利用 Vercel 的邊緣快取與精準清除機制,實現高效且細粒度的快取管理。
熱門本地推論工具 llama.cpp 推出全新的「模型管理(Model Management)」機制。此更新深化了與 Hugging Face Hub 的整合,用戶可直接透過命令列下載與快取 GGUF 模型,無需手動操作。此外,llama-server 也新增了動態載入、卸載與熱切換多個模型的能力,並優化了 LoRA 權重的動態掛載,大幅提升本地 LLM 部署的靈活性與 GPU 記憶體利用率。
Vercel 宣布其 AI Gateway 已正式支援 OpenAI 的 GPT 5.2 系列模型。開發者現在可以透過 Vercel 的統一 API 介面,輕鬆將 GPT 5.2 整合至應用程式中,並享有 AI Gateway 提供的自動重試、快取、速率限制以及詳細的用量監控功能,大幅簡化了新世代大語言模型的部署與運維流程。
Vercel 針對 React Server Components (RSC) 發布緊急安全更新。本次更新主要修復了兩個重大安全隱患:一是可能導致伺服器崩潰的阻斷服務(DoS)漏洞,二是可能意外暴露伺服器端原始碼或敏感資料的漏洞。建議所有使用 Next.js 及 RSC 技術的開發者立即將專案依賴項升級至最新版本以確保安全。
Google DeepMind 宣布加強與英國 AI 安全研究所(UK AISI)的合作關係。雙方將針對前沿 AI 模型的安全評估、風險緩解及安全研究展開更緊密的協作。此舉旨在建立更完善的 AI 安全標準,確保未來強大 AI 系統的開發與部署符合安全規範。
Hugging Face 釋出最新消息,指出 Codex 正在開源其 AI 模型。此舉結合了 Hugging Face 的開源生態與 Codex 在技能培訓(Skills Training)領域的專長,旨在為全球開發者、學生及研究人員提供更具可及性的 AI 工具,進一步推動 AI 實作技能的普及與教育發展。
Google DeepMind 宣布將進一步加強與英國政府的合作關係。此合作核心在於人工智慧(AI)快速發展的時代中,共同促進經濟繁榮並確保技術安全。雙方將攜手應對前沿 AI 技術帶來的機遇與挑戰,為未來的安全治理與科技創新奠定堅實基礎。
Vercel 宣布其 Sandbox(沙盒)環境現在已支援 Node.js 24 LTS。這項更新讓開發者能夠在 Vercel 的隔離測試環境中,直接使用 Node.js 24 的最新長期支援(LTS)特性與 API。這有助於團隊在將專案正式部署上線前,確保程式碼與最新 Node.js 版本的相容性與效能表現。
Vercel 正式推出「合作夥伴認證計劃」(Partner Certification),專為代理商、系統整合商及企業合作夥伴設計。此計劃透過系統化的培訓與考核,驗證開發團隊在 Next.js、前端效能優化及 Vercel 平台部署的專業能力。通過認證的夥伴將獲得官方徽章、優先技術支援及共同行銷機會,藉此提升市場競爭力並加速企業客戶的數位轉型。
Vercel 深入介紹了其 Workflow DevKit 的底層架構。該工具包旨在簡化持久性、多步驟工作流(Durable Workflows)在不同 Web 框架(如 Next.js、Nuxt、SvelteKit)中的整合。透過標準化的 HTTP 處理與狀態序列化機制,開發者能在無伺服器(Serverless)環境中輕鬆構建具備自動重試與狀態恢復能力的複雜工作流。
Vercel 官方宣布已支援 FastAPI 的 Lifespan 生命週期事件。這項更新允許開發者在 Vercel 部署的 FastAPI 應用中,定義並執行啟動(startup)與關閉(shutdown)時的邏輯,例如初始化資料庫連線或載入機器學習模型,大幅提升了在 Serverless 環境下運行 Python Web 應用的彈性與資源管理能力。
Google DeepMind 發表全新的 FACTS 基準測試套件,專門用於系統化評估大型語言模型(LLM)的真實性。該套件解決了現有評估方法不夠全面或難以標準化的痛點,透過多維度的測試集與自動化評估指標,幫助研究人員與開發者精確量化模型的「幻覺」程度。這對於提升 AI 在高風險領域(如醫療、法律、金融)的實用性與信任度具有重要意義。
Vercel 宣布其 Vercel Functions 的 Rust 執行期(Runtime)已進入公開測試階段。開發者現在可以直接使用 Rust 編寫無伺服器函數,享受 Rust 帶來的極致效能、極低記憶體佔用與超快冷啟動優勢。此功能簡化了 Rust 在 Vercel 上的部署流程,並與現有的 Vercel 生態系統無縫整合。