Vercel 宣布推出 bash-tool,這是一項專為 AI 代理(Agents)設計的工具,旨在透過檔案系統進行上下文檢索。該工具允許 AI 執行安全的 Bash 指令(如讀取、搜尋檔案),從而更精確地理解專案結構與程式碼內容。這將大幅提升 AI 在進行程式碼生成、除錯及專案分析時的準確度與效率。
Vercel 官方部落格深入解析了 AI 程式碼生成工具 v0 的演進歷程。透過引入瀏覽器端沙盒環境、結合編譯器反饋的自我糾錯機制,以及基於 shadcn/ui 和 Tailwind CSS 的結構化設計系統,v0 成功從單純的 UI 產生器轉型為能獨立思考、編譯並解決複雜前端問題的 Coding Agent,大幅提升程式碼生成品質與開發者體驗。
Vercel 宣布其 AI Gateway 正式支援 Anthropic 的命令列 AI 助手 Claude Code。開發者現在可以透過 Vercel AI Gateway 路由 Claude Code 的 API 請求,藉此獲得詳細的用量分析、快取功能以及更佳的成本控制。這項整合有助於團隊在日常開發中更安全、高效地部署與管理 AI 代理工具。
Hugging Face 宣布與 NVIDIA 合作,將 NVIDIA 全新的 DGX Spark 運算平台與 Pollen Robotics 的 Reachy Mini 機器人進行深度整合。此合作旨在降低具身智能(Embodied AI)的開發門檻,讓開發者能透過 Hugging Face 的 LeRobot 開源機器人框架,輕鬆將 AI 代理(Agents)部署至實體硬體,實現具備物理互動能力的實體 AI 應用。
Vercel 發表 AI SDK 6,這是專為 Web 開發者打造的 AI 框架重大更新。本次升級重點在於「Agentic AI」的簡化,引入了全新的多步驟工具調用與循環機制。此外,新版本原生支援 Anthropic 推動的 MCP(Model Context Protocol),讓 AI 能更輕鬆地存取外部資料。同時,針對語音與多模態即時互動提供了更完善的 React Hooks 支援,大幅提升邊緣端效能。
Vercel 在建構生產級 AI Agent 時發現,給予過多工具會導致模型混淆、延遲飆升與成本暴增。他們透過「動態工具載入」、「多 Agent 架構」與「程式碼硬編碼路由」等策略,成功精簡了 80% 的工具。這項優化不僅讓 Agent 的任務成功率顯著提升,更大幅改善了用戶體驗,證明了在 AI 應用開發中「少即是多」的硬道理。
Vercel 宣布其 AI 助手 Vercel Agent 新增支援 Marketplace 整合服務。開發者現在可以直接在 Vercel 平台中,透過自然語言對話來管理、查詢或設定已安裝的第三方服務(如 Neon、Supabase、Upstash 等)。這項更新大幅簡化了跨平台配置的繁瑣流程,免去了在不同控制台之間來回切換的麻煩,顯著提升了現代 Web 開發工作流的整合度與效率。
開源 AI 編程助理 Cline(前身為 Claude Dev)現已正式支援 Vercel AI Gateway。這項整合讓開發者在 VS Code 中使用 Cline 進行自動化編程時,能透過 Vercel 的網關統一管理、快取並監控所有 LLM 請求。藉由內建的快取機制與詳細的用量分析,開發者不僅能顯著降低頻繁調用 API 的費用,還能提升回應速度與系統穩定性。
IBM Research 宣佈在 Hugging Face 上推出 CUGA(可配置用戶引導代理)框架。CUGA 旨在簡化 AI Agent 的自定義與部署流程,讓開發者無需複雜的程式碼或微調,即可透過結構化配置引導 Agent 的行為與決策。此舉結合了 Hugging Face 的開源生態,將促進安全、可控的 Agentic AI 技術走向大眾化。
Hugging Face 介紹了與 Intel 合作的 DeepMath 專案,這是一個基於 smolagents 輕量級框架構建的數學推理 Agent。傳統 LLM 在數學計算上容易出錯,而 DeepMath 採用「Code Agent」機制,讓輕量級開源模型透過撰寫並執行 Python 程式碼來解答複雜數學題。此方案不僅降低了算力門檻,還能在 Intel 硬體上實現高效能的本地端推理。
Hugging Face 分享了如何利用 Anthropic 的 Claude 模型(作為 AI Agent)來自動微調開源大語言模型。透過整合 Hugging Face 的生態系工具(如 AutoTrain),Claude 能夠自主處理數據集清洗、撰寫訓練腳本、調整超參數並執行微調。這項實驗展示了 Agent 在機器學習工程(MLE)自動化中的巨大潛力,讓模型訓練變得更加平民化。
AI 搜尋引擎 Tavily 在 Hugging Face 部落格分享了其「Deep Research」技術的幕後架構。該系統旨在解決傳統單次搜尋無法應付複雜任務的痛點。透過結合多步驟代理人規劃、動態查詢擴展、內容去噪與重排技術,Tavily 成功在複雜研究任務中取得領先(SOTA)地位,並詳細解析了其評估方法與實作細節,為開發者提供建構自主研究代理人的實用指南。
Vercel 宣布其「Agent investigations(Agent 調查)」功能現已正式包含在 Observability Plus 方案中。此功能旨在幫助開發者深入分析、追蹤與除錯其部署在 Vercel 上的 AI Agent 與 LLM 應用行為。透過此整合,開發團隊無需額外付費即可在現有的 Observability Plus 訂閱中享有更全面的 AI 觀測能力。
Google DeepMind 宣布推出其最新一代旗艦模型 Gemini 3,並全面開放開發者進行建構。此版本在多模態理解、邏輯推理與生成速度上皆有顯著提升。開發者現在可以透過 Google AI Studio 和 Vertex AI 存取 Gemini 3 API,體驗更強大的上下文處理能力與更低的延遲,為下一代 AI 應用與 Agent 開發奠定基礎。
知名 AI 學者 Ethan Mollick 撰文指出,AI 技術在過去三年經歷了巨大的範式轉移。AI 已從最初 GPT-3 時代單純進行文本生成與對話的「聊天機器人(Chatbots)」,演進至如今以 Gemini 3 為代表、具備自主規劃與執行能力的「AI Agent(代理人)」。這一轉變不僅改變了人機互動模式,也重新定義了 AI 在工作與生活中的實用價值。
Google DeepMind 宣布推出全新一代旗艦模型 Gemini 3。此版本在多模態理解、複雜邏輯推理及長文本處理能力上皆有顯著突破。Gemini 3 更加強調「主動式智能體(Agentic AI)」的實用化,能自主規劃並執行跨平台的複雜任務,並大幅降低了延遲與運算成本,為個人與企業應用帶來全新變革。
Google DeepMind 推出新一代 AI 代理 SIMA 2,全面導入 Gemini 模型的能力。SIMA 2 不僅能在多個 3D 虛擬與遊戲世界中執行任務,還具備更強的推理、語言理解與即時決策能力。這項技術展示了 AI 如何從單純的指令接收者,演變為能在複雜互動環境中與人類協同合作的智慧夥伴。
Vercel 正式推出 Sandbox CLI 工具,旨在簡化沙盒環境的建立與管理流程。開發者與 AI 代理現在可以直接透過終端機建立隔離的執行環境,這不僅能加速本地測試與原型開發,更能無縫整合至 AI 代理(AI Agents)的工作流中,讓 AI 能在安全的沙盒中自主執行與驗證程式碼,極大提升開發效率。
Vercel 發表專文,整理其團隊在使用 Vercel AI SDK 構建 AI Agent 的核心心得。文章指出,從 Chat 轉向 Agent 需克服 Serverless 執行時間限制、複雜的狀態管理,以及如何向用戶即時串流 Agent 的「思考與工具執行過程」。此外,建立完善的評估(Evaluation)機制與工具調用的容錯設計,是確保 Agent 穩定運作的關鍵。
Vercel 宣布為其 Vercel Agent 引入全新的「AI 診斷(AI investigations)」功能。當應用程式出現部署失敗、運行時錯誤或效能異常時,該 Agent 能自動深入分析系統日誌與程式碼庫,快速找出問題根源。這項更新大幅縮短了開發者的除錯時間,並能直接生成具體的修復建議,提升運維效率。
本文探討 MiniMax 在 Agent 領域的最新研究思考。傳統 LLM 對齊(如 RLHF)偏重人類對話喜好,但對需要操作工具、適應動態環境的 AI Agent 而言,這種方式無法提升其泛化能力。MiniMax M2 提出重新定義 Agent 的對齊目標,應從「對齊人類偏好」轉向「對齊環境反饋與任務成功率」,以解決 Agent 在面對未知環境時的泛化瓶頸。
Vercel 舉辦了 Ship AI 2025 線上發表會,彙整其在 AI 網頁開發領域的最新突破。本次重點包括生成式 UI 工具 v0 的「全端生成」重大升級、Vercel AI SDK 對於多代理人(Multi-agent)協同工作流的架構級支援,以及針對 AI 串流與邊緣運算(Edge)的基礎設施改良,旨在幫助開發者更輕鬆地建構、部署與擴展高效能的 AI 應用。
Google DeepMind 發表全新世界模型 Genie 3,為生成式 AI 領域帶來重大突破。該模型能以每秒 24 幀(fps)的即時速度,生成可供用戶自由導航與互動的動態虛擬世界。Genie 3 不僅支援 720p 的高解析度,更能在長達數分鐘的互動過程中,保持場景與物理邏輯的高度一致性,這將為未來的遊戲開發、虛擬實境以及 AI 代理(Agents)的模擬訓練開闢全新途徑。
Google DeepMind 發表 Gemini Robotics 1.5,旨在將 AI Agent 的能力帶入實體世界。透過此系統,機器人將具備更強大的環境感知、多步驟任務規劃、邏輯思考、工具使用以及實體行動能力。這項進展代表著「實體代理(Physical Agents)」時代的開啟,能更有效率地解決現實世界中複雜且多步驟的實體任務。
Google DeepMind 發表全新 AI Agent「CodeMender」,旨在解決軟體安全中的關鍵漏洞修復難題。CodeMender 不僅能自動偵測程式碼中的安全漏洞,還能主動生成修復補丁並進行驗證。這項技術結合了先進的大型語言模型與自動化測試,大幅提升了軟體開發生命週期中的安全性與修復效率。
Google DeepMind 發表全新的 Gemini 2.5 Computer Use 專用模型,目前已透過 API 提供預覽。該模型基於 Gemini 2.5 Pro 的強大能力進行微調,旨在賦能 AI 代理(Agents)直接與作業系統及應用程式的用戶介面(UI)進行互動。這項技術將加速自動化工作流程的開發,讓 AI 能夠像人類一樣執行點擊、輸入和導覽等電腦操作。
Vercel 正式將開源工作流開發套件 (Workflow Development Kit) 推向公開測試。該套件旨在解決 Serverless 環境下長耗時任務易超時的痛點,讓開發者能以程式碼定義多步驟、具容錯能力且可中斷重試的工作流。這項工具特別適合用於構建複雜的 AI Agent 運作流程、定時任務與自動化管道,並能與 Vercel 平台無縫整合。
Vercel 宣布在其 Marketplace 中引入 AI Agent 與 AI 服務。開發者現在可以直接在 Vercel 平台中發現、安裝並管理各種 AI 代理工具、向量資料庫及 LLM 監控服務。這項更新簡化了 AI 應用的基礎設施配置,讓開發者能更專注於構建 AI 驅動的 Next.js 應用。
Vercel 宣布在其 Marketplace 中正式引入 AI Agent 與相關服務專區。開發者現在可以更輕鬆地發現並整合各類 AI 工具(如向量資料庫、LLM API、Agent 框架與監控工具)至其 Vercel 專案中。此更新不僅支援自動配置環境變數,還提供統一帳單管理,免去多個平台付費的繁瑣流程,大幅簡化了構建 AI 應用程式的開發體驗與基礎設施管理。
Vercel 發表最新技術觀點,指出開發 AI Agent 不需要引入複雜的第三方 Agent 框架。透過 Vercel AI SDK 的 maxSteps 與 Tool Calling 功能,結合 Serverless 函數,開發者就能輕鬆構建具備自主決策能力的 Agent。本文強調「極簡主義」的開發流程,並分享如何在 Serverless 環境中克服超時限制、管理狀態,讓 Agent 應用快速上線。