Hugging Face 發表全新基準測試「FutureBench」,旨在評估 AI Agent 在預測未來事件(如地緣政治、金融市場及科技趨勢)上的表現。該測試挑戰了 Agent 的資訊檢索、機率推理與時間推理能力,有效避免了傳統基準測試中常見的資料洩漏問題。評估結果顯示,目前的 AI Agent 在面對未知的未來事件時,預測準確度與人類專家仍有顯著差距。
Vercel 宣布其 MCP (Model Context Protocol) Adapter 正式支援 OAuth 驗證機制。此更新允許開發者構建的 MCP 伺服器能安全地進行使用者授權,讓 AI 代理可代表特定用戶存取第三方服務。這大幅簡化了 AI 應用程式在處理敏感數據與個人化 API 呼叫時的安全流程。
Hugging Face 介紹了 ScreenEnv,這是一個旨在簡化「電腦使用(Computer Use)」AI 代理部署的開源環境。它提供類似 Gym 的標準化接口,讓開發者能在安全的虛擬桌面(如 Docker/VM)中,利用多模態模型(如 Claude 或 GPT)進行滑鼠、鍵盤與螢幕視覺的完整互動,非常適合開發自動化工作流與 GUI 代理。
Hugging Face 宣布推出其 Model Context Protocol (MCP) 伺服器。這項工具讓支援 MCP 的 AI 客戶端(如 Claude Desktop、Cursor)能夠直接與 Hugging Face Hub 互動。使用者可以直接在對話中搜尋熱門模型、查詢資料集結構與讀取 Model Card,大幅簡化了 AI 開發者與研究人員的工作流程。
Hugging Face 宣布 Gradio 正式支援 Model Context Protocol (MCP)。開發者現在可以輕鬆將 Gradio 應用程式轉換為 MCP 伺服器,使 Claude 等 LLM 代理能直接調用各種機器學習模型、影像處理或數據分析工具。這項整合極大地擴展了 LLM 的實用技能,並搭起了 LLM 與 Hugging Face 龐大開源生態系之間的橋樑。
Vercel 年度盛會 Ship 2025 發表多項重大更新,全面加速 AI 應用的開發與部署。本次焦點包含 v0 從 UI 生成演進為全端應用構建助手、Vercel AI SDK 針對 AI Agent 工作流的深度優化,以及 Next.js 基礎設施的效能提升。Vercel 展現了其從託管平台轉型為 AI 時代開發樞紐的野心。
Vercel 官方 Changelog 宣布「Vercel Agent」正式進入限量測試(Limited Beta)階段。這項新功能預期將與 Vercel AI SDK 及 v0 深度整合,協助全端開發者更輕鬆地在 Serverless 環境中部署、管理與運行具備長期執行與狀態保存能力的 AI Agent 應用。
Vercel 宣布推出 Vercel Sandbox,這是一項專為安全執行不可信程式碼而設計的新功能。它提供輕量且高度隔離的沙箱環境,非常適合用於 AI Code Interpreter(程式碼口譯器)、線上程式碼編輯器或執行使用者自訂腳本。此功能與 Vercel 生態系深度整合,能有效防範惡意程式碼對系統造成的安全威脅。
Vercel 發布指南,探討如何高效構建與部署模型上下文協定(MCP)伺服器。 文章重點介紹如何利用 Vercel Serverless Functions 託管 MCP,並透過伺服器傳送事件(SSE)實現雙向通訊。 同時提供優化冷啟動、確保端點安全,以及將 MCP 伺服器無縫整合至 Cursor 或 Claude 等 AI 工具的實務建議。
隨著 AI Agent 從單純對話走向自主執行任務,安全挑戰日益嚴峻。Vercel 釋出指南,探討如何透過安全沙盒(如 E2B)隔離程式碼執行、利用 IAM 限制 Agent 權限、防範提示詞注入,以及在關鍵步驟引入「人工確認(Human-in-the-Loop)」機制,幫助開發者在 Vercel 平台上構建兼具功能與安全性的 AI 應用。
Vercel 發布最新更新,針對熱門 AI 編碼工具 Claude Code 與 Cursor Agent 降低了使用門檻。過去開發者在團隊專案中使用這些 AI 代理工具時,可能需要為其配置付費的 Vercel 團隊席位(Team Seat)。現在 Vercel 取消了這項限制,讓開發者能更無縫、低成本地將 AI 工作流整合至 Vercel 的部署與託管生態系中。
Hugging Face 發表了 ScreenSuite,這是目前最全面的圖形使用者介面(GUI)Agent 評估套件。它解決了現有評估工具平台單一、任務簡單的問題,提供跨 Web、桌面與行動裝置的標準化測試環境。ScreenSuite 整合了多樣化的真實世界任務與嚴格的評估指標,幫助開發者精確衡量 Agent 的視覺導航與操作能力。
Vercel 提出了一套「務實(No-nonsense)」的 AI Agent 開發方法論。文章指出,許多開發者陷入了過度複雜的 Agent 框架陷阱,導致系統難以偵錯且成本高昂。Vercel 建議回歸以代碼為中心的開發模式,利用 TypeScript 處理狀態與控制流,並將 LLM 定位為結構化工具調用器。透過 Vercel AI SDK,開發者能更輕鬆地實現串流傳輸、生成式 UI 與可靠的步驟監控,構建出真正能上線的生產級應用。
法國 AI 新創公司 H (Hcompany) 於 Hugging Face 發表了全新的視覺語言模型 (VLM) 家族「Holo1」,專為 GUI(圖形使用者介面)自動化設計。該模型家族是其全新 GUI 代理人「Surfer-H」的核心引擎。Holo1 具備強大的視覺解析與螢幕定位能力,能夠理解複雜的網頁與應用程式介面,並執行點擊、輸入等操作。這項釋出標誌著 AI 代理人從單純的文字 API 呼叫,邁向能像人類一樣直接透過視覺操作任何軟體介面的新階段。
Vercel 發表全新「Fluid Compute」架構,旨在解決傳統 Serverless 在處理 AI 工作負載時的痛點(如超時、冷啟動與串流中斷)。Fluid Compute 提供更長的執行時間、動態資源配置與優化的串流支援,讓開發者能更輕鬆地在 Vercel 上部署複雜的 AI Agent 與推理模型應用,無需轉向複雜的容器管理。
Hugging Face 探討了將「結構化約束(Structure)」引入 Code Agent 的全新設計範式。傳統 Code Agent 透過撰寫 Python 程式碼來執行任務,雖具備極高的靈活性,但自由度過高也容易帶來語法錯誤與安全隱憂。新方法透過結合 Pydantic 驗證、結構化解碼與型別限制,讓 Agent 在保有程式碼強大表達力的同時,確保輸出與行為的預測性與安全性,大幅提升複雜任務的執行成功率。
Hugging Face 推出全新教學,教導開發者如何使用約 70 行 Python 程式碼構建一個由 MCP(模型上下文協定)驅動的微型 Agent。此方法擺脫了傳統繁重框架的束縛,直接展示了 Agent 的核心運作邏輯。透過 MCP,這個微型 Agent 能輕鬆連接並調用外部工具與資料源,極大地降低了開發與理解 AI Agent 的門檻。
Hugging Face 發布 2025 年視覺語言模型(VLM)趨勢報告。文章深入探討 VLM 在「更強(推理與 OCR)」、「更快(輕量化與推論優化)」與「更實用(多模態 Agent)」三大維度的演進。推薦了 Qwen2.5-VL、Llama-3.2-Vision 等主流開源模型,並介紹如何利用 Hugging Face 生態系進行高效部署與微調。
Hugging Face 官方發布教學,介紹如何將 Gradio 應用程式轉換為 Model Context Protocol (MCP) 伺服器。開發者只需撰寫簡單的 Python 程式碼,即可將現有的 Gradio 介面與 ML 模型封裝成 MCP 工具。這讓 Claude Desktop 或 Cursor 等客戶端能直接調用這些工具,極大地簡化了 AI Agent 與自訂模型的整合。
ServiceNow 在 Hugging Face 博客上介紹了全新開源項目 PipelineRL。該項目旨在將強化學習(RL)技術應用於複雜的 AI 與 LLM 工作流管線優化中。透過 PipelineRL,開發者可以更有效地訓練和調整多步驟代理(Agent)系統,解決傳統靜態管線難以應對的動態決策與資源分配挑戰。
Hugging Face 發表最新教學,展示如何利用 Model Context Protocol (MCP) 協定,在僅 50 行程式碼內構建出功能完整的 AI Agent。透過 MCP,這個輕量級 Agent 可以直接連接並使用現有的各種 MCP 工具伺服器(如搜尋、資料庫等),無需繁瑣的 API 對接。這項技術大幅降低了開發 Agent 的門檻,並展現了開源標準在 AI 生態系中的強大潛力。
Google 在 Cloud Next 大會上宣布雙重重磅消息:全面支援 Anthropic 的 MCP 協定,並推出全新的 Agent2Agent (A2A) 協定。A2A 旨在與 MCP 互補,解決跨遠端 Agent 溝通的痛點。該規範包含 Agent Card、Task 機制、企業級認證與推播支援,並同步開源了草案規範與 Agent 開發套件(ADK)。
Hugging Face 宣布與 Cloudflare 達成合作,將其開源即時通訊庫 FastRTC 與 Cloudflare 的 WebRTC 基礎設施(如 Cloudflare Calls)進行深度整合。此合作旨在解決即時語音和視訊 AI 應用在部署時面臨的高延遲與複雜網路設定難題。開發者現在可以更輕鬆地在全球邊緣網路上建構並擴展低延遲的互動式 AI 體驗。
Vercel 正式推出 AI SDK 4.2,專注於提升 Agentic(代理)開發體驗。此版本優化了多步驟工具調用(`maxSteps`)的控制、增強了 `streamObject` 的結構化數據輸出,並提供更完善的 OpenTelemetry 監控支援。同時,新版本也深化了與 React 19 和 Next.js 的整合,讓前端開發者能更輕鬆地構建高效、可觀測的 AI 應用。
Vercel 發表「Fluid Compute」技術細節,這是一種新型的無伺服器(Serverless)運算架構。它解決了傳統 Serverless 的冷啟動、固定記憶體配置與執行時間限制等痛點。透過動態且彈性的資源調配,Fluid Compute 能在毫秒內根據請求負載自動調整 CPU 與記憶體,特別適合需要長連接、串流輸出及高運算需求的 AI Agent 和 LLM 應用。
Hugging Face 發表指南,介紹如何將其輕量級 Agent 框架 `smolagents` 與開源 LLM 觀測平台 Arize Phoenix 整合。透過 OpenTelemetry 標準,開發者可以輕鬆追蹤 Agent 的決策步驟、工具調用與 LLM 互動。此整合不僅能可視化複雜的 Agent 工作流,還能進行系統化的效能評估,有效解決 Agent 開發中「黑盒子」與難以除錯的痛點。
Hugging Face 推出全新基準測試「DABStep」,旨在評估 AI 數據代理(Data Agent)執行多步驟推理的能力。DABStep 模擬了真實世界的複雜數據分析場景,要求 AI 規劃步驟、撰寫並執行程式碼、處理多種數據格式,並進行錯誤修正。此基準測試為開發更實用、更具規劃能力的數據分析 AI 助手提供了客觀的評估標準。
為對抗封閉的商業 Deep Research 服務,Hugging Face 推出開源版 DeepResearch。該專案基於其輕量級 Agent 框架 smolagents,能驅動開源模型(如 Qwen 或 Llama)進行多步驟網頁搜尋、資訊整合並產出詳盡報告。這不僅降低了研究型 Agent 的門檻,也讓開發者能完全掌控資料與搜尋邏輯。
Hugging Face 旗下的輕量級 Agent 開源庫 smolagents 迎來重大更新,正式支援視覺語言模型(VLM)。開發者現在可以讓 Agent 接收並處理影像輸入,適用於網頁視覺導航、圖表分析及多模態任務。此更新大幅擴展了程式碼 Agent(Code Agent)的應用場景,使其能「看見」並理解真實世界的視覺資訊。
Vercel 正式發布 AI SDK 4.1。本次更新重點在於簡化 AI Agent 的開發,透過 `maxSteps` 參數即可自動處理多回合的 Tool Calling。同時,`useChat` 新增了更完善的多模態檔案上傳與狀態管理支援,並優化了 OpenTelemetry 遙測功能,讓開發者能更輕鬆地在 Next.js 等框架中建構、監控複雜的 AI 應用。