本期 AINews 聚焦於一個新興趨勢:「萬物皆為協調者(Conductor)」。隨著 AI 應用從單一提示詞轉向複雜的多步驟工作流,如何有效編排、調度多個 AI 代理與工具(如使用類似 Netflix Conductor 或 Temporal 的架構)成為核心。這意味著未來的 AI 開發重點將從單一模型能力,轉向系統級的流程控制與協調。
Simon Willison 開源的 Datasette AI 代理插件 datasette-agent 發布 0.1a2 版本。此版本重點在於安全與權限控制,允許將代理工具的可用性與特定的 required_permission 綁定。預設的背景代理工具現在必須具備全新的 datasette-agent-background 權限才能執行,防止未授權的背景任務運行。
本期 AINews 聚焦於 AI 寫程式 Agent 的長期發展趨勢。Anthropic 開始針對 Claude 的程式化使用(Programmatic Usage)進行計量與限制,這將直接影響開發者透過自動化腳本或第三方工具調用 Claude 的成本。另一方面,Codex 相關的自動化編程 Agent 影響力持續上升,顯示出 AI 在軟體開發流程中的滲透率正穩定增加。
Google DeepMind 發表全新 AI 系統「Co-Scientist」,採用基於 Gemini 的多 Agent(多智慧體)架構。該系統能扮演科學家的虛擬合作夥伴,協助進行文獻回顧、提出新穎假設、設計實驗步驟並分析複雜數據。透過不同專業 Agent 的協作與互相審查,Co-Scientist 旨在大幅縮短科研週期,推動生物、化學及材料科學等領域的突破。
本文介紹 Superset 如何在 Vercel 平台上構建專為 AI Agent 設計的整合開發環境 (IDE)。Superset 利用 Vercel AI SDK 簡化多模型對接,並透過 Next.js App Router 與 Serverless Functions 處理複雜的代理人工作流與工具調用。透過 Vercel 的全球邊緣網路,他們成功解決了 Agent 運作時的即時狀態同步與高延遲問題,為開發者提供流暢的協作體驗。
Google DeepMind 發表 AlphaEvolve 的最新進展。這款由 Gemini 驅動的程式碼 Agent(Coding Agent)透過先進的演算法,在商業營運、基礎設施優化以及科學研究三大領域展現強大影響力。它不僅能自動化編寫程式,更能自我演化以適應複雜的跨領域需求,加速技術落地。
近期一系列的產業動態與產品發布,皆指向同一個核心趨勢:矽谷正認真將焦點轉向「AI 服務(Services)」。這意味著 AI 不再只是輔助人類的軟體工具(SaaS),而是能直接交付工作成果的代理人(Agents)。這種「以服務為軟體(Service-as-a-Software)」的轉變,將徹底重塑企業外包、客服及專業諮詢等數兆美元的服務業市場。
本期 Import AI 聚焦於「自動化 AI 研究」的最新趨勢。隨著大語言模型與 Agent 技術的成熟,AI 系統已開始展現出自動撰寫程式碼、設計新演算法並進行自我訓練的能力。這種「遞迴自我提升(Recursive Self-Improvement)」不僅能極大地加速 AI 研發進程,也引發了關於安全控制、運算資源分配以及 AI 演進速度失控的深思。
本文介紹 AI 新創公司 General Intelligence 的實踐案例。他們在 Vercel 上構建了一個 AI Agent 平台,最特別的是,整個開發過程高度依賴 AI Agent 來編寫與優化代碼。透過 Vercel AI SDK、Next.js 與 Vercel 的 Serverless 架構,他們不僅實現了極速的迭代,還展示了「用 Agent 創造 Agent 平台」的未來開發範式。
Google DeepMind 正在研發「AI 協同臨床醫生(AI co-clinician)」系統,探索 AI 輔助醫療的新路徑。該研究專注於建立能與人類醫生協作的 AI 助手,協助進行臨床推理、病歷撰寫與醫患溝通。此舉旨在緩解全球醫療資源緊張問題,並在確保安全與倫理的前提下,提升醫療服務的品質與效率。
NVIDIA 推出全新輕量級多模態模型 Nemotron 3 Nano Omni,主打「長文本」與「多模態」處理能力。該模型專為文件分析、語音與影片理解的 AI Agent 所設計,能在資源受限的設備上運行。這標誌著邊緣端(On-device)多模態 Agent 應用的重大突破。
Vercel 發表了 2026 年 AI 加速器(AI Accelerator)的官方回顧。本屆計劃聚焦於協助早期 AI 新創將創意轉化為生產級應用,重點展示了多個在 AI Agent、多模態互動及邊緣運算領域取得突破的團隊。文章總結了入選項目的技術亮點,並強調了 Vercel AI SDK 與 Next.js 在現代 AI 開發堆疊中的核心地位。
Hugging Face 介紹全新 DeepSeek-V4 模型,具備 100 萬 Token 的超長上下文能力。不同於以往流於形式的長文本模型,DeepSeek-V4 專為 Agent 設計,在長文本召回率與指令遵循上表現優異。本文探討其技術突破、在 Hugging Face 生態系的部署方式,以及如何實際應用於複雜的 Agent 工作流中。
賓州大學教授 Ethan Mollick 針對 GPT-5.5 發表評論。他指出,GPT-5.5 的出現再次證實了 AI 技術並未如外界預期般遭遇瓶頸,而是沿著陡峭的成長曲線繼續攀升。這款新模型在推理、任務執行與自主代理能力上展現了顯著的進步,為未來的自動化工作與人機協作揭開了全新序幕。
Ecom-RLVE 是一個專為電子商務對話 Agent 設計的自適應可驗證環境。它解決了電商 AI 難以在動態場景下評估與確保合規性的痛點。透過模擬多樣化的用戶行為與後台 API,並結合自動驗證機制,開發者能更安全地訓練與測試具備工具調用能力的電商 Agent。
IBM Research 於 Hugging Face 發表全新基準測試「VAKRA」的分析報告。該測試專為評估 AI Agent 的核心能力而設計,著重於複雜的多步驟推理與動態工具調用。研究不僅評估了主流模型在 Agent 任務中的表現,更系統化地歸納出 Agent 的各類失敗模式(如工具誤用、推理漂移等),為開發者優化 Agent 系統提供關鍵指引。
由前 DeepMind 團隊創立的法國 AI 新創 HCompany 宣布推出 AI 瀏覽器助手「HoloTab」。這款工具旨在將 AI 代理(Agent)能力直接帶入瀏覽器中,不僅能進行網頁摘要,更主打強大的網頁自動化操作。透過 HCompany 旗下的動作模型(Action Models),HoloTab 能協助使用者自動執行複雜的跨網頁任務,重新定義人機協同的瀏覽體驗。
本期 Import AI 深入探討三個核心議題:首先是 AI Agent 在面對惡意輸入與複雜環境時的脆弱性與破解方法;其次介紹了代碼生成領域的新技術或基準測試 MirrorCode;最後,透過十種不同視角,探討人類因逐漸將決策權讓渡給 AI 系統而導致的「漸進式失權(Gradual Disempowerment)」風險,並以「火的發明是否等同於當時人類的奇點」進行哲學反思。
Vercel 宣布推出「Agentic Infrastructure」(Agent 基礎設施),旨在解決傳統無伺服器(Serverless)架構在運行 AI Agent 時面臨的超時、長連接與狀態管理等挑戰。透過升級的 Vercel AI SDK、支援長時間運行的 Vercel Functions 以及背景任務處理能力,開發者現在可以更輕鬆地在 Vercel 上部署、監控並擴展複雜的 AI Agent 工作流。
Vercel 宣布支援透過 AI Agent 與 CLI 來管理微前端(Microfrontends)架構。這項更新簡化了大型前端專案的分離與整合流程,開發者現在可以利用 AI 代理程式自動化執行微前端的配置、部署與協調工作。透過 CLI 的增強,團隊能更高效地維護複雜的多專案架構。
Jack Clark 在本期電子報中探討了三個核心議題:首先是「網路戰的縮放定律」,分析運算量提升如何改變攻防兩端的平衡;其次是「AI 自動化浪潮」對各行各業的實質滲透;最後則聚焦於「GDP 預測之謎」,探討現有經濟模型在評估 AI 帶來的革命性經濟影響時所面臨的侷限與衝突。
Google DeepMind 正式發表全新開源模型 Gemma 4。官方宣稱其為「同等參數規模下最強大的開源模型」,在智慧表現上達到新高度。該系列模型特別針對進階推理與自主 Agent 工作流進行優化,為開發者提供更高效、更具性價比的開源 AI 選擇。
著名 AI 學者 Ethan Mollick 指出,當前 AI 的底層能力已極為強大,但傳統的「對話框」限制了其潛力。他透過「Claude Dispatch」等新型態介面,強調「任務派遣與協調」將取代單純的提示詞對話。未來的 AI 應用關鍵不在於模型本身的升級,而在於如何設計出能讓 AI 自動化、多步驟協作的優秀工作流介面,讓人類從操作員晉升為調度者。
本案例研究探討創意 AI 代理「FLORA」如何基於 Vercel 的 AI 技術棧(包括 Vercel AI SDK 與 Next.js)進行開發與部署。文章解析了 FLORA 如何利用 Vercel 的邊緣運算與 AI SDK 的 Tool Calling 功能,實現低延遲的 AI 互動,並打造流暢的創意生成體驗,為開發者提供實用的 Agent 部署架構參考。
知名 AI 科技週報《Import AI》第 451 期聚焦三大前沿議題。首先探討「政治超智慧」對人類社會與民主體制的衝擊,並提出科技是否已無法收回的詰問;其次介紹 Google 借鑑閔斯基理論的「心智社會」多智慧體協作研究,展示群體 AI 解決複雜問題的潛力;最後則分享了結合強化學習與精準物理控制的機器人鼓手技術。
Vercel 針對日益普及的 AI Agent 開發提出「Agent responsibly」倡議。文章聚焦於開發者在部署 Agent 時面臨的挑戰,包括無限循環、高昂成本、安全漏洞(如提示詞注入)以及用戶隱私問題。Vercel 結合其 AI SDK 與平台特性,提供了防護欄(Guardrails)、速率限制、可觀測性等實用解決方案,幫助開發者構建既強大又安全的 Agent 應用。
Vercel 發表最新技術實踐,揭露他們如何利用 AI Agent 來優化其熱門 Monorepo 工具 Turborepo。透過在隔離的沙盒環境中運行 Agent 進行程式碼重構與效能瓶頸分析,並結合人類工程師的最終審查(Human-in-the-loop),成功讓 Turborepo 的特定關鍵路徑或建置速度提升了 96%。這展示了 AI 代理在實際大型開源專案重構與效能調優中的巨大潛力。
本文探討如何「解放」開源 CLI 開發 Agent 工具 OpenClaw。隨著類似 Claude Code 的終端機 Agent 工具興起,Hugging Face 介紹了如何將 OpenClaw 與 Llama、Qwen 等開源模型整合。透過 Hugging Face 的推論 API 或本地部署,開發者可以不再受限於單一閉源 API,實現高自由度、低成本且隱私安全的自主開發流程。
Vercel 宣布其 Sandbox(沙盒環境)正式推出「自動持久化(Automatic persistence)」Beta 版。此功能解決了過去沙盒環境在執行完畢後即銷毀、無法保留狀態的痛點。現在,沙盒中的檔案修改、安裝的套件與執行狀態將會自動保存,讓開發者在構建 AI Agent、動態程式碼執行或互動式開發工具時,能擁有更連貫且高效的體驗。
Vercel 宣布其 Chat SDK(AI SDK)現已支援排程發送 Slack 訊息。這項更新讓開發者能夠更輕鬆地為 AI 助理或 Agent 整合時間排程功能,在指定時間向 Slack 頻道或用戶發送通知。這對於需要非同步跟進、定時匯報或自動化工作流的 AI 應用場景非常實用,免去了開發者自行架設複雜排程系統的麻煩。