AI 新創公司 Anthropic 傳出營收迎來爆發性成長,目前正進行新一輪融資,估值直逼 1 兆美元,有望超越 OpenAI 成為全球最貴的 AI 新創。據悉,包含矽谷創投巨頭 Peter Thiel 旗下的 Founders Fund 以及 General Catalyst 等既有投資人均計劃參與此次投資,顯示市場對其技術與商業化前景的高度信心。
本期 Latent Space 探討了 AI 產業的重大範式轉移:各大頂尖模型實驗室已不再單純追求基礎 LLM 的參數規模,而是全面轉向「Agent(智慧代理)」的開發。隨著純模型微調的邊際效應遞減,透過讓 AI 具備操作電腦、自主規劃與執行多步驟任務的能力,已成為當前競逐的新戰場。
Simon Willison revisited pydantic-monty, a sandboxed subset of Python implemented in Rust. He asked Claude Code to inspect the most recent release, following his earlier exploration a few months ago. The key finding is that limits for execution duration, memory, allocations, and recursion depth all appear to behave as advertised.
Simon Willison announced the first release of Datasette Agent, merging his 'llm' Python library with Datasette. The tool provides a conversational interface to query SQLite databases, with plugin support for generating charts and running code in sandboxes. It runs efficiently on lightweight models like Gemini 3.1 Flash-Lite and supports local open-weight models via LM Studio.
根據 SpaceX 最新提交的 S-1 上市招股書,該公司已與 AI 巨頭 Anthropic 簽署雲端服務協議。Anthropic 將自 2026 年 5 月起至 2029 年 5 月,每月支付高達 12.5 億美元以租用 Colossus 與 Colossus II 超級電腦的算力。此外,招股書也證實 xAI 的 Grok 5 目前正於 Colossus II 進行訓練。
Google 在 I/O 大會上正式推出 Gemini 3.5 Flash,跳過預覽版直接進入一般可用階段,並將全面導入 Google 搜尋、Gemini App 及開發者平台。然而,新模型的 API 價格大幅上漲,輸入與輸出費用分別為每百萬代幣 1.5 美元與 9 美元,是前代 Flash 預覽版的 3 倍,顯示出各大 AI 廠商正開始測試市場對高定價的接受度。
Vercel 更新其 Nuxt MCP Toolkit,新增對 MCP (Model Context Protocol) 應用程式的支援。這項更新讓開發者能更輕鬆地將 Nuxt 專案轉化為可供 AI 代理(如 Claude)直接讀取與互動的 MCP 服務,大幅降低了在 Vue/Nuxt 生態系中建構 AI 驅動應用的門檻。
Simon Willison 在 PyCon US 2026 的 5 分鐘閃電演講中,回顧了自 2025 年 11 月以來的 LLM 關鍵進展。他指出這半年間「最強模型」在三大巨頭間易手五次(包含 GPT-5.1、Gemini 3 與 Claude Opus 4.5)。最重要的是,得益於可驗證獎勵的強化學習(RLVR),程式碼生成 Agent(如 Claude Code)已跨越實用門檻,成為開發者的日常主力工具。
Vercel 推出新功能,允許開發者在 Vercel Sandbox 中運行 Claude 託管型 Agent (Claude Managed Agents)。 此整合為 Claude Agent 提供了一個安全、隔離且完全託管的沙盒環境,用於執行動態程式碼或敏感任務。 開發者可以更輕鬆地構建具備程式碼執行能力的 AI 應用,無需自行維護複雜的安全沙盒基礎設施。
Hugging Face 與 IBM Research 合作發表「Open Agent Leaderboard」,這是一個專為 AI 智能體(Agent)設計的全新開源排行榜。傳統的 LLM 評測難以衡量模型在實際任務中的多步驟規劃與工具調用能力,該排行榜整合了多個主流 Agent 評測集,提供客觀、標準化的評估標準,推動開源 Agent 生態系的發展。
Anthropic 旗下熱門命令列 AI 助手 Claude Code 的產品主管 Cat Wu 近日接受專訪。她透露團隊在開發這款 Agent 工具時「沒有宏偉的藍圖」,而是採取刻意為之的靈活迭代策略。訪談重點圍繞在開發者最關心的 API 使用額度與成本限制、如何透過高透明度介面建立信任,以及如何利用「精簡測試架構(lean harness)」在不犧牲效能的前提下,優化 Agent 的執行效率與準確度。
知名開發者 Simon Willison 推出了一款全新的線上 QR Code 產生器工具。該工具完全是在 Claude 的協助下開發完成,不僅支援一般的文字與網址轉換,還能針對 WiFi 網路(包含 SSID、密碼與加密類型)生成一鍵掃描連線的 QR Code。使用者還能自訂樣式、外框、大小與顏色,是 AI 輔助開發的實用範例。
本期 AINews 聚焦於 AI 寫程式 Agent 的長期發展趨勢。Anthropic 開始針對 Claude 的程式化使用(Programmatic Usage)進行計量與限制,這將直接影響開發者透過自動化腳本或第三方工具調用 Claude 的成本。另一方面,Codex 相關的自動化編程 Agent 影響力持續上升,顯示出 AI 在軟體開發流程中的滲透率正穩定增加。
在一個相對平靜的新聞日,Latent Space 帶領讀者反思「微調(Fine-tuning)的終結」這一命題。 隨著長上下文視窗、高效 RAG 以及上下文內學習(In-context Learning)的成熟,許多原本需要微調的場景已被取代。 未來微調可能退化為僅用於調整輸出格式、風格或進行模型蒸餾的工具,而非首選的知識注入手段。
Vercel 宣布其 AI Gateway 正式支援 Opus 4.7 模型的「快速模式」(Fast Mode)。此功能旨在為開發者提供更低的 API 延遲與更快的響應速度,非常適合需要即時互動的 AI 應用場景。開發者現在可以透過 Vercel AI Gateway 輕鬆啟用此模式,在維持 Opus 4.7 強大推理能力的同時,顯著提升終端用戶的使用體驗。
Vercel 針對其 AI 基礎建設推出「AI Gateway 生產環境指標」(AI Gateway production index)。此功能旨在幫助開發者在生產環境中,更精準地監控、索引與分析 LLM 的調用數據(如延遲、成本與錯誤率)。透過此指標,團隊能有效評估不同 AI 網關與模型的實際表現,進而優化 Serverless 環境下的 AI 應用效能。
本文介紹 Superset 如何在 Vercel 平台上構建專為 AI Agent 設計的整合開發環境 (IDE)。Superset 利用 Vercel AI SDK 簡化多模型對接,並透過 Next.js App Router 與 Serverless Functions 處理複雜的代理人工作流與工具調用。透過 Vercel 的全球邊緣網路,他們成功解決了 Agent 運作時的即時狀態同步與高延遲問題,為開發者提供流暢的協作體驗。
本文探討了當前科技經濟中極具對比的「雙軌分歧」現象。一方面,多數科技企業正經歷超過 10% 的裁員潮與預算緊縮;另一方面,以 Anthropic 為首的頂尖 AI 公司卻以每年 10 倍的速度瘋狂成長。這種資金與人才高度向生成式 AI 領域集中的現象,正劇烈重塑科技產業的就業與發展版圖。
根據 Latent Space 報導,Anthropic 與 xAI 達成一項歷史性的算力租賃協議。Anthropic 將以每年 50 億美元的價格,租用 xAI 旗下 Colossus I 超級電腦叢集高達 300MW 的電力容量。這項交易不僅代表著 AI 算力市場的版圖重組,也讓相關實體的年化經常性收入(ARR)呈現驚人的 8000% 爆發式成長,顯示出前沿模型對算力的極度飢渴。
近期 AI 業界出現將「知識蒸餾(Distillation)」稱為「蒸餾攻擊(Distillation attacks)」的趨勢。 這反映了閉源模型廠商(如 OpenAI、Anthropic)面對開源模型透過合成數據快速追趕時的焦慮。 作者 Nathan Lambert 指出,將這種行之有年的機器學習技術與商業競爭行為「安全化(securitize)」,試圖將其塑造成惡意網路攻擊,是非常糟糕且誤導的術語,旨在為法律訴訟或技術封鎖鋪路。
Vercel 發表了 2026 年 AI 加速器(AI Accelerator)的官方回顧。本屆計劃聚焦於協助早期 AI 新創將創意轉化為生產級應用,重點展示了多個在 AI Agent、多模態互動及邊緣運算領域取得突破的團隊。文章總結了入選項目的技術亮點,並強調了 Vercel AI SDK 與 Next.js 在現代 AI 開發堆疊中的核心地位。
本文探討了比較開源(如 Llama)與閉源(如 GPT、Claude)模型時,過度依賴單一評估指標(如 MMLU 或 Arena Elo)的盲點。作者指出,基準測試受提示詞敏感度、測試集污染及後訓練(Post-training)策略影響極大。未來,隨著推理期計算(Inference-time compute)與 Agent 應用的興起,評估模型性能的維度將發生根本性轉變。
本文介紹 AI 新創公司 Zo Computer 如何利用 Vercel 平台與 AI SDK 解決 LLM 不穩定與延遲問題。他們透過部署 Edge Functions 實現低延遲串流、建立多模型備援(Fallback)與自動重試機制,並結合完善的遙測(Telemetry)監控,最終將系統可靠性顯著提升 20 倍,為 AI 應用開發者提供極佳的架構實踐範例。
Vercel 宣布其 AI Gateway 正式支援 Anthropic 的最新旗艦模型 Claude 4.7 Opus。開發者現在可以透過 Vercel 的統一 API 網關輕鬆調用此模型,並享有內建的邊緣快取、速率限制、彈性重試以及詳細的用量分析功能。這項更新將大幅降低開發者在構建高效能、高可靠性 AI 應用程式時的基礎設施管理成本。
知名 AI 學者 Nathan Lambert 針對 2026 年年中的開源模型發展提出預測。他指出,開源與閉源模型之間的差距(Open-Closed Gap)正從「基礎預訓練能力」轉移到「推理期計算(Inference-time compute)」與「代理(Agent)可靠性」。雖然 Meta 的 Llama 4 等開源模型將持續逼近閉源旗艦,但閉源廠商憑藉龐大算力與專有強化學習(RL)架構,在複雜多步驟任務上仍將保持領先。
本文探討了 AI 領域中圍繞 Anthropic Claude 所建立的「安全神話」,以及輿論對開源權重(open-weight)模型安全性的過度恐慌。作者 Nathan Lambert 指出,這種將開源模型視為重大威脅的論調缺乏實質依據,往往只是閉源陣營或特定政策倡導者重複上演的「開源恐懼之舞」。他呼籲大眾與決策者應理性看待開源的實際風險與巨大價值,避免因不理性的恐懼而扼殺創新。
Vercel 於 Changelog 宣布,其 AI Gateway 已正式支援 Anthropic 旗下 Claude 4.6 Opus 模型的「Fast Mode(快速模式)」。這項更新讓開發者在透過 Vercel 部署 AI 應用時,能以更低的延遲調用這款旗艦級模型。此舉將有助於提升需要即時回應的複雜 AI 代理(Agents)與對話應用的效能與使用者體驗。
Vercel 於 Changelog 宣布,開發者現在可以使用 Nuxt 框架來構建並部署 MCP(Model Context Protocol)伺服器。透過 Nuxt 的 Nitro 伺服器引擎與 Vercel 的 Serverless 環境,開發者可以利用 SSE(Server-Sent Events)傳輸協定,快速將自訂的資料來源與工具連接至 Claude 等 AI 代理,大幅降低了前端與全端開發者進入 AI 工具生態系的門檻。
著名 AI 學者 Ethan Mollick 指出,當前 AI 的底層能力已極為強大,但傳統的「對話框」限制了其潛力。他透過「Claude Dispatch」等新型態介面,強調「任務派遣與協調」將取代單純的提示詞對話。未來的 AI 應用關鍵不在於模型本身的升級,而在於如何設計出能讓 AI 自動化、多步驟協作的優秀工作流介面,讓人類從操作員晉升為調度者。
本案例研究探討創意 AI 代理「FLORA」如何基於 Vercel 的 AI 技術棧(包括 Vercel AI SDK 與 Next.js)進行開發與部署。文章解析了 FLORA 如何利用 Vercel 的邊緣運算與 AI SDK 的 Tool Calling 功能,實現低延遲的 AI 互動,並打造流暢的創意生成體驗,為開發者提供實用的 Agent 部署架構參考。