Vercel 宣布推出「skills」,這是一個專為 AI Agent 設計的開放式技能生態系統。開發者可以透過此平台輕鬆定義、發布並重用各種 Agent 技能(如 API 呼叫、數據庫查詢等),並與 Vercel AI SDK 無縫整合。這項舉措旨在簡化 AI 代理的工具調用(Tool Calling)流程,建立一個標準化且社群驅動的 Agent 能力庫。
Microsoft 於 Hugging Face 發表 Differential Transformer V2(Diff-Transformer V2)。延續 V1 透過雙注意力地圖相減來消除雜訊的設計,V2 重點解決了計算與記憶體開銷問題。新版本引入了高度優化的 CUDA 核心與 FlashAttention 整合,並釋出預訓練模型與 Hugging Face 整合,讓開發者能以更低成本部署具備強大長文本與抗噪能力的模型。
遊戲與 AI 研發團隊 Overworld 在 Hugging Face 上推出了「Waypoint-1」。這是一項突破性的即時互動式影片擴散(Interactive Video Diffusion)技術,允許使用者透過即時輸入來引導和改變影片生成內容。這項技術展示了「世界模型(World Models)」在未來遊戲開發、虛擬環境模擬與即時互動生成藝術中的巨大潛力。
Vercel 官方宣佈在其 AI Gateway 中新增對 Recraft 圖像生成模型的支援。開發者現在可以透過 Vercel 的統一接口,輕鬆調用 Recraft 強大的向量圖與點陣圖生成能力。此更新讓開發者能結合 Vercel AI Gateway 的快取、監控與負載平衡功能,更穩定、高效地構建 AI 圖像生成應用與設計工具。
Google DeepMind 發表全新技術「D4RT」,成功將動態三維空間與時間(4D)的重建與追蹤整合。相較於以往技術,D4RT 實現了高達 300 倍的運算加速。這項突破不僅能讓 AI 更精準地理解動態物理世界,也將大幅推進自動駕駛、機器人互動及 AR/VR 領域的發展。
Vercel 宣布推出「隨選 Vercel Agent 程式碼審查(On-demand Vercel Agent code reviews)」功能。開發者現在可以根據需求,在特定時刻主動觸發 Vercel 的 AI Agent 來審查程式碼,而不需要每次提交都自動執行。這項更新賦予開發團隊更高的控制權,能有效優化開發流程並節省 AI 運算資源。
Vercel AI Gateway 正式支援 OpenResponses API 標準。這項更新允許開發者將符合該 API 規範的 AI 請求透過 Vercel Gateway 進行路由,從而輕鬆獲得自動重試、邊緣快取、速率限制(Rate Limiting)以及詳細的用量分析。這對於使用開源模型或自託管 LLM 的開發者來說,能大幅簡化多模型管理與效能優化的流程。
Vercel 宣布與 AWS 深度整合,將 AWS 資料庫服務引入 Vercel Marketplace 與 AI 網頁生成工具 v0。開發者現在可以直接在 Vercel 控制台快速佈署與管理 AWS 資料庫。同時,v0 也支援自動生成包含 AWS 資料庫連接與架構的完整前後端代碼,大幅降低全端開發門檻。
Vercel AI Gateway 新增對 Perplexity Web Search 的支援。開發者現在可以透過 Vercel 的 AI 閘道器,輕鬆呼叫 Perplexity 的即時網頁搜尋能力,並享有 AI Gateway 提供的快取、速率限制、監控與分析等功能。這將有助於降低搜尋 API 的調用成本,並提升 RAG 應用的開發效率。
Vercel 宣布其 AI Gateway 現在支援將 Perplexity Web Search 整合至任何模型中。開發者不再受限於特定模型,即可在 API 呼叫中無縫加入即時網頁搜尋結果作為上下文。這項更新大幅簡化了 RAG(檢索增強生成)與即時搜尋應用的實作流程,提升了應用的資訊時效性。
Vercel 發布全新「AI Voice Elements」,旨在幫助前端開發者輕鬆建立語音 AI 互動介面。這套工具提供開箱即用的 React 組件(如語音波形圖、麥克風按鈕)與狀態管理 Hook,並與 Vercel AI SDK 深度整合。開發者能藉此快速對接 OpenAI Realtime API、ElevenLabs 等主流語音服務,大幅降低構建即時語音應用的門檻。
知名 AI 政策專家 Jack Clark 在最新一期電子報中提出三個核心觀點:首先是「紅皇后 AI」,指出 AI 的攻防與演化正陷入不斷奔跑才能維持原狀的競爭;其次是「AI 監管 AI」,隨著 AI 產出速度超越人類極限,未來必須依賴 AI 進行自動化合規與監管;最後是「O型環自動化」,探討在高度自動化的工作流中,最脆弱的單一環節將決定整個系統的成敗。
Vercel 宣布其「網頁介面指南 (Web Interface Guidelines)」現已可作為 Agent 指令使用。這項更新讓開發者在使用 AI 編碼助手(如 v0、Cursor 等)時,能直接透過指令讓 AI 遵循 Vercel 推薦的網頁設計與開發最佳實踐。這不僅能提升 AI 生成程式碼的品質,還能確保介面在無障礙設計與效能上符合高標準。
影片處理與 AI 分析(如語音轉文字、自動摘要)通常耗時且容易在 Serverless 環境中因超時而中斷。Mux 透過其全新的 @mux/ai SDK,展示了如何結合 Vercel 的基礎設施,構建出「持久性(Durable)」的影片工作流。這套方案解決了長影片處理的狀態保存與自動重試難題,讓開發者能以極低的維護成本,在 Serverless 架構下穩定運行複雜的影片 AI 任務。
Vercel 宣布其 AI 程式碼審查工具「Vercel Agent」現在能夠遵循用戶自訂的程式碼規範(Code Guidelines)。開發者可以透過設定,為 AI 審查注入團隊專屬的編碼風格、架構設計原則或特定套件使用偏好。這項更新能大幅減少 AI 審查時產生的無效建議,讓 Pull Request 的自動化審查更貼近團隊的實際開發標準。
NVIDIA 於 Hugging Face 宣布推出 Cosmos Reason 2 模型,專為「物理 AI(Physical AI)」與具身智能設計。該模型結合了先進的推理機制,使機器人與自主系統能更深層地理解物理規律、進行複雜的空間時間規劃。此模型的發布將大幅降低開發者構建具備物理常識與決策能力 AI 應用的門檻。
本期 Import AI 439 聚焦於三大前沿議題:首先是優化底層運算的 AI 內核(Kernels)技術;其次是因應算力瓶頸而興起的去中心化 AI 訓練方法;最後是跨模態的通用表徵研究。此外,專欄也以哲學視角探討了未來的超級智能(ASI)可能會如何在高度抽象的向量空間中,建構與理解人類所謂的「靈魂」。
阿聯酋技術創新研究所(TII)於 Hugging Face 宣布推出全新「Falcon-H1-Arabic」模型。該模型專為阿拉伯語設計,旨在突破現有技術瓶頸。其最大亮點在於採用了「混合架構(Hybrid Architecture)」,預期將在運算效率與語言理解上帶來顯著提升,為開源社群提供強大的多語言支援。
Hugging Face 宣布與 NVIDIA 合作,將 NVIDIA 全新的 DGX Spark 運算平台與 Pollen Robotics 的 Reachy Mini 機器人進行深度整合。此合作旨在降低具身智能(Embodied AI)的開發門檻,讓開發者能透過 Hugging Face 的 LeRobot 開源機器人框架,輕鬆將 AI 代理(Agents)部署至實體硬體,實現具備物理互動能力的實體 AI 應用。
許多企業的內部工具(如後台、儀表板)常因缺乏維護、套件過期及糟糕的 UX 而逐漸被棄用。Vercel 指出,傳統的低程式碼(Low-code)工具雖起步快,但長期維護與客製化困難。透過 Next.js 搭配 AI 輔助生成工具(如 v0),開發者能以極快速度用真實程式碼構建、部署並輕鬆維護美觀且安全的內部工具,徹底解決維護地獄。
Vercel 發表全新開源範例專案「Pixel Portraits」,這是一款能讓使用者生成 AI 像素風角色並製作成實體感交易卡牌(Trading Cards)的應用。該專案採用 Next.js、Vercel AI SDK 以及圖像生成模型,並搭配精美的 CSS 3D 翻牌特效。開發者可以透過此範例,學習如何整合多模態 AI、處理圖像生成工作流,以及在前端實現流暢的互動體驗。
本期 Import AI 聚焦於兩個核心議題:首先是「你就是你的對話歷史」,研究指出使用者的 LLM 對話紀錄具有高度獨特性,足以像指紋一樣識別個人身分並洩露隱私;其次是「網路安全能力過剩(Cyber Capability Overhang)」,指出當前 AI 模型可能已具備強大的網路攻擊潛力,只是因缺乏適當的鷹架工具(Scaffolding)或提示而尚未顯現,這種潛在威脅如同無聲的警報,隨時可能被觸發。
Vercel 宣布其 AI Gateway 正式支援 MiniMax M2.1 模型。開發者現在可以透過統一的 Gateway 介面呼叫 MiniMax M2.1,並直接享有 Vercel 提供的快取、限流、彈性重試與分析監控等功能。這項更新為需要高質量中文處理與多模態能力的開發者提供了更便利且穩定的部署選擇。
Vercel 宣布其 AI Gateway 正式支援智譜 AI 的 GLM-4.7 模型。 開發者現在可以透過 Vercel 的統一 API 介面,輕鬆將 GLM-4.7 整合至應用程式中。 此更新讓開發者能直接利用 Vercel AI Gateway 的快取、速率限制與監控功能,優化 GLM-4.7 的部署與營運。
沃頓商學院教授 Ethan Mollick 探討了 AI 發展的非線性特徵。他結合了著名的「崎嶇邊界(Jagged Frontier)」理論,並引入科技史學家 Thomas Hughes 的「反向突進(Reverse Salients)」概念,解釋為何強大的 AI 技術在實際應用中會遭遇瓶頸。Mollick 幽默地以虛構的「Nano Banana Pro」為例,說明解決特定工作流瓶頸的小型、專門化 AI 工具,其影響力往往大於一味追求強大卻泛用的通用大模型。
NVIDIA 與 Hugging Face 合作介紹「開放評測標準」,展示如何利用 NeMo Evaluator 工具對輕量級模型 Nemotron 3 Nano 進行系統化基準測試。此指南提供了一套可重現的評測食譜(Recipe),幫助開發者在邊緣設備或資源受限環境中,精確評估小模型的性能與偏差,推動開源社群的評測透明度。
IBM Research 宣佈在 Hugging Face 上推出 CUGA(可配置用戶引導代理)框架。CUGA 旨在簡化 AI Agent 的自定義與部署流程,讓開發者無需複雜的程式碼或微調,即可透過結構化配置引導 Agent 的行為與決策。此舉結合了 Hugging Face 的開源生態,將促進安全、可控的 Agentic AI 技術走向大眾化。
Vercel 官方發布 v0 提示詞(Prompt)最佳實踐指南。文章深入解析如何透過結構化描述、分步迭代、上傳設計截圖以及指定互動狀態,來引導 v0 生成精確且符合預期的 React、Tailwind CSS 與 shadcn/ui 組件。這份指南能幫助開發者與設計師大幅提升 UI 生成效率與程式碼品質。
Vercel 推出 v0 與 Notion 的整合功能,旨在簡化以 Notion 作為後端的應用程式開發。開發者現在可以利用 v0 的生成式 UI 能力,直接讀取 Notion 的資料庫與頁面結構,快速生成對應的 React 組件、儀表板或自定義工作流。這項更新大幅降低了將 Notion 數據可視化與建立內部工具的門檻。
Vercel 宣布其 AI 代理(Vercel Agent)現在可以自動為開發者的專案安裝並配置 Web Analytics(網頁分析)和 Speed Insights(效能洞察)。開發者無需再手動安裝套件或修改程式碼,即可輕鬆啟用這些監控工具,大幅提升開發效率與專案維護的便利性。