Google DeepMind 發表全新世界模型 Genie 3,為生成式 AI 領域帶來重大突破。該模型能以每秒 24 幀(fps)的即時速度,生成可供用戶自由導航與互動的動態虛擬世界。Genie 3 不僅支援 720p 的高解析度,更能在長達數分鐘的互動過程中,保持場景與物理邏輯的高度一致性,這將為未來的遊戲開發、虛擬實境以及 AI 代理(Agents)的模擬訓練開闢全新途徑。
Google DeepMind 發表全新生物聲學模型「Perch」,旨在協助保育人士快速分析野外錄音。該模型能自動識別夏威夷蜜旋木雀等瀕危鳥類及珊瑚礁生態系統的聲音,大幅縮短人工監聽時間。這項技術讓科學家能在大範圍內進行長期的生態監測,為全球生物多樣性保護提供關鍵支持。
Google DeepMind 介紹了 AI 在宇宙學與天文物理學中的前沿應用。面對新一代望遠鏡帶來的龐大觀測數據,傳統計算方法已達瓶頸。DeepMind 透過深度學習與神經網路,不僅能將複雜的宇宙演化模擬加速數萬倍,還能精確分析重力透鏡效應以繪製暗物質分佈地圖,為科學家探索宇宙奧秘提供強大工具。
Google DeepMind 發表最新突破,旗下 Gemini 2.5 Deep Think 模型在國際大學生程式設計競賽(ICPC)世界總決賽中展現出金牌等級的表現。這項成就代表 AI 在抽象問題解決、複雜演算法設計與程式碼除錯能力上取得了巨大飛躍。該模型透過深度思考與自我修正機制,成功攻克了原本只有全球頂尖人類程式設計師才能解決的難題。
Google DeepMind 發表最新研究,展示如何利用 AI 技術尋找流體力學中的新解。該方法針對描述流體運動的百年難題(如 Navier-Stokes 方程與湍流現象),透過結合深度學習與物理模擬,成功加速尋找「確切相干態(ECS)」等關鍵結構。這項突破將有助於數學、物理與工程學界攻克長期未解的複雜流體控制與預測挑戰。
Hugging Face 旗下的開源機器人學習庫 LeRobot 迎來 v0.4.0 重大更新。本次版本專注於降低機器人 AI 的開發門檻,優化了從資料收集、模型訓練到實體部署的完整工作流。新版本擴展了對多種平價開源硬體的支援,並加強了與 Hugging Face Hub 的整合,讓開發者能更輕鬆地共享機器人資料集與預訓練模型,加速機器人領域的開源生態發展。
Google DeepMind 宣布更新並強化其「前沿安全框架」(Frontier Safety Framework, FSF)。該框架是 DeepMind 用於預防先進 AI 模型引發極端風險的核心機制。本次強化重點在於提升對模型潛在危害(如網路安全、生物安全及自主複製等)的偵測與評估能力,並建立更明確的預警與緩解機制,以確保前沿技術在安全可控的範圍內發展。
Google DeepMind 發表 Gemini Robotics 1.5,旨在將 AI Agent 的能力帶入實體世界。透過此系統,機器人將具備更強大的環境感知、多步驟任務規劃、邏輯思考、工具使用以及實體行動能力。這項進展代表著「實體代理(Physical Agents)」時代的開啟,能更有效率地解決現實世界中複雜且多步驟的實體任務。
Google DeepMind 發表全新 AI Agent「CodeMender」,旨在解決軟體安全中的關鍵漏洞修復難題。CodeMender 不僅能自動偵測程式碼中的安全漏洞,還能主動生成修復補丁並進行驗證。這項技術結合了先進的大型語言模型與自動化測試,大幅提升了軟體開發生命週期中的安全性與修復效率。
Google DeepMind 宣布與麻省理工學院衍生企業 Commonwealth Fusion Systems (CFS) 展開合作。雙方將結合 DeepMind 的強化學習(RL)與 AI 模擬技術,以及 CFS 的高磁場托卡馬克裝置 SPARC,共同解決核融合反應爐中超高溫電漿控制的難題,加速商業化核融合能源的到來。
Google 正式在 Gemini 應用程式中為 Google AI Ultra 訂閱者推出「Deep Think」深度思考功能。此外,Google 也向特定的數學家開放了曾參加國際數學奧林匹亞(IMO)競賽的 Gemini 2.5 Deep Think 完整版模型,讓專業人士能體驗其強大的數學推理能力。
Google DeepMind 發表全新開源平台「Game Arena」,旨在解決傳統 AI 基準測試逐漸失效的問題。該平台讓不同的前沿 AI 模型在具有明確勝負規則的遊戲環境中進行直接對決。透過這種動態且具對抗性的方式,Game Arena 能更精準、客觀地評估 AI 的決策與推理能力,為 AI 領域提供更具公信力的衡量標準。
Google DeepMind 宣布在 Gemma 3 工具包中加入全新成員「Gemma 3 270M」。這款僅有 2.7 億(270M)參數的極致輕量級模型,專為需要超高效率、低延遲以及資源受限的邊緣設備(On-device)運算場景所設計,為開發者在極端硬體限制下部署 AI 提供了全新的高效能選擇。
Google DeepMind 宣布 Gemini 應用程式中的原生圖片編輯功能迎來重大升級。用戶現在可以直接在 Gemini 介面中,以更強大且直覺的新方式調整與轉換圖片。此更新簡化了過去繁瑣的修改流程,讓創作者與一般用戶能更輕鬆地進行局部修改、物件增減或背景調整,大幅提升圖像創作的效率。
Google DeepMind 發表了 VaultGemma,這是全球首款從頭開始(from scratch)使用差分隱私(Differential Privacy, DP)技術訓練的高性能大語言模型。透過嚴格的數學隱私保證,VaultGemma 能有效防止訓練數據洩露與敏感資訊記憶,同時在多項基準測試中保持極高的實用性,為醫療、金融等高隱私需求領域帶來全新突破。
Google DeepMind 發表全新的 Gemini 2.5 Computer Use 專用模型,目前已透過 API 提供預覽。該模型基於 Gemini 2.5 Pro 的強大能力進行微調,旨在賦能 AI 代理(Agents)直接與作業系統及應用程式的用戶介面(UI)進行互動。這項技術將加速自動化工作流程的開發,讓 AI 能夠像人類一樣執行點擊、輸入和導覽等電腦操作。
Google DeepMind 宣布推出其旗艦級影片生成模型的最新版本 Veo 3.1。本次升級的核心重點在於賦予使用者更強大的「創意控制力」,讓創作者能更精準地引導視覺風格、鏡頭運動與畫面細節。這項更新旨在解決 AI 影片生成中常見的隨機性問題,標誌著 AI 影片技術向專業工作流邁出的重要一步。
Google DeepMind 宣布推出一款基於 Gemma 開源模型家族、擁有 270 億參數的全新單細胞分析基礎模型。該模型專為生物醫學研究設計,能深入分析單細胞數據,並已成功協助研究人員發現了一條全新的潛在癌症治療途徑,展現了開源大模型在生醫領域的巨大潛力。
Vercel 正式推出 Workflow 開發套件(WDK),旨在解決 Serverless 架構中常見的執行逾時與狀態管理挑戰。開發者可以使用簡單的程式碼定義多步驟工作流,並享有內建的自動重試、步驟間狀態持久化以及長達數天的延遲執行功能。這項新工具非常適合用於構建複雜的 AI Agent、自動化訂閱流程或需要多階段處理的背景任務。
Vercel 宣布在其 Marketplace 中正式引入 AI Agent 與相關服務專區。開發者現在可以更輕鬆地發現並整合各類 AI 工具(如向量資料庫、LLM API、Agent 框架與監控工具)至其 Vercel 專案中。此更新不僅支援自動配置環境變數,還提供統一帳單管理,免去多個平台付費的繁瑣流程,大幅簡化了構建 AI 應用程式的開發體驗與基礎設施管理。
Vercel 宣布在其 Marketplace 中引入 AI Agent 與 AI 服務。開發者現在可以直接在 Vercel 平台中發現、安裝並管理各種 AI 代理工具、向量資料庫及 LLM 監控服務。這項更新簡化了 AI 應用的基礎設施配置,讓開發者能更專注於構建 AI 驅動的 Next.js 應用。
Vercel 宣布「Agent Investigations」正式進入公開測試(Public Beta)。這項新功能旨在利用 AI 代理(AI Agents)技術,自動化分析應用程式的錯誤日誌、效能瓶頸與部署歷史。開發者無需手動比對大量數據,AI 即可自動追蹤問題根源並提供修復建議,大幅縮短故障排除時間(MTTR)。
Vercel 宣布在 Vercel AI Cloud 上推出「免設定後端(Zero-config Backends)」功能。此更新旨在簡化 AI 應用的後端部署,開發者只需專注於編寫 AI 邏輯,系統會自動處理伺服器配置、環境變數與 API 路由。該功能與 Vercel AI SDK 深度整合,大幅降低了建構高效能、具備串流與代理功能之 AI 應用的門檻。
Vercel 發表最新技術觀點,指出開發 AI Agent 不需要引入複雜的第三方 Agent 框架。透過 Vercel AI SDK 的 maxSteps 與 Tool Calling 功能,結合 Serverless 函數,開發者就能輕鬆構建具備自主決策能力的 Agent。本文強調「極簡主義」的開發流程,並分享如何在 Serverless 環境中克服超時限制、管理狀態,讓 Agent 應用快速上線。
Vercel 發表全新 AI 協作工具「Vercel Agent」,旨在成為開發者的虛擬隊友。它能直接整合至 Vercel 工作流中,自動分析建置日誌、診斷部署錯誤,並針對效能瓶頸提供即時優化建議。這項工具將大幅降低 DevOps 的維護門檻,提升開發者的生產力。
Vercel 正式將開源工作流開發套件 (Workflow Development Kit) 推向公開測試。該套件旨在解決 Serverless 環境下長耗時任務易超時的痛點,讓開發者能以程式碼定義多步驟、具容錯能力且可中斷重試的工作流。這項工具特別適合用於構建複雜的 AI Agent 運作流程、定時任務與自動化管道,並能與 Vercel 平台無縫整合。
Vercel 宣布推出官方 Python SDK 測試版(Beta),為 Python 開發者提供原生支援。開發者現在可以使用 Python 更輕鬆地與 Vercel API 進行互動、管理專案與部署,並整合 Vercel 的各項雲端服務。這項更新將有助於使用 FastAPI、Flask 或進行 AI/LLM 開發的 Python 工程師更無縫地融入 Vercel 生態系。
Hugging Face 正式推出 OpenEnv 計劃,旨在解決 AI Agent 在執行任務時面臨的環境不一致與安全隱憂。OpenEnv 提供了一個標準化、安全隔離的沙盒環境,讓 Agent 能安全地執行程式碼、操作檔案與進行網頁互動。此舉將促進開源社群在 Agent 評估與部署上的協作,共同打造更安全且一致的開放 Agent 生態系統。
Vercel 宣布推出全新的「Turbo Build Machines」,旨在為開發者提供更快的專案構建與部署體驗。此更新升級了底層的構建基礎設施,提供更高規格的運算資源,特別適合大型或複雜的前端專案。透過更強大的硬體與優化的快取機制,開發者將能顯著減少等待構建完成的時間,進而提升整體的開發與迭代效率。
Hugging Face 與知名安全平台 VirusTotal 展開合作,旨在提升開源 AI 生態系的安全性。雙方將針對託管在 Hugging Face 上的模型進行深度安全掃描,特別是防範利用 PyTorch pickle 格式等漏洞傳播的惡意代碼。此舉將幫助開發者更安全地下載與部署開源模型,降低供應鏈攻擊風險。