Hugging Face 宣布對其開源 `datasets` 庫的串流(Streaming)模式進行重大升級,效率提升達 100 倍。新版本優化了底層資料讀取架構,顯著降低了記憶體佔用並提高了 I/O 吞吐量。這讓開發者在訓練超大型模型時,無需事先下載數百 GB 的完整資料集,即可實現極速的即時資料餵送,解決了 GPU 因等待資料而閒置的痛點。
Hugging Face 官方 Python 庫 huggingface_hub 迎來 v1.0 穩定版。歷經五年的持續演進,該庫已成為全球開發者下載、上傳與管理開源模型及資料集的標準工具。v1.0 的推出象徵著 API 的高度穩定與成熟,承諾了更好的向後相容性,為未來的開源機器學習生態系奠定更堅實的基礎。
Google DeepMind 發表全新開源模型系列「T5Gemma」。不同於目前主流的 Decoder-only 架構,T5Gemma 採用經典的 Encoder-Decoder 架構,將 T5 的設計理念與 Gemma 的現代化技術結合。這為需要雙向上下文理解的任務(如翻譯、摘要、分類)提供了更高效且強大的新選擇。
Google DeepMind 宣布在 MedGemma 系列中推出全新的多模態模型,這是目前用於醫療 AI 開發最強大的開源模型。該系列基於 Gemma 架構構建,旨在協助醫療研究人員與開發者進行臨床問答、醫學影像分析等任務。透過開放權重,Google 期望能加速全球醫療 AI 的創新與安全應用。
Google DeepMind 發表了 Gemma 3n 的開發者指南。Gemma 3n 是專為那些協助塑造與改進 Gemma 模型的開發者社群所設計。此指南旨在幫助開發者更輕鬆地整合與應用此模型,延續了 Google 對於開源與開放權重(open-weights)AI 社群的承諾。
Google DeepMind 宣佈 Gemini 2.5 Flash-Lite 結束預覽階段,正式推出穩定版(GA)。這款主打高性價比的輕量級模型,在維持小體積與低成本的同時,依然提供極高的輸出品質。它完整繼承了 Gemini 2.5 家族的強大功能,包含 100 萬 token 的超長上下文視窗與多模態處理能力,非常適合開發者與企業用於需要大規模部署與快速響應的生產環境。
Google DeepMind 推出全新 AI 基礎模型 AlphaEarth Foundations,旨在解決地球觀測數據零散且格式不一的挑戰。該模型整合了數 PB 的衛星影像與地理空間數據,建立統一的數據表徵。這項技術將大幅提升全球地圖繪製、環境變遷追蹤及氣候監測的精度與效率,為科學研究與防災應用提供強大支援。
Vercel 宣布在其官方文檔(Vercel Docs)中正式上線 AI Chat 聊天功能。開發者現在可以直接在文檔頁面與 AI 助手對話,快速獲取程式碼範例、排查部署錯誤並解答技術疑問。此更新旨在提升開發者的閱讀與檢索效率,減少在繁雜文檔中搜尋解答的時間。
Vercel 宣布其 Web 應用程式防火牆(WAF)現在支援管理 Next.js 的 Server Actions。開發者可以直接在 Vercel Firewall 中針對 Server Actions 的 POST 請求設定安全規則與速率限制(Rate Limiting),有效防止惡意調用、DDoS 攻擊及資源濫用,進一步鞏固全端 Next.js 應用的安全性。
Google DeepMind 發表全新實驗性 AI 工具「Backstory」,旨在幫助使用者探索網路圖片的脈絡與起源。該工具能分析圖片的傳播歷史、原始出處及可能的修改痕跡,協助使用者在假訊息充斥的網路環境中辨識真偽。這項技術展現了多模態 AI 在提升數位素養與打擊不實資訊方面的潛力。
Google DeepMind 宣布,搭載全新「Deep Think」思考技術的進階版 Gemini 模型,在國際奧林匹亞數學競賽(IMO)的測試中正式達到了金牌得主的水準。這項突破展示了 AI 在處理極具挑戰性的代數、組合數學、幾何和數論等複雜推理問題上的巨大進步。此成果不僅是 AI 數學推理能力的里程碑,也代表著強化學習與系統化思考(System 2 thinking)在大型語言模型上的成功應用。
Google DeepMind 發表全新世界模型 Genie 3,為生成式 AI 領域帶來重大突破。該模型能以每秒 24 幀(fps)的即時速度,生成可供用戶自由導航與互動的動態虛擬世界。Genie 3 不僅支援 720p 的高解析度,更能在長達數分鐘的互動過程中,保持場景與物理邏輯的高度一致性,這將為未來的遊戲開發、虛擬實境以及 AI 代理(Agents)的模擬訓練開闢全新途徑。
Google DeepMind 發表最新突破,旗下 Gemini 2.5 Deep Think 模型在國際大學生程式設計競賽(ICPC)世界總決賽中展現出金牌等級的表現。這項成就代表 AI 在抽象問題解決、複雜演算法設計與程式碼除錯能力上取得了巨大飛躍。該模型透過深度思考與自我修正機制,成功攻克了原本只有全球頂尖人類程式設計師才能解決的難題。
Hugging Face 旗下的開源機器人學習庫 LeRobot 迎來 v0.4.0 重大更新。本次版本專注於降低機器人 AI 的開發門檻,優化了從資料收集、模型訓練到實體部署的完整工作流。新版本擴展了對多種平價開源硬體的支援,並加強了與 Hugging Face Hub 的整合,讓開發者能更輕鬆地共享機器人資料集與預訓練模型,加速機器人領域的開源生態發展。
Google DeepMind 宣布更新並強化其「前沿安全框架」(Frontier Safety Framework, FSF)。該框架是 DeepMind 用於預防先進 AI 模型引發極端風險的核心機制。本次強化重點在於提升對模型潛在危害(如網路安全、生物安全及自主複製等)的偵測與評估能力,並建立更明確的預警與緩解機制,以確保前沿技術在安全可控的範圍內發展。
Google DeepMind 發表 Gemini Robotics 1.5,旨在將 AI Agent 的能力帶入實體世界。透過此系統,機器人將具備更強大的環境感知、多步驟任務規劃、邏輯思考、工具使用以及實體行動能力。這項進展代表著「實體代理(Physical Agents)」時代的開啟,能更有效率地解決現實世界中複雜且多步驟的實體任務。
Google DeepMind 發表全新 AI Agent「CodeMender」,旨在解決軟體安全中的關鍵漏洞修復難題。CodeMender 不僅能自動偵測程式碼中的安全漏洞,還能主動生成修復補丁並進行驗證。這項技術結合了先進的大型語言模型與自動化測試,大幅提升了軟體開發生命週期中的安全性與修復效率。
Google DeepMind 宣布與麻省理工學院衍生企業 Commonwealth Fusion Systems (CFS) 展開合作。雙方將結合 DeepMind 的強化學習(RL)與 AI 模擬技術,以及 CFS 的高磁場托卡馬克裝置 SPARC,共同解決核融合反應爐中超高溫電漿控制的難題,加速商業化核融合能源的到來。
Google 正式在 Gemini 應用程式中為 Google AI Ultra 訂閱者推出「Deep Think」深度思考功能。此外,Google 也向特定的數學家開放了曾參加國際數學奧林匹亞(IMO)競賽的 Gemini 2.5 Deep Think 完整版模型,讓專業人士能體驗其強大的數學推理能力。
Google DeepMind 發表全新開源平台「Game Arena」,旨在解決傳統 AI 基準測試逐漸失效的問題。該平台讓不同的前沿 AI 模型在具有明確勝負規則的遊戲環境中進行直接對決。透過這種動態且具對抗性的方式,Game Arena 能更精準、客觀地評估 AI 的決策與推理能力,為 AI 領域提供更具公信力的衡量標準。
Google DeepMind 宣布在 Gemma 3 工具包中加入全新成員「Gemma 3 270M」。這款僅有 2.7 億(270M)參數的極致輕量級模型,專為需要超高效率、低延遲以及資源受限的邊緣設備(On-device)運算場景所設計,為開發者在極端硬體限制下部署 AI 提供了全新的高效能選擇。
Google DeepMind 發表了 VaultGemma,這是全球首款從頭開始(from scratch)使用差分隱私(Differential Privacy, DP)技術訓練的高性能大語言模型。透過嚴格的數學隱私保證,VaultGemma 能有效防止訓練數據洩露與敏感資訊記憶,同時在多項基準測試中保持極高的實用性,為醫療、金融等高隱私需求領域帶來全新突破。
Google DeepMind 發表全新的 Gemini 2.5 Computer Use 專用模型,目前已透過 API 提供預覽。該模型基於 Gemini 2.5 Pro 的強大能力進行微調,旨在賦能 AI 代理(Agents)直接與作業系統及應用程式的用戶介面(UI)進行互動。這項技術將加速自動化工作流程的開發,讓 AI 能夠像人類一樣執行點擊、輸入和導覽等電腦操作。
Google DeepMind 宣布推出一款基於 Gemma 開源模型家族、擁有 270 億參數的全新單細胞分析基礎模型。該模型專為生物醫學研究設計,能深入分析單細胞數據,並已成功協助研究人員發現了一條全新的潛在癌症治療途徑,展現了開源大模型在生醫領域的巨大潛力。
Vercel 宣布在其 Marketplace 中引入 AI Agent 與 AI 服務。開發者現在可以直接在 Vercel 平台中發現、安裝並管理各種 AI 代理工具、向量資料庫及 LLM 監控服務。這項更新簡化了 AI 應用的基礎設施配置,讓開發者能更專注於構建 AI 驅動的 Next.js 應用。
Vercel 宣布在其 Marketplace 中正式引入 AI Agent 與相關服務專區。開發者現在可以更輕鬆地發現並整合各類 AI 工具(如向量資料庫、LLM API、Agent 框架與監控工具)至其 Vercel 專案中。此更新不僅支援自動配置環境變數,還提供統一帳單管理,免去多個平台付費的繁瑣流程,大幅簡化了構建 AI 應用程式的開發體驗與基礎設施管理。
Vercel 宣布推出官方 Python SDK 測試版(Beta),為 Python 開發者提供原生支援。開發者現在可以使用 Python 更輕鬆地與 Vercel API 進行互動、管理專案與部署,並整合 Vercel 的各項雲端服務。這項更新將有助於使用 FastAPI、Flask 或進行 AI/LLM 開發的 Python 工程師更無縫地融入 Vercel 生態系。
Vercel 宣布在 Vercel AI Cloud 上推出「免設定後端(Zero-config Backends)」功能。此更新旨在簡化 AI 應用的後端部署,開發者只需專注於編寫 AI 邏輯,系統會自動處理伺服器配置、環境變數與 API 路由。該功能與 Vercel AI SDK 深度整合,大幅降低了建構高效能、具備串流與代理功能之 AI 應用的門檻。
Vercel 發表全新 AI 協作工具「Vercel Agent」,旨在成為開發者的虛擬隊友。它能直接整合至 Vercel 工作流中,自動分析建置日誌、診斷部署錯誤,並針對效能瓶頸提供即時優化建議。這項工具將大幅降低 DevOps 的維護門檻,提升開發者的生產力。
Vercel 正式將開源工作流開發套件 (Workflow Development Kit) 推向公開測試。該套件旨在解決 Serverless 環境下長耗時任務易超時的痛點,讓開發者能以程式碼定義多步驟、具容錯能力且可中斷重試的工作流。這項工具特別適合用於構建複雜的 AI Agent 運作流程、定時任務與自動化管道,並能與 Vercel 平台無縫整合。