Google DeepMind 發表全新一代 AI 天氣預報模型 WeatherNext 2。該模型在預報效率、精確度以及全球天氣預測的解析度上皆有顯著提升。作為 DeepMind 在氣象預測領域的最新突破,WeatherNext 2 展現了 AI 在應對氣候變遷與極端天氣預警上的巨大潛力。
Google DeepMind 推出新一代 AI 代理 SIMA 2,全面導入 Gemini 模型的能力。SIMA 2 不僅能在多個 3D 虛擬與遊戲世界中執行任務,還具備更強的推理、語言理解與即時決策能力。這項技術展示了 AI 如何從單純的指令接收者,演變為能在複雜互動環境中與人類協同合作的智慧夥伴。
隨著 AI 提供的決策與建議在工作中變得越來越重要,傳統的簡單測試已不足以評估其極限。華頓商學院教授 Ethan Mollick 指出,我們需要透過結構化的「工作面試」流程,包含情境問答、極限測試與邏輯追問,來評估 AI 在特定任務中的真實實力、潛在偏見與幻覺機率,從而決定如何安全地與其協作。
Google DeepMind 發表最新研究,探討 AI 系統與人類在組織視覺資訊時的本質差異。研究指出,人類傾向於依據語意、功能與階層關係來理解視覺世界,而 AI 則常依賴表面特徵(如紋理與背景)。透過深入分析這些認知差距,該研究為開發更具人類常識、更安全且更具魯棒性的電腦視覺系統奠定了基礎。
北愛爾蘭教育局的 C2k 計劃與 Google 展開為期六個月的試點項目,評估生成式 AI 在教育現場的實際應用。結果指出,透過導入 Gemini 等 AI 工具,參與教師平均每週成功節省了 10 小時。這些省下的時間讓教師能更專注於課堂教學與學生互動,有效緩解了教學現場的行政負擔。
Vercel 宣布在其網域服務(Vercel Domains)中整合 AI 網域搜尋功能。使用者現在可以使用自然語言描述自己的專案概念,由 AI 自動生成並推薦合適且可註冊的網域名稱。這項更新簡化了開發者從創意到上線的流程,讓尋找獨特網域變得更加直覺與快速。
Google DeepMind 介紹了 AI 在自然保育中的三大應用:物種地圖繪製、森林保護與鳥類聲學監測。透過機器學習分析衛星影像與聲音數據,AI 能協助科學家追蹤生物多樣性、預測森林變化,並透過「聆聽」鳥鳴來評估生態系統健康,為全球環境保護提供強大技術支援。
Google DeepMind 宣布推出「AI for Math Initiative」計畫,旨在匯聚全球最頂尖的學術與研究機構,共同開創人工智慧在數學研究中的應用。該倡議將專注於利用 AI 工具協助數學家解決複雜難題、發現新定理,並推動數學科學的整體進步。這標誌著 AI 從輔助計算走向深度參與基礎科學探索的新里程碑。
本文深入探討全球 AI 算力基礎設施的劇烈變革。隨著地緣政治與市場需求的變化,算力正從少數雲端巨頭壟斷,走向「主權算力」與區域化部署。同時,AMD、Intel 及邊緣裝置晶片的崛起打破了單一硬體壟斷,而開源社群與 Hugging Face 的優化工具(如 Optimum)正成為連接多元硬體與模型的關鍵橋樑,推動 AI 走向去中心化與普及化。
Vercel 宣布已正式取得 TISAX(受信資訊安全評估交換)的 Assessment Level 2 (AL2) 認證。TISAX 是歐洲汽車工業(特別是德國車廠)所公認的嚴格資訊安全標準。此項認證證明 Vercel 在資料保護與資訊安全上達到汽車產業的高規格要求,將使全球汽車製造商及其供應鏈夥伴能更安心地在 Vercel 上部署與運行其數位化 Web 應用程式。
Vercel 官方宣布已正式取得 TISAX(可信資訊安全評估交換)AL2 評估等級認證。TISAX 是全球汽車產業公認的資訊安全標準,此認證代表 Vercel 的平台安全與隱私防護達到汽車供應鏈的嚴格要求。這將使 Vercel 能夠順利為汽車製造商及相關供應商提供安全的前端託管與開發服務。
Hugging Face 發表全新的「Voice Consent Gate」安全機制,旨在解決語音複製技術帶來的深偽(Deepfake)與盜用風險。該機制要求用戶在複製語音前,必須錄製一段特定的動態聲明以驗證身份與授權意願。這項開源工具將幫助開發者輕鬆在應用中整合語音授權驗證,推動更負責任的 AI 語音技術發展。
Vercel 宣布任命 David Totten 為全球現場工程負責人。他將帶領團隊協助全球企業客戶導入 Vercel 平台、優化前端基礎設施並加速數位轉型。此人事任命反映了 Vercel 持續深耕企業市場、提升技術支援與諮詢服務品質的決心。
Google DeepMind 宣佈 Gemini 2.5 Flash-Lite 結束預覽階段,正式推出穩定版(GA)。這款主打高性價比的輕量級模型,在維持小體積與低成本的同時,依然提供極高的輸出品質。它完整繼承了 Gemini 2.5 家族的強大功能,包含 100 萬 token 的超長上下文視窗與多模態處理能力,非常適合開發者與企業用於需要大規模部署與快速響應的生產環境。
Google DeepMind 與知名導演 Darren Aronofsky、Eliza McNitt 及超過 200 人的製作團隊合作,推出結合實景拍攝與 Veo 影片生成技術的電影《ANCESTRA》。本片展示了 AI 如何作為創作者的延伸工具,而非取代傳統電影製作,並開創了實景與生成式 AI 融合的新敘事手法。
Google DeepMind 推出全新 AI 基礎模型 AlphaEarth Foundations,旨在解決地球觀測數據零散且格式不一的挑戰。該模型整合了數 PB 的衛星影像與地理空間數據,建立統一的數據表徵。這項技術將大幅提升全球地圖繪製、環境變遷追蹤及氣候監測的精度與效率,為科學研究與防災應用提供強大支援。
Google DeepMind 發表全新實驗性 AI 工具「Backstory」,旨在幫助使用者探索網路圖片的脈絡與起源。該工具能分析圖片的傳播歷史、原始出處及可能的修改痕跡,協助使用者在假訊息充斥的網路環境中辨識真偽。這項技術展現了多模態 AI 在提升數位素養與打擊不實資訊方面的潛力。
Google DeepMind 宣布,搭載全新「Deep Think」思考技術的進階版 Gemini 模型,在國際奧林匹亞數學競賽(IMO)的測試中正式達到了金牌得主的水準。這項突破展示了 AI 在處理極具挑戰性的代數、組合數學、幾何和數論等複雜推理問題上的巨大進步。此成果不僅是 AI 數學推理能力的里程碑,也代表著強化學習與系統化思考(System 2 thinking)在大型語言模型上的成功應用。
Google DeepMind 發表全新 AI 模型「Aeneas」,這是首款專為「脈絡化古碑文」設計的工具。Aeneas 旨在協助歷史學家更好地詮釋、歸屬(判定年代與來源)以及修復殘缺不全的古代文本。這項技術克服了傳統碑銘學研究中實體損毀與資訊破碎的挑戰,為歷史與考古研究開創了人機協作的新紀元。
Google DeepMind 發表全新世界模型 Genie 3,為生成式 AI 領域帶來重大突破。該模型能以每秒 24 幀(fps)的即時速度,生成可供用戶自由導航與互動的動態虛擬世界。Genie 3 不僅支援 720p 的高解析度,更能在長達數分鐘的互動過程中,保持場景與物理邏輯的高度一致性,這將為未來的遊戲開發、虛擬實境以及 AI 代理(Agents)的模擬訓練開闢全新途徑。
Google DeepMind 發表全新生物聲學模型「Perch」,旨在協助保育人士快速分析野外錄音。該模型能自動識別夏威夷蜜旋木雀等瀕危鳥類及珊瑚礁生態系統的聲音,大幅縮短人工監聽時間。這項技術讓科學家能在大範圍內進行長期的生態監測,為全球生物多樣性保護提供關鍵支持。
Google DeepMind 介紹了 AI 在宇宙學與天文物理學中的前沿應用。面對新一代望遠鏡帶來的龐大觀測數據,傳統計算方法已達瓶頸。DeepMind 透過深度學習與神經網路,不僅能將複雜的宇宙演化模擬加速數萬倍,還能精確分析重力透鏡效應以繪製暗物質分佈地圖,為科學家探索宇宙奧秘提供強大工具。
Google DeepMind 發表最新研究,展示如何利用 AI 技術尋找流體力學中的新解。該方法針對描述流體運動的百年難題(如 Navier-Stokes 方程與湍流現象),透過結合深度學習與物理模擬,成功加速尋找「確切相干態(ECS)」等關鍵結構。這項突破將有助於數學、物理與工程學界攻克長期未解的複雜流體控制與預測挑戰。
Google DeepMind 宣布更新並強化其「前沿安全框架」(Frontier Safety Framework, FSF)。該框架是 DeepMind 用於預防先進 AI 模型引發極端風險的核心機制。本次強化重點在於提升對模型潛在危害(如網路安全、生物安全及自主複製等)的偵測與評估能力,並建立更明確的預警與緩解機制,以確保前沿技術在安全可控的範圍內發展。
Google DeepMind 發表 Gemini Robotics 1.5,旨在將 AI Agent 的能力帶入實體世界。透過此系統,機器人將具備更強大的環境感知、多步驟任務規劃、邏輯思考、工具使用以及實體行動能力。這項進展代表著「實體代理(Physical Agents)」時代的開啟,能更有效率地解決現實世界中複雜且多步驟的實體任務。
Google DeepMind 宣布與麻省理工學院衍生企業 Commonwealth Fusion Systems (CFS) 展開合作。雙方將結合 DeepMind 的強化學習(RL)與 AI 模擬技術,以及 CFS 的高磁場托卡馬克裝置 SPARC,共同解決核融合反應爐中超高溫電漿控制的難題,加速商業化核融合能源的到來。
Google 正式在 Gemini 應用程式中為 Google AI Ultra 訂閱者推出「Deep Think」深度思考功能。此外,Google 也向特定的數學家開放了曾參加國際數學奧林匹亞(IMO)競賽的 Gemini 2.5 Deep Think 完整版模型,讓專業人士能體驗其強大的數學推理能力。
Google DeepMind 宣布 Gemini 應用程式中的原生圖片編輯功能迎來重大升級。用戶現在可以直接在 Gemini 介面中,以更強大且直覺的新方式調整與轉換圖片。此更新簡化了過去繁瑣的修改流程,讓創作者與一般用戶能更輕鬆地進行局部修改、物件增減或背景調整,大幅提升圖像創作的效率。
Google DeepMind 發表全新的 Gemini 2.5 Computer Use 專用模型,目前已透過 API 提供預覽。該模型基於 Gemini 2.5 Pro 的強大能力進行微調,旨在賦能 AI 代理(Agents)直接與作業系統及應用程式的用戶介面(UI)進行互動。這項技術將加速自動化工作流程的開發,讓 AI 能夠像人類一樣執行點擊、輸入和導覽等電腦操作。
Google DeepMind 宣布推出其旗艦級影片生成模型的最新版本 Veo 3.1。本次升級的核心重點在於賦予使用者更強大的「創意控制力」,讓創作者能更精準地引導視覺風格、鏡頭運動與畫面細節。這項更新旨在解決 AI 影片生成中常見的隨機性問題,標誌著 AI 影片技術向專業工作流邁出的重要一步。