Google DeepMind 發表 AlphaFold 問世五週年的影響力報告。自 2020 年 AlphaFold 2 在 CASP14 取得突破以來,該技術已預測了超過 2 億個蛋白質結構,並免費開放給全球數百萬名研究人員。從加速瘧疾疫苗開發、應對抗生素耐藥性,到推動綠色塑料分解酶的研發,AlphaFold 徹底改變了生命科學,並於 2024 年榮獲諾貝爾化學獎肯定。
Google DeepMind 宣布,旗下 AI 蛋白質結構預測模型 AlphaFold 已成功解析出導致心臟病的一種關鍵蛋白質結構。這項突破解決了長期以來在結構生物學上的難題,有助於科學家深入理解心血管疾病的致病機制。此發現將為未來的標靶藥物開發與精準醫療奠定重要基礎,展現 AI 在生醫領域的巨大潛力。
Google DeepMind 宣布與美國能源部(DOE)展開國家級戰略合作,共同推動名為「Genesis」的全新計畫。該計畫旨在結合 DeepMind 的前沿 AI 技術與 DOE 的超級運算資源,開發專為科學研究設計的基礎模型。雙方將聚焦於清潔能源、新材料開發及氣候變遷等關鍵領域,期望透過 AI 大幅縮短科學探索與實驗的時間,建立安全且開放的科學 AI 生態系。
Google DeepMind 於官方部落格公開「Nano Banana Pro」。雖然詳細技術細節尚未完整釋出,但從命名來看,「Nano」代表其定位於裝置端(On-device)運算,而「Banana Pro」則可能暗示針對開源硬體或物聯網設備的優化。這顯示 Google 持續深耕邊緣運算與高效能小模型的決心。
ServiceNow AI 發表最新研究「Apriel-H1」,聚焦於如何將大型推理模型(如具備強大 Chain-of-Thought 能力的模型)的推理能力,高效蒸餾至尺寸較小、運行成本更低的實用模型中。該研究指出了一個過去被忽視的「驚人關鍵」,能顯著提升小模型在複雜邏輯與數學推理任務上的表現,為企業級 AI 落地提供更具成本效益的解決方案。
專為像素藝術設計的 Retro Diffusion 系列模型已正式登陸 Replicate 平台。這套模型經過精心調校,能生成乾淨、對齊網格的像素風遊戲素材、角色精靈(Sprites)與地圖瓷磚(Tiles),解決了傳統擴散模型縮放時的模糊問題。獨立遊戲開發者與設計師現在可以透過 Replicate 的雲端 API,輕鬆將高品質的像素畫生成功能整合至自己的開發工作流中。
Google DeepMind 釋出名為「Google Antigravity」的新項目。雖然具體細節尚未完整揭露,但此命名強烈暗示其與物理學、重力模擬或量子重力研究相關。這延續了 DeepMind 過去利用 AI 攻克科學難題(如生物學的 AlphaFold、材料科學的 GNoME)的路線,有望為天體物理學、宇宙學或高能物理模擬帶來革命性的突破。
Google DeepMind 發表全新一代 AI 天氣預報模型 WeatherNext 2。該模型在預報效率、精確度以及全球天氣預測的解析度上皆有顯著提升。作為 DeepMind 在氣象預測領域的最新突破,WeatherNext 2 展現了 AI 在應對氣候變遷與極端天氣預警上的巨大潛力。
Google DeepMind 發表最新研究,探討 AI 系統與人類在組織視覺資訊時的本質差異。研究指出,人類傾向於依據語意、功能與階層關係來理解視覺世界,而 AI 則常依賴表面特徵(如紋理與背景)。透過深入分析這些認知差距,該研究為開發更具人類常識、更安全且更具魯棒性的電腦視覺系統奠定了基礎。
Google DeepMind 介紹了 AI 在自然保育中的三大應用:物種地圖繪製、森林保護與鳥類聲學監測。透過機器學習分析衛星影像與聲音數據,AI 能協助科學家追蹤生物多樣性、預測森林變化,並透過「聆聽」鳥鳴來評估生態系統健康,為全球環境保護提供強大技術支援。
Google DeepMind 宣布推出「AI for Math Initiative」計畫,旨在匯聚全球最頂尖的學術與研究機構,共同開創人工智慧在數學研究中的應用。該倡議將專注於利用 AI 工具協助數學家解決複雜難題、發現新定理,並推動數學科學的整體進步。這標誌著 AI 從輔助計算走向深度參與基礎科學探索的新里程碑。
Google DeepMind 與知名導演 Darren Aronofsky、Eliza McNitt 及超過 200 人的製作團隊合作,推出結合實景拍攝與 Veo 影片生成技術的電影《ANCESTRA》。本片展示了 AI 如何作為創作者的延伸工具,而非取代傳統電影製作,並開創了實景與生成式 AI 融合的新敘事手法。
Google DeepMind 推出全新 AI 基礎模型 AlphaEarth Foundations,旨在解決地球觀測數據零散且格式不一的挑戰。該模型整合了數 PB 的衛星影像與地理空間數據,建立統一的數據表徵。這項技術將大幅提升全球地圖繪製、環境變遷追蹤及氣候監測的精度與效率,為科學研究與防災應用提供強大支援。
Google DeepMind 發表全新 AI 模型「Aeneas」,這是首款專為「脈絡化古碑文」設計的工具。Aeneas 旨在協助歷史學家更好地詮釋、歸屬(判定年代與來源)以及修復殘缺不全的古代文本。這項技術克服了傳統碑銘學研究中實體損毀與資訊破碎的挑戰,為歷史與考古研究開創了人機協作的新紀元。
Google DeepMind 發表全新世界模型 Genie 3,為生成式 AI 領域帶來重大突破。該模型能以每秒 24 幀(fps)的即時速度,生成可供用戶自由導航與互動的動態虛擬世界。Genie 3 不僅支援 720p 的高解析度,更能在長達數分鐘的互動過程中,保持場景與物理邏輯的高度一致性,這將為未來的遊戲開發、虛擬實境以及 AI 代理(Agents)的模擬訓練開闢全新途徑。
Google DeepMind 發表全新生物聲學模型「Perch」,旨在協助保育人士快速分析野外錄音。該模型能自動識別夏威夷蜜旋木雀等瀕危鳥類及珊瑚礁生態系統的聲音,大幅縮短人工監聽時間。這項技術讓科學家能在大範圍內進行長期的生態監測,為全球生物多樣性保護提供關鍵支持。
Google DeepMind 介紹了 AI 在宇宙學與天文物理學中的前沿應用。面對新一代望遠鏡帶來的龐大觀測數據,傳統計算方法已達瓶頸。DeepMind 透過深度學習與神經網路,不僅能將複雜的宇宙演化模擬加速數萬倍,還能精確分析重力透鏡效應以繪製暗物質分佈地圖,為科學家探索宇宙奧秘提供強大工具。
Google DeepMind 發表最新研究,展示如何利用 AI 技術尋找流體力學中的新解。該方法針對描述流體運動的百年難題(如 Navier-Stokes 方程與湍流現象),透過結合深度學習與物理模擬,成功加速尋找「確切相干態(ECS)」等關鍵結構。這項突破將有助於數學、物理與工程學界攻克長期未解的複雜流體控制與預測挑戰。
Google DeepMind 宣布與麻省理工學院衍生企業 Commonwealth Fusion Systems (CFS) 展開合作。雙方將結合 DeepMind 的強化學習(RL)與 AI 模擬技術,以及 CFS 的高磁場托卡馬克裝置 SPARC,共同解決核融合反應爐中超高溫電漿控制的難題,加速商業化核融合能源的到來。
Google DeepMind 宣布推出其旗艦級影片生成模型的最新版本 Veo 3.1。本次升級的核心重點在於賦予使用者更強大的「創意控制力」,讓創作者能更精準地引導視覺風格、鏡頭運動與畫面細節。這項更新旨在解決 AI 影片生成中常見的隨機性問題,標誌著 AI 影片技術向專業工作流邁出的重要一步。
Vercel 發表最新技術觀點,指出開發 AI Agent 不需要引入複雜的第三方 Agent 框架。透過 Vercel AI SDK 的 maxSteps 與 Tool Calling 功能,結合 Serverless 函數,開發者就能輕鬆構建具備自主決策能力的 Agent。本文強調「極簡主義」的開發流程,並分享如何在 Serverless 環境中克服超時限制、管理狀態,讓 Agent 應用快速上線。
Vercel 宣布與 Salesforce 及 Slack 展開全新合作,聚焦於「工作中的 AI Agent」。此合作結合了 Vercel 的 Serverless 部署優勢、Salesforce 的企業數據與 Slack 的協作平台,旨在幫助開發者更輕鬆地構建能與企業工作流無縫整合的 AI 代理人,大幅提升企業生產力。
Enterprise AI 公司 Writer 在 Hugging Face 上推出了全新的「Palmyra-mini」模型系列。該系列主打輕量化與強大效能,並特別強調具備「推理(reasoning)」能力。這使得開發者能在資源受限的環境中,部署具備複雜邏輯思考與問題解決能力的 AI 模型,為邊緣運算與企業應用提供新選擇。
知名 AI 學者 Ethan Mollick 撰文探討「大眾智能(Mass Intelligence)」的降臨。他指出,AI 正在朝兩極化普及:一方面是如 GPT-5 等具備頂尖推理能力的前沿模型,另一方面是能在個人裝置運行的超輕量本地模型(如 nano banana 等)。這意味著強大的 AI 算力將如同電力般無所不在且廉價,徹底民主化智能的獲取管道。
Arm 與 Hugging Face 合作宣布「Neural Super Sampling (NSS)」技術正式上線。這項技術旨在利用神經網路,在行動裝置與邊緣設備上實現即時的圖像與遊戲畫面超取樣(類似行動版 DLSS)。透過 Hugging Face 平台,開發者現在可以輕鬆獲取優化後的 NSS 模型與工具鏈,大幅提升手遊與 XR 應用的畫面流暢度並降低能耗。
Vercel 官方發布最新案例分享,展示其 AI 網頁生成工具 v0 如何協助開發團隊將專案交付時間縮短一半。透過 v0 的自然語言生成 React 與 Tailwind CSS 組件功能,團隊能快速進行原型設計並直接部署。這不僅簡化了設計師與工程師之間的溝通,更大幅提升了從概念到上線的整體開發效率。
Zapier 分享如何利用 Vercel v0(AI 網頁生成工具)來加速與各大 SaaS 合作夥伴的對接與協作。透過 v0 的自然語言生成 UI 能力,非技術團隊也能快速建立高品質的整合原型與嵌入式組件。這項實踐大幅降低了前端開發門檻,讓 Zapier 能以更低的成本、更快的速度擴大其龐大的自動化生態系。
NVIDIA 在 Hugging Face 部落格分享了其開源且可移植的深度研究 Agent 成果。透過在 DeepResearch Bench 基準測試上評估開源的 Llama Nemotron 模型,該系統展現出極佳的研究與推理能力。此研究證明了開源模型在複雜、多步驟的研究任務中,已具備與閉源頂尖模型競爭的實力,為開發者提供了一個強大且可本地部署的 Deep Research 解決方案。
Vercel 針對旗下 AI 網頁生成工具 v0 推出安全更新。隨著「氛圍編程(Vibe Coding)」流行,開發者常直接運行 AI 生成的代碼,這帶來了潛在的安全風險。本次更新重點在於提供安全的沙盒執行環境、防範惡意套件注入、以及更安全地管理 API 金鑰與環境變數,讓用戶在快速迭代的同時,無需擔心安全漏洞。
Replicate 宣布上線全新開源影片生成模型 Wan 2.2。該模型被定位為目前平台上速度最快且成本最低的影片生成選擇,標誌著開源影片生成技術(Open Source Video)的重大進展。這項更新將大幅降低開發者與創作者生成高品質影片的門檻與運算成本。