Google DeepMind 發表全新 AI 系統「Co-Scientist」,採用基於 Gemini 的多 Agent(多智慧體)架構。該系統能扮演科學家的虛擬合作夥伴,協助進行文獻回顧、提出新穎假設、設計實驗步驟並分析複雜數據。透過不同專業 Agent 的協作與互相審查,Co-Scientist 旨在大幅縮短科研週期,推動生物、化學及材料科學等領域的突破。
Google DeepMind 發表 AlphaEvolve 的最新進展。這款由 Gemini 驅動的程式碼 Agent(Coding Agent)透過先進的演算法,在商業營運、基礎設施優化以及科學研究三大領域展現強大影響力。它不僅能自動化編寫程式,更能自我演化以適應複雜的跨領域需求,加速技術落地。
Google DeepMind 正在研發「AI 協同臨床醫生(AI co-clinician)」系統,探索 AI 輔助醫療的新路徑。該研究專注於建立能與人類醫生協作的 AI 助手,協助進行臨床推理、病歷撰寫與醫患溝通。此舉旨在緩解全球醫療資源緊張問題,並在確保安全與倫理的前提下,提升醫療服務的品質與效率。
Google DeepMind 宣布與大韓民國(南韓)建立全新合作關係。雙方將攜手利用最先進的前沿 AI 模型,共同加速科學領域的突破性研究。此合作旨在結合 Google DeepMind 的 AI 技術實力與韓國強大的科研生態系統,為全球科學挑戰尋找新型解決方案。
Google DeepMind 發表全新語音模型 Gemini 3.1 Flash TTS。該模型引入了「細粒度音訊標籤」(granular audio tags),讓開發者與創作者能夠精確引導 AI 語音的生成細節。這項技術大幅提升了 AI 語音的表現力與可控性,為下一代語音互動與內容創作奠定基礎。
Google DeepMind 發表全新 Gemini Robotics-ER 1.6 模型,專為自主機器人設計。該版本專注於提升「具身推理(Embodied Reasoning)」能力,特別加強了空間推理與多視角理解。這項技術突破將使機器人能更精準地整合不同角度的視覺資訊,並在真實世界中執行更複雜的物理任務。
Google 正式推出 Gemma 4 開放模型家族,將前沿的多模態智能帶入裝置端。Gemma 4 體積輕量、適合在手機與筆電運行,並具備強大的視覺與文字理解能力。Hugging Face 已在第一時間提供完整支援,開發者可立即透過 Transformers 進行微調與部署。
知名 AI 科技週報《Import AI》第 451 期聚焦三大前沿議題。首先探討「政治超智慧」對人類社會與民主體制的衝擊,並提出科技是否已無法收回的詰問;其次介紹 Google 借鑑閔斯基理論的「心智社會」多智慧體協作研究,展示群體 AI 解決複雜問題的潛力;最後則分享了結合強化學習與精準物理控制的機器人鼓手技術。
Google DeepMind 發表最新語音模型 Gemini 3.1 Flash Live。該模型專為即時語音互動設計,透過顯著降低延遲與提升精準度,讓 AI 語音對話變得更加流暢與自然。這項更新將大幅優化語音助理與即時互動應用的使用者體驗,並為開發者提供更強大的即時語音 API 支持。
Google DeepMind 發表針對 AI 「有害操縱」風險的研究,特別聚焦於金融與醫療兩大高風險領域。隨著 AI 技術深入日常生活,如何防止 AI 系統對人類進行心理、經濟或健康決策上的惡意引導至關重要。對此,DeepMind 提出了新型的安全評估與防護機制,旨在建立更具韌性且安全的 AI 部署標準。
Google DeepMind 推出 Gemini 3.1 Flash-Lite,這是目前 Gemini 3 系列中速度最快且最具成本效益的模型。該模型旨在滿足大規模的智慧運算需求,適合需要極低延遲與高性價比的應用場景。這項發表標誌著 Google 在輕量化、高效率大語言模型領域的進一步突破。
Google DeepMind 宣布推出新一代模型 Gemini 3.1 Pro。該模型專為需要深度思考與複雜處理的任務而設計,旨在解決傳統簡單回答無法滿足的進階需求。這標誌著 Gemini 系列在複雜推理與專業工作流上的進一步升級,將為開發者與企業用戶在建構 AI Agent 及處理高難度邏輯推理時,提供更強大的運算大腦與解決方案。
隨著 AI 從單純的「聊天機器人」演進至具備主動執行能力的「代理人(Agents)」與深度思考的「推理模型(Reasoning Models)」,使用策略已大幅改變。本文整理了當前主流 AI(如 GPT、Claude、Gemini 及 DeepSeek)在寫作、程式開發、資料分析與自動化任務中的定位。讀者將能理解何時該用一般聊天、何時該啟動推理,以及如何佈署代理人來提升生產力。
Google DeepMind 正式推出 Gemini 3 Deep Think 深度推理模式。此版本專為應對現代科學、前沿研究與複雜工程挑戰而設計,代表了 Google 在 AI 推理技術上的最新突破。該模式著重於多步驟邏輯推理、數學與程式碼建構,旨在為科研人員與工程師提供更強大的決策與分析支援。
Google DeepMind 發文指出,Gemini Deep Think 在學術與科學研究中的影響力正快速增長。透過延伸思考時間(Thinking time)與深度推理,該模型在複雜數學證明、科學假設生成及程式碼編寫上展現顯著優勢。多篇研究論文證實,這種具備「系統二」慢思考能力的 AI 模型,正成為科學家與研究人員不可或缺的協作工具,有效縮短研究週期。
Google DeepMind 發表 2025 年度回顧,總結了今年在 8 大關鍵領域的研究突破。內容涵蓋 Gemini 多模態模型的演進、AlphaFold 3 帶來的生醫革命、AlphaProof 在數學推理的進展,以及 AI 在氣象預測、材料科學和機器人控制等領域的實際應用。這份回顧展示了 AI 如何從單純的語言助手,加速轉化為推動人類科學探索的強大引擎。
Google DeepMind 正式發表新一代模型 Gemini 3 Flash。該模型旨在打破性能與速度的權衡,以極低的成本提供接近前沿(frontier)等級的智慧表現。這款模型專為需要高速度、低延遲以及高性價比的應用場景所設計,將為開發者帶來更高效、更實惠的開發體驗。
Google DeepMind 宣布推出改進後的 Gemini 音訊模型,專為即時語音體驗進行優化。新模型採用原生多模態架構,無需經過「語音轉文字」的中介步驟,即可直接理解並生成語音,大幅降低延遲。這項升級將賦予開發者構建更具情感表現力、反應更迅速的語音助理與互動應用的能力,並已陸續在 Google AI Studio 與 Vertex AI 上線。
Google DeepMind 宣布加強與英國 AI 安全研究所(UK AISI)的合作關係。雙方將針對前沿 AI 模型的安全評估、風險緩解及安全研究展開更緊密的協作。此舉旨在建立更完善的 AI 安全標準,確保未來強大 AI 系統的開發與部署符合安全規範。
Google DeepMind 發表全新的 FACTS 基準測試套件,專門用於系統化評估大型語言模型(LLM)的真實性。該套件解決了現有評估方法不夠全面或難以標準化的痛點,透過多維度的測試集與自動化評估指標,幫助研究人員與開發者精確量化模型的「幻覺」程度。這對於提升 AI 在高風險領域(如醫療、法律、金融)的實用性與信任度具有重要意義。
Google DeepMind 宣布與美國能源部(DOE)展開國家級戰略合作,共同推動名為「Genesis」的全新計畫。該計畫旨在結合 DeepMind 的前沿 AI 技術與 DOE 的超級運算資源,開發專為科學研究設計的基礎模型。雙方將聚焦於清潔能源、新材料開發及氣候變遷等關鍵領域,期望透過 AI 大幅縮短科學探索與實驗的時間,建立安全且開放的科學 AI 生態系。
Google DeepMind 宣布將其先進的 SynthID 浮水印技術整合至 Gemini 應用程式中。這項技術能在不影響視覺品質的前提下,於 AI 生成的圖像中植入隱形浮水印,即使經過裁剪、壓縮或編輯也能被偵測。此舉旨在協助用戶辨識 AI 生成內容,應對深偽(Deepfake)與假訊息挑戰,並推動數位內容的透明度。
Google DeepMind 宣布推出名為「Nano Banana Pro」的 Gemini 3 Pro 圖像模型。作為 Gemini 3 世代的專業級視覺模型,它旨在為開發者提供更強大的影像生成或理解能力。標題「Build with...」顯示該模型已開放 API 或開發工具,鼓勵開發者將其整合至各式應用中。
Google DeepMind 宣布推出其最新一代旗艦模型 Gemini 3,並全面開放開發者進行建構。此版本在多模態理解、邏輯推理與生成速度上皆有顯著提升。開發者現在可以透過 Google AI Studio 和 Vertex AI 存取 Gemini 3 API,體驗更強大的上下文處理能力與更低的延遲,為下一代 AI 應用與 Agent 開發奠定基礎。
知名 AI 學者 Ethan Mollick 撰文指出,AI 技術在過去三年經歷了巨大的範式轉移。AI 已從最初 GPT-3 時代單純進行文本生成與對話的「聊天機器人(Chatbots)」,演進至如今以 Gemini 3 為代表、具備自主規劃與執行能力的「AI Agent(代理人)」。這一轉變不僅改變了人機互動模式,也重新定義了 AI 在工作與生活中的實用價值。
Google DeepMind 宣布推出全新一代旗艦模型 Gemini 3。此版本在多模態理解、複雜邏輯推理及長文本處理能力上皆有顯著突破。Gemini 3 更加強調「主動式智能體(Agentic AI)」的實用化,能自主規劃並執行跨平台的複雜任務,並大幅降低了延遲與運算成本,為個人與企業應用帶來全新變革。
Google DeepMind 推出新一代 AI 代理 SIMA 2,全面導入 Gemini 模型的能力。SIMA 2 不僅能在多個 3D 虛擬與遊戲世界中執行任務,還具備更強的推理、語言理解與即時決策能力。這項技術展示了 AI 如何從單純的指令接收者,演變為能在複雜互動環境中與人類協同合作的智慧夥伴。
隨著 AI 提供的決策與建議在工作中變得越來越重要,傳統的簡單測試已不足以評估其極限。華頓商學院教授 Ethan Mollick 指出,我們需要透過結構化的「工作面試」流程,包含情境問答、極限測試與邏輯追問,來評估 AI 在特定任務中的真實實力、潛在偏見與幻覺機率,從而決定如何安全地與其協作。
Google DeepMind 宣佈 Gemini 2.5 Flash-Lite 結束預覽階段,正式推出穩定版(GA)。這款主打高性價比的輕量級模型,在維持小體積與低成本的同時,依然提供極高的輸出品質。它完整繼承了 Gemini 2.5 家族的強大功能,包含 100 萬 token 的超長上下文視窗與多模態處理能力,非常適合開發者與企業用於需要大規模部署與快速響應的生產環境。
Google DeepMind 發表全新實驗性 AI 工具「Backstory」,旨在幫助使用者探索網路圖片的脈絡與起源。該工具能分析圖片的傳播歷史、原始出處及可能的修改痕跡,協助使用者在假訊息充斥的網路環境中辨識真偽。這項技術展現了多模態 AI 在提升數位素養與打擊不實資訊方面的潛力。