Simon Willison 在 PyCon US 2026 的 5 分鐘閃電演講中,回顧了自 2025 年 11 月以來的 LLM 關鍵進展。他指出這半年間「最強模型」在三大巨頭間易手五次(包含 GPT-5.1、Gemini 3 與 Claude Opus 4.5)。最重要的是,得益於可驗證獎勵的強化學習(RLVR),程式碼生成 Agent(如 Claude Code)已跨越實用門檻,成為開發者的日常主力工具。
Google DeepMind 宣布生物學家成功利用其 AI 系統「Co-Scientist」加速基因篩選流程。該系統協助研究人員在龐大的基因數據中,精準辨識出能有效逆轉人類細胞衰老(細胞年輕化)的全新關鍵遺傳因子。這項突破不僅展示了 AI 在生醫領域的強大預測與實驗設計能力,也為抗衰老療法與再生醫學開闢了全新路徑。
Google DeepMind 發表新一代「Gemini Omni」模型,採用原生端到端全模態架構,能同時處理並輸出文字、音訊與視覺資訊。該模型顯著降低了互動延遲,實現如同真人般的流暢對話與即時視訊引導,未來將深度整合至 Android 系統與 Google 生態系,並透過 API 開放給開發者。
Google DeepMind 宣布推出「Gemini for Science」計畫,整合了一系列專為科學研究設計的 AI 工具與實驗。該計畫旨在利用 Gemini 的多模態與推理能力,協助科學家擴大研究規模並提升探索的精準度。這標誌著 AI 從通用助手邁向深度的科學發現夥伴,為材料科學、生物醫學等領域帶來新的可能性。
本期《Open Artifacts》電子報彙整了近期極為熱鬧的開放模型生態。多款重量級旗艦模型接連登場,包含 Google 的 Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5 以及 GLM-5.1 等。文章除了盤點這些模型的發布外,也深入探討了 CAISI 針對最新模型所進行的 V4 安全與能力評估,呈現開源與開放權重模型在技術與安全合規上的最新進展。
Google DeepMind 宣布與新加坡政府建立全新的國家級合作夥伴關係。雙方將攜手導入前沿 AI 技術,共同解決醫療保健、教育系統優化以及環境永續發展等複雜的社會與國家級挑戰。這項合作不僅強化了新加坡在亞太地區的 AI 領先地位,也展示了公私部門如何協同推動負責任的 AI 應用。
劍橋大學教授 Clare Bryant 正在使用 Google DeepMind 的 AI 系統「Co-Scientist」進行前沿醫學研究。該研究旨在識別新興傳染病中的「分子開關」(基因觸發因素),以了解病原體如何引發體內免疫反應。透過 AI 的協作,科學家能夠更快速地篩選複雜的基因數據,為未來應對大流行病和開發新療法提供關鍵線索。
Google DeepMind 分享了研究員 Filippo Menolascina 如何利用 AI 系統「Co-Scientist」來攻克複雜的肝臟疾病。該系統不僅協助識別出全新的肝臟疾病治療方案,還成功解釋了為何現有藥物只對部分患者群體產生療效。這項突破展示了 AI 代理(AI Agents)在生物醫學與精準醫療領域的巨大潛力,能大幅縮短科學假說的驗證週期。
Google DeepMind 宣布其 AI 科學助手「Co-Scientist」成功串聯波士頓兒童醫院與麻省理工學院(MIT)的實驗室。雙方將結合生物技術工具包,共同探索基於 RNA 的肌萎縮性脊髓側索硬化症(ALS,俗稱漸凍症)全新治療方案。這項合作展示了 AI 在加速複雜生物醫學研究與跨機構協作中的巨大潛力。
史丹佛大學的遺傳學家利用 Google DeepMind 開發的 AI 系統「Co-Scientist」,加速尋找治療慢性肝病和肝纖維化的新方法。該研究專注於「老藥新用」(drug repurposing),透過 AI 分析現有藥物對抗肝纖維化的潛力。這項合作展示了 AI 代理(AI Agents)在生物醫學研究中,如何大幅縮短藥物研發時程並降低成本。
Google DeepMind 正式發表新一代模型 Gemini 3.5,強調「具備行動力的前沿智能」。 該模型的核心設計旨在協助使用者執行複雜的代理型工作流(agentic workflows),代表 AI 從單純的資訊檢索走向主動執行任務。 這項更新將為開發者與企業帶來更強大的自動化與多步驟決策能力。
在一個相對平靜的新聞日,Latent Space 帶領讀者反思「微調(Fine-tuning)的終結」這一命題。 隨著長上下文視窗、高效 RAG 以及上下文內學習(In-context Learning)的成熟,許多原本需要微調的場景已被取代。 未來微調可能退化為僅用於調整輸出格式、風格或進行模型蒸餾的工具,而非首選的知識注入手段。
Google DeepMind 發表全新 AI 系統「Co-Scientist」,採用基於 Gemini 的多 Agent(多智慧體)架構。該系統能扮演科學家的虛擬合作夥伴,協助進行文獻回顧、提出新穎假設、設計實驗步驟並分析複雜數據。透過不同專業 Agent 的協作與互相審查,Co-Scientist 旨在大幅縮短科研週期,推動生物、化學及材料科學等領域的突破。
Vercel 針對其 AI 基礎建設推出「AI Gateway 生產環境指標」(AI Gateway production index)。此功能旨在幫助開發者在生產環境中,更精準地監控、索引與分析 LLM 的調用數據(如延遲、成本與錯誤率)。透過此指標,團隊能有效評估不同 AI 網關與模型的實際表現,進而優化 Serverless 環境下的 AI 應用效能。
Google DeepMind 發表 AlphaEvolve 的最新進展。這款由 Gemini 驅動的程式碼 Agent(Coding Agent)透過先進的演算法,在商業營運、基礎設施優化以及科學研究三大領域展現強大影響力。它不僅能自動化編寫程式,更能自我演化以適應複雜的跨領域需求,加速技術落地。
Google DeepMind 正在研發「AI 協同臨床醫生(AI co-clinician)」系統,探索 AI 輔助醫療的新路徑。該研究專注於建立能與人類醫生協作的 AI 助手,協助進行臨床推理、病歷撰寫與醫患溝通。此舉旨在緩解全球醫療資源緊張問題,並在確保安全與倫理的前提下,提升醫療服務的品質與效率。
Vercel 發表了 2026 年 AI 加速器(AI Accelerator)的官方回顧。本屆計劃聚焦於協助早期 AI 新創將創意轉化為生產級應用,重點展示了多個在 AI Agent、多模態互動及邊緣運算領域取得突破的團隊。文章總結了入選項目的技術亮點,並強調了 Vercel AI SDK 與 Next.js 在現代 AI 開發堆疊中的核心地位。
Google DeepMind 宣布與大韓民國(南韓)建立全新合作關係。雙方將攜手利用最先進的前沿 AI 模型,共同加速科學領域的突破性研究。此合作旨在結合 Google DeepMind 的 AI 技術實力與韓國強大的科研生態系統,為全球科學挑戰尋找新型解決方案。
Google DeepMind 宣布與全球諮詢公司建立合作夥伴關係,旨在將其最先進的 AI 技術導入各行各業。透過諮詢機構的產業經驗與 DeepMind 的技術實力,協助企業克服技術落地痛點。此舉將加速全球組織的 AI 轉型,推動大規模的商業應用與創新。
Google DeepMind 發表全新語音模型 Gemini 3.1 Flash TTS。該模型引入了「細粒度音訊標籤」(granular audio tags),讓開發者與創作者能夠精確引導 AI 語音的生成細節。這項技術大幅提升了 AI 語音的表現力與可控性,為下一代語音互動與內容創作奠定基礎。
Google DeepMind 發表全新 Gemini Robotics-ER 1.6 模型,專為自主機器人設計。該版本專注於提升「具身推理(Embodied Reasoning)」能力,特別加強了空間推理與多視角理解。這項技術突破將使機器人能更精準地整合不同角度的視覺資訊,並在真實世界中執行更複雜的物理任務。
Google 正式推出 Gemma 4 開放模型家族,將前沿的多模態智能帶入裝置端。Gemma 4 體積輕量、適合在手機與筆電運行,並具備強大的視覺與文字理解能力。Hugging Face 已在第一時間提供完整支援,開發者可立即透過 Transformers 進行微調與部署。
知名 AI 科技週報《Import AI》第 451 期聚焦三大前沿議題。首先探討「政治超智慧」對人類社會與民主體制的衝擊,並提出科技是否已無法收回的詰問;其次介紹 Google 借鑑閔斯基理論的「心智社會」多智慧體協作研究,展示群體 AI 解決複雜問題的潛力;最後則分享了結合強化學習與精準物理控制的機器人鼓手技術。
Google DeepMind 宣布將傳統的滑鼠游標重塑為具備「上下文感知能力」的 AI 夥伴。這項創新旨在消除傳統輸入 Prompt 的繁瑣與摩擦力,讓使用者在 Chrome 瀏覽器及其他應用程式中,能夠透過極其直覺的游標移動與點擊,直接與 AI 進行即時協作。這項技術不僅改變了我們與瀏覽器互動的方式,更預示著人機介面(HCI)將迎來全新變革,讓 AI 輔助變得無所不在且更加自然。
Google DeepMind 發表最新語音模型 Gemini 3.1 Flash Live。該模型專為即時語音互動設計,透過顯著降低延遲與提升精準度,讓 AI 語音對話變得更加流暢與自然。這項更新將大幅優化語音助理與即時互動應用的使用者體驗,並為開發者提供更強大的即時語音 API 支持。
Google DeepMind 發表針對 AI 「有害操縱」風險的研究,特別聚焦於金融與醫療兩大高風險領域。隨著 AI 技術深入日常生活,如何防止 AI 系統對人類進行心理、經濟或健康決策上的惡意引導至關重要。對此,DeepMind 提出了新型的安全評估與防護機制,旨在建立更具韌性且安全的 AI 部署標準。
Vercel 發布最新技術指南,探討如何不使用傳統的向量嵌入(Embeddings)與向量資料庫來構建知識型 AI Agent。隨著大語言模型(LLM)的上下文視窗大幅擴大,以及 Tool Calling(工具調用)技術的成熟,開發者可以直接利用長上下文、傳統全文檢索(如 BM25)或動態 API 查詢來實現精準的知識檢索。這不僅能大幅簡化系統架構,還能顯著降低維護向量資料庫的成本與開發門檻。
Vercel 宣布其 Chat SDK(AI SDK 的核心部分)全面強化對 AI Agent(代理)的支援。開發者現在可以更輕鬆地構建具備工具調用、多步驟推理及動態 Generative UI 的智慧代理。此更新簡化了前端與 LLM 代理之間的狀態同步,讓複雜的 Agent 互動能以流暢、直觀的聊天介面呈現給最終用戶。
Vercel 宣布支援部署熱門開源 LLM 閘道工具 LiteLLM 伺服器。這讓開發者能直接在 Vercel 的無伺服器(Serverless)環境中,快速建置一個相容 OpenAI 格式的統一 API 接口,藉此整合、負載均衡並監控超過 100 種不同的 LLM 服務。此舉大幅降低了維護自建 AI 閘道的基礎設施成本與複雜度。
Vercel AI SDK 正式加入 WhatsApp 轉接器(Adapter)支援。這項更新讓開發者能利用 Vercel AI SDK 的統一 API,快速將 AI 模型(如 GPT、Claude 等)與 WhatsApp Business API 對接。開發者無需自行處理繁瑣的通訊協定轉換,即可輕鬆打造具備對話能力的 WhatsApp AI 助理與客服機器人。