Google DeepMind 宣布推出「Gemini for Science」計畫,整合了一系列專為科學研究設計的 AI 工具與實驗。該計畫旨在利用 Gemini 的多模態與推理能力,協助科學家擴大研究規模並提升探索的精準度。這標誌著 AI 從通用助手邁向深度的科學發現夥伴,為材料科學、生物醫學等領域帶來新的可能性。
本期《Open Artifacts》電子報彙整了近期極為熱鬧的開放模型生態。多款重量級旗艦模型接連登場,包含 Google 的 Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5 以及 GLM-5.1 等。文章除了盤點這些模型的發布外,也深入探討了 CAISI 針對最新模型所進行的 V4 安全與能力評估,呈現開源與開放權重模型在技術與安全合規上的最新進展。
Google DeepMind 宣布與新加坡政府建立全新的國家級合作夥伴關係。雙方將攜手導入前沿 AI 技術,共同解決醫療保健、教育系統優化以及環境永續發展等複雜的社會與國家級挑戰。這項合作不僅強化了新加坡在亞太地區的 AI 領先地位,也展示了公私部門如何協同推動負責任的 AI 應用。
Google DeepMind 正式發表新一代模型 Gemini 3.5,強調「具備行動力的前沿智能」。 該模型的核心設計旨在協助使用者執行複雜的代理型工作流(agentic workflows),代表 AI 從單純的資訊檢索走向主動執行任務。 這項更新將為開發者與企業帶來更強大的自動化與多步驟決策能力。
在一個相對平靜的新聞日,Latent Space 帶領讀者反思「微調(Fine-tuning)的終結」這一命題。 隨著長上下文視窗、高效 RAG 以及上下文內學習(In-context Learning)的成熟,許多原本需要微調的場景已被取代。 未來微調可能退化為僅用於調整輸出格式、風格或進行模型蒸餾的工具,而非首選的知識注入手段。
Google DeepMind 發表全新 AI 系統「Co-Scientist」,採用基於 Gemini 的多 Agent(多智慧體)架構。該系統能扮演科學家的虛擬合作夥伴,協助進行文獻回顧、提出新穎假設、設計實驗步驟並分析複雜數據。透過不同專業 Agent 的協作與互相審查,Co-Scientist 旨在大幅縮短科研週期,推動生物、化學及材料科學等領域的突破。
Vercel 針對其 AI 基礎建設推出「AI Gateway 生產環境指標」(AI Gateway production index)。此功能旨在幫助開發者在生產環境中,更精準地監控、索引與分析 LLM 的調用數據(如延遲、成本與錯誤率)。透過此指標,團隊能有效評估不同 AI 網關與模型的實際表現,進而優化 Serverless 環境下的 AI 應用效能。
Google DeepMind 發表 AlphaEvolve 的最新進展。這款由 Gemini 驅動的程式碼 Agent(Coding Agent)透過先進的演算法,在商業營運、基礎設施優化以及科學研究三大領域展現強大影響力。它不僅能自動化編寫程式,更能自我演化以適應複雜的跨領域需求,加速技術落地。
Google DeepMind 正在研發「AI 協同臨床醫生(AI co-clinician)」系統,探索 AI 輔助醫療的新路徑。該研究專注於建立能與人類醫生協作的 AI 助手,協助進行臨床推理、病歷撰寫與醫患溝通。此舉旨在緩解全球醫療資源緊張問題,並在確保安全與倫理的前提下,提升醫療服務的品質與效率。
Vercel 發表了 2026 年 AI 加速器(AI Accelerator)的官方回顧。本屆計劃聚焦於協助早期 AI 新創將創意轉化為生產級應用,重點展示了多個在 AI Agent、多模態互動及邊緣運算領域取得突破的團隊。文章總結了入選項目的技術亮點,並強調了 Vercel AI SDK 與 Next.js 在現代 AI 開發堆疊中的核心地位。
Google DeepMind 宣布與大韓民國(南韓)建立全新合作關係。雙方將攜手利用最先進的前沿 AI 模型,共同加速科學領域的突破性研究。此合作旨在結合 Google DeepMind 的 AI 技術實力與韓國強大的科研生態系統,為全球科學挑戰尋找新型解決方案。
Google DeepMind 宣布與全球諮詢公司建立合作夥伴關係,旨在將其最先進的 AI 技術導入各行各業。透過諮詢機構的產業經驗與 DeepMind 的技術實力,協助企業克服技術落地痛點。此舉將加速全球組織的 AI 轉型,推動大規模的商業應用與創新。
Google DeepMind 發表全新語音模型 Gemini 3.1 Flash TTS。該模型引入了「細粒度音訊標籤」(granular audio tags),讓開發者與創作者能夠精確引導 AI 語音的生成細節。這項技術大幅提升了 AI 語音的表現力與可控性,為下一代語音互動與內容創作奠定基礎。
Google DeepMind 發表全新 Gemini Robotics-ER 1.6 模型,專為自主機器人設計。該版本專注於提升「具身推理(Embodied Reasoning)」能力,特別加強了空間推理與多視角理解。這項技術突破將使機器人能更精準地整合不同角度的視覺資訊,並在真實世界中執行更複雜的物理任務。
Google 正式推出 Gemma 4 開放模型家族,將前沿的多模態智能帶入裝置端。Gemma 4 體積輕量、適合在手機與筆電運行,並具備強大的視覺與文字理解能力。Hugging Face 已在第一時間提供完整支援,開發者可立即透過 Transformers 進行微調與部署。
知名 AI 科技週報《Import AI》第 451 期聚焦三大前沿議題。首先探討「政治超智慧」對人類社會與民主體制的衝擊,並提出科技是否已無法收回的詰問;其次介紹 Google 借鑑閔斯基理論的「心智社會」多智慧體協作研究,展示群體 AI 解決複雜問題的潛力;最後則分享了結合強化學習與精準物理控制的機器人鼓手技術。
Google DeepMind 宣布將傳統的滑鼠游標重塑為具備「上下文感知能力」的 AI 夥伴。這項創新旨在消除傳統輸入 Prompt 的繁瑣與摩擦力,讓使用者在 Chrome 瀏覽器及其他應用程式中,能夠透過極其直覺的游標移動與點擊,直接與 AI 進行即時協作。這項技術不僅改變了我們與瀏覽器互動的方式,更預示著人機介面(HCI)將迎來全新變革,讓 AI 輔助變得無所不在且更加自然。
Google DeepMind 發表最新語音模型 Gemini 3.1 Flash Live。該模型專為即時語音互動設計,透過顯著降低延遲與提升精準度,讓 AI 語音對話變得更加流暢與自然。這項更新將大幅優化語音助理與即時互動應用的使用者體驗,並為開發者提供更強大的即時語音 API 支持。
Google DeepMind 發表針對 AI 「有害操縱」風險的研究,特別聚焦於金融與醫療兩大高風險領域。隨著 AI 技術深入日常生活,如何防止 AI 系統對人類進行心理、經濟或健康決策上的惡意引導至關重要。對此,DeepMind 提出了新型的安全評估與防護機制,旨在建立更具韌性且安全的 AI 部署標準。
Vercel 發布最新技術指南,探討如何不使用傳統的向量嵌入(Embeddings)與向量資料庫來構建知識型 AI Agent。隨著大語言模型(LLM)的上下文視窗大幅擴大,以及 Tool Calling(工具調用)技術的成熟,開發者可以直接利用長上下文、傳統全文檢索(如 BM25)或動態 API 查詢來實現精準的知識檢索。這不僅能大幅簡化系統架構,還能顯著降低維護向量資料庫的成本與開發門檻。
Vercel 宣布其 Chat SDK(AI SDK 的核心部分)全面強化對 AI Agent(代理)的支援。開發者現在可以更輕鬆地構建具備工具調用、多步驟推理及動態 Generative UI 的智慧代理。此更新簡化了前端與 LLM 代理之間的狀態同步,讓複雜的 Agent 互動能以流暢、直觀的聊天介面呈現給最終用戶。
Vercel 宣布支援部署熱門開源 LLM 閘道工具 LiteLLM 伺服器。這讓開發者能直接在 Vercel 的無伺服器(Serverless)環境中,快速建置一個相容 OpenAI 格式的統一 API 接口,藉此整合、負載均衡並監控超過 100 種不同的 LLM 服務。此舉大幅降低了維護自建 AI 閘道的基礎設施成本與複雜度。
Vercel AI SDK 正式加入 WhatsApp 轉接器(Adapter)支援。這項更新讓開發者能利用 Vercel AI SDK 的統一 API,快速將 AI 模型(如 GPT、Claude 等)與 WhatsApp Business API 對接。開發者無需自行處理繁瑣的通訊協定轉換,即可輕鬆打造具備對話能力的 WhatsApp AI 助理與客服機器人。
Vercel 宣布為其 Chat SDK(AI SDK)推出全新的 Adapter(轉接器)目錄。此目錄彙整了官方與社群提供的各式轉接器,讓開發者能更輕鬆地將不同的大型語言模型(LLM)供應商、向量資料庫及其他第三方服務無縫整合至 Vercel 的 AI 應用開發工作流中,大幅提升開發效率與靈活性。
Google DeepMind 推出 Gemini 3.1 Flash-Lite,這是目前 Gemini 3 系列中速度最快且最具成本效益的模型。該模型旨在滿足大規模的智慧運算需求,適合需要極低延遲與高性價比的應用場景。這項發表標誌著 Google 在輕量化、高效率大語言模型領域的進一步突破。
Vercel 宣布其 AI Gateway 正式整合 Google 的 Gemini 3.1 Flash Lite 模型。 這款模型主打極致的低延遲與高性價比,非常適合需要快速響應與大規模部署的應用場景。 開發者現在可以透過 Vercel AI Gateway 輕鬆調用此模型,並享有統一管理、監控與快取等便利功能。
Vercel 發表最新技術指南,說明如何利用 Vercel AI SDK 與 Serverless 架構輕鬆構建 Slack AI Agent。文章解決了 Slack 開發中常見的 3 秒回覆超時限制,並展示如何快速整合多種大語言模型與工具調用(Tool Calling)。透過這套方案,開發者能以極低的門檻,為團隊打造具備上下文記憶與自動化能力的 Slack 智慧工作夥伴。
Vercel 發表全新 npm 套件 `chat`(透過 `npm i chat` 安裝),旨在簡化跨平台 AI 聊天應用的開發。開發者只需編寫一次邏輯,即可將聊天機器人無縫部署至 Web 網頁、Slack、Discord、WhatsApp 等多個平台。該套件與 Vercel AI SDK 深度整合,支援多種主流大語言模型,並具備 Edge 運算優化與開箱即用的狀態管理功能。
Google DeepMind 宣布推出新一代模型 Gemini 3.1 Pro。該模型專為需要深度思考與複雜處理的任務而設計,旨在解決傳統簡單回答無法滿足的進階需求。這標誌著 Gemini 系列在複雜推理與專業工作流上的進一步升級,將為開發者與企業用戶在建構 AI Agent 及處理高難度邏輯推理時,提供更強大的運算大腦與解決方案。
Vercel 於 Changelog 宣佈其 AI Gateway 已正式支援 Google 的 Veo 影片生成模型。這項更新讓開發者能夠透過 Vercel 的統一閘道器,輕鬆呼叫、監控並優化 Veo 模型的 API 請求。藉由 AI Gateway 提供的快取、速率限制與分析功能,開發者能更有效率地在 Web 應用中建構高品質的 AI 影片生成功能。