Google DeepMind 宣布與新加坡政府建立全新的國家級合作夥伴關係。雙方將攜手導入前沿 AI 技術,共同解決醫療保健、教育系統優化以及環境永續發展等複雜的社會與國家級挑戰。這項合作不僅強化了新加坡在亞太地區的 AI 領先地位,也展示了公私部門如何協同推動負責任的 AI 應用。
劍橋大學教授 Clare Bryant 正在使用 Google DeepMind 的 AI 系統「Co-Scientist」進行前沿醫學研究。該研究旨在識別新興傳染病中的「分子開關」(基因觸發因素),以了解病原體如何引發體內免疫反應。透過 AI 的協作,科學家能夠更快速地篩選複雜的基因數據,為未來應對大流行病和開發新療法提供關鍵線索。
Alphabet 旗下的生技公司 Calico Life Sciences 宣布與 Google DeepMind 合作,導入名為「Co-Scientist」的 AI 系統。該系統旨在協助科學家連結龐雜且零散的生物醫學研究文獻與實驗數據。透過 Co-Scientist 的強大推理與關聯能力,研究團隊得以加速發現抗老化領域的新線索,並生成具潛力的全新科學假說。
Google DeepMind 分享了研究員 Filippo Menolascina 如何利用 AI 系統「Co-Scientist」來攻克複雜的肝臟疾病。該系統不僅協助識別出全新的肝臟疾病治療方案,還成功解釋了為何現有藥物只對部分患者群體產生療效。這項突破展示了 AI 代理(AI Agents)在生物醫學與精準醫療領域的巨大潛力,能大幅縮短科學假說的驗證週期。
Google DeepMind 宣布其 AI 科學助手「Co-Scientist」成功串聯波士頓兒童醫院與麻省理工學院(MIT)的實驗室。雙方將結合生物技術工具包,共同探索基於 RNA 的肌萎縮性脊髓側索硬化症(ALS,俗稱漸凍症)全新治療方案。這項合作展示了 AI 在加速複雜生物醫學研究與跨機構協作中的巨大潛力。
史丹佛大學的遺傳學家利用 Google DeepMind 開發的 AI 系統「Co-Scientist」,加速尋找治療慢性肝病和肝纖維化的新方法。該研究專注於「老藥新用」(drug repurposing),透過 AI 分析現有藥物對抗肝纖維化的潛力。這項合作展示了 AI 代理(AI Agents)在生物醫學研究中,如何大幅縮短藥物研發時程並降低成本。
晶片獨角獸 Cerebras Systems 正式啟動估值高達 600 億美元的 IPO 案。這家以「晶圓級引擎(WSE)」巨大晶片聞名的公司,長期以來致力於透過單一超大晶片解決 AI 運算瓶頸。本次 IPO 不僅是半導體與 AI 領域的重大里程碑,也象徵著市場對 Nvidia 替代方案的強烈渴望與資金挹注。
Google DeepMind 發表案例,展示其新一代天氣預報 AI 模型「WeatherNext」如何協助美國國家颶風中心(NHC)。在面對歷史性颶風「梅麗莎」(Hurricane Melissa)襲擊牙買加時,WeatherNext 提供了極為精準的登陸預測,讓氣象預報員能提前向當地社區發出警報,爭取到前所未有的黃金準備時間,展現了 AI 在防災與氣象預報上的巨大潛力。
知名學術預印本平台 arXiv 宣布新政策,針對提交 AI 生成之「垃圾內容(slop)」與「幻覺(hallucinations)」的作者實施嚴厲懲罰。根據 arXiv 社群媒體上板主的說明,違規者將被處以「禁投一年」的處罰。此舉旨在維護學術研究的真實性與品質,防堵日益氾濫的 AI 劣質學術寫作對科研生態造成的破壞。
本期 Latent Space 專訪醫療 AI 領導品牌 Abridge 的產品副總裁 Janie Lee 與工程副總裁 Chai Asawa。Abridge 透過環境語音識別(Ambient AI)技術,將醫病對話自動轉化為結構化病歷,每週為醫生節省 10 至 20 小時。此外,他們正將應用擴展至「預先授權(Prior Auth)」等行政流程,致力將醫病對話打造為醫療系統的全新作業系統。
IBM 發布全新開源多語言嵌入模型 Granite Embedding Multilingual R2。該模型採用寬鬆的 Apache 2.0 授權,支援高達 32K 的上下文長度。在參數小於 1 億(Sub-100M)的同量級模型中,它展現出最頂尖的資訊檢索品質,非常適合用於建構高效能且低資源消耗的 RAG(檢索增強生成)系統。
本文探討開源 AI 模型生態系的「複利效應」,特別聚焦於中國以 Qwen 和 DeepSeek 為代表的「開源優先」高參與度生態。開源模型透過社群的集體微調、工具鏈優化與應用開發,累積進步的速度已逐漸逼近甚至超越封閉模型。這種去中心化的協作模式不僅降低了技術門檻,更形成了一個自我強化的生態飛輪,對全球 AI 競爭格局產生深遠影響。
AI 研發團隊 Thinking Machines 推出全新原生互動模型「TML-Interaction-Small 276B-A12B」。該模型專為即時語音設計,擁有 276B 總參數與 12B 啟用參數。它不僅刷新了即時語音的技術前沿(SOTA),更透過原生互動機制,徹底取代了傳統的語音活動檢測(VAD)模組,實現更自然、無縫的雙向語音對話。
最新一期 Import AI 聚焦於三大前沿議題。首先,分析了遞迴自我改進(RSI)如何可能引發爆發性的經濟成長,並探討其預測模型。其次,面對難以預測的超智慧(Superintelligence),文章主張監管機構必須保有「極致選擇權」以彈性應對。最後,介紹了結合神經網路架構的新型運算系統(神經電腦)之最新進展。
知名 AI 專家 Nathan Lambert 親自走訪中國多家領先的 AI 實驗室(如 DeepSeek、智譜 AI、零一萬物等),分享第一手觀察。他指出,面對美國嚴苛的晶片制裁,中國實驗室展現出驚人的系統級工程與架構優化能力,並以極低成本推動開源模型(如 Qwen 與 DeepSeek)的快速迭代。然而,嚴格的政府監管審查與對即時商業變現的焦慮,也形塑了與矽谷截然不同的 AI 發展生態。
近期一系列的產業動態與產品發布,皆指向同一個核心趨勢:矽谷正認真將焦點轉向「AI 服務(Services)」。這意味著 AI 不再只是輔助人類的軟體工具(SaaS),而是能直接交付工作成果的代理人(Agents)。這種「以服務為軟體(Service-as-a-Software)」的轉變,將徹底重塑企業外包、客服及專業諮詢等數兆美元的服務業市場。
本期 Import AI 聚焦於「自動化 AI 研究」的最新趨勢。隨著大語言模型與 Agent 技術的成熟,AI 系統已開始展現出自動撰寫程式碼、設計新演算法並進行自我訓練的能力。這種「遞迴自我提升(Recursive Self-Improvement)」不僅能極大地加速 AI 研發進程,也引發了關於安全控制、運算資源分配以及 AI 演進速度失控的深思。
本文深入探討 IBM 最新開源的 Granite 4.1 大語言模型家族。詳細介紹了其從數據清洗、模型架構設計(如優化的 Transformer 結構)到指令微調與安全對齊的完整構建流程。Granite 4.1 延續了 IBM 對於企業級安全與 Apache 2.0 開源協議的承諾,並在代碼生成、工具調用及多語言推理上展現出優異性能。
NVIDIA 推出全新輕量級多模態模型 Nemotron 3 Nano Omni,主打「長文本」與「多模態」處理能力。該模型專為文件分析、語音與影片理解的 AI Agent 所設計,能在資源受限的設備上運行。這標誌著邊緣端(On-device)多模態 Agent 應用的重大突破。
Google DeepMind 宣布與大韓民國(南韓)建立全新合作關係。雙方將攜手利用最先進的前沿 AI 模型,共同加速科學領域的突破性研究。此合作旨在結合 Google DeepMind 的 AI 技術實力與韓國強大的科研生態系統,為全球科學挑戰尋找新型解決方案。
Hugging Face 介紹全新 DeepSeek-V4 模型,具備 100 萬 Token 的超長上下文能力。不同於以往流於形式的長文本模型,DeepSeek-V4 專為 Agent 設計,在長文本召回率與指令遵循上表現優異。本文探討其技術突破、在 Hugging Face 生態系的部署方式,以及如何實際應用於複雜的 Agent 工作流中。
Google DeepMind 發表「Decoupled DiLoCo」技術,旨在解決跨資料中心或不穩定網路環境下的 AI 訓練難題。該技術改良了原有的 DiLoCo 演算法,將本地訓練與全域同步解耦,大幅提升了對「慢節點(stragglers)」與斷線的容錯能力。這項突破讓利用全球閒置或異質算力進行超大規模模型訓練變得更加可行。
阿聯酋技術創新研究所(TII)在 Hugging Face 上推出了名為「QIMMA」(阿拉伯語意為「山頂」)的全新阿拉伯語 LLM 排行榜。該排行榜主打「品質優先」,旨在解決現有阿拉伯語評估基準中常見的翻譯失真與缺乏方言代表性等問題。QIMMA 透過更嚴格、更貼近在地文化的評測標準,為阿拉伯語 AI 模型的開發提供更具公信力的衡量指標。
本期電子報涵蓋三大核心議題:首先是利用 AI 自動化進行對齊(Alignment)研究的可能性與挑戰;其次是一項針對中國大語言模型的安全與合規性深入研究,揭示其在特定政治與文化框架下的表現;最後介紹了旨在提升推理效率的全新 4 位元浮點格式 HiFloat4。此外,作者也提出了關於金融市場何時會開始為「科技奇點」進行定價的深刻思考。
IBM Research 於 Hugging Face 發表全新基準測試「VAKRA」的分析報告。該測試專為評估 AI Agent 的核心能力而設計,著重於複雜的多步驟推理與動態工具調用。研究不僅評估了主流模型在 Agent 任務中的表現,更系統化地歸納出 Agent 的各類失敗模式(如工具誤用、推理漂移等),為開發者優化 Agent 系統提供關鍵指引。
本期 Import AI 深入探討三個核心議題:首先是 AI Agent 在面對惡意輸入與複雜環境時的脆弱性與破解方法;其次介紹了代碼生成領域的新技術或基準測試 MirrorCode;最後,透過十種不同視角,探討人類因逐漸將決策權讓渡給 AI 系統而導致的「漸進式失權(Gradual Disempowerment)」風險,並以「火的發明是否等同於當時人類的奇點」進行哲學反思。
阿聯酋技術創新研究所(TII)在 Hugging Face 上發表了「Falcon Perception」模型。這標誌著著名的 Falcon 開源家族正式擴展至多模態與視覺感知領域。該模型旨在提升開源社群在視覺問答、圖像理解及多模態任務上的能力,延續了 TII 一貫的高效能與開源精神,為開發者提供強大的視覺感知工具。
IBM 於 Hugging Face 發布全新 Granite 4.0 3B Vision 模型。這款僅有 30 億參數的輕量級多模態模型,專為企業級文件理解、圖表分析與 OCR 數據提取而設計。其小巧的體積不僅大幅降低了部署門檻與運算成本,更在處理複雜商業報表與 PDF 文件時展現出極高的實用性,是企業本地化部署的理想選擇。
第 20 期《Open Artifacts》開源週報帶來了多個全新組織與新型態開源模型的發布。 重點亮點包含 NVIDIA 的 Nemotron Super 系列、專注於印度語系的 Sarvam AI,以及 Cohere 推出的 Transcribe 語音轉寫相關模型。 這波釋出展示了開源生態系正朝向更多元、更具特定領域專業化(如多語言與語音)的方向快速演進。
知名 AI 科技週報《Import AI》第 451 期聚焦三大前沿議題。首先探討「政治超智慧」對人類社會與民主體制的衝擊,並提出科技是否已無法收回的詰問;其次介紹 Google 借鑑閔斯基理論的「心智社會」多智慧體協作研究,展示群體 AI 解決複雜問題的潛力;最後則分享了結合強化學習與精準物理控制的機器人鼓手技術。