Google DeepMind 發表案例,展示其新一代天氣預報 AI 模型「WeatherNext」如何協助美國國家颶風中心(NHC)。在面對歷史性颶風「梅麗莎」(Hurricane Melissa)襲擊牙買加時,WeatherNext 提供了極為精準的登陸預測,讓氣象預報員能提前向當地社區發出警報,爭取到前所未有的黃金準備時間,展現了 AI 在防災與氣象預報上的巨大潛力。
知名學術預印本平台 arXiv 宣布新政策,針對提交 AI 生成之「垃圾內容(slop)」與「幻覺(hallucinations)」的作者實施嚴厲懲罰。根據 arXiv 社群媒體上板主的說明,違規者將被處以「禁投一年」的處罰。此舉旨在維護學術研究的真實性與品質,防堵日益氾濫的 AI 劣質學術寫作對科研生態造成的破壞。
本期 Latent Space 專訪醫療 AI 領導品牌 Abridge 的產品副總裁 Janie Lee 與工程副總裁 Chai Asawa。Abridge 透過環境語音識別(Ambient AI)技術,將醫病對話自動轉化為結構化病歷,每週為醫生節省 10 至 20 小時。此外,他們正將應用擴展至「預先授權(Prior Auth)」等行政流程,致力將醫病對話打造為醫療系統的全新作業系統。
本文探討開源 AI 模型生態系的「複利效應」,特別聚焦於中國以 Qwen 和 DeepSeek 為代表的「開源優先」高參與度生態。開源模型透過社群的集體微調、工具鏈優化與應用開發,累積進步的速度已逐漸逼近甚至超越封閉模型。這種去中心化的協作模式不僅降低了技術門檻,更形成了一個自我強化的生態飛輪,對全球 AI 競爭格局產生深遠影響。
AI 研發團隊 Thinking Machines 推出全新原生互動模型「TML-Interaction-Small 276B-A12B」。該模型專為即時語音設計,擁有 276B 總參數與 12B 啟用參數。它不僅刷新了即時語音的技術前沿(SOTA),更透過原生互動機制,徹底取代了傳統的語音活動檢測(VAD)模組,實現更自然、無縫的雙向語音對話。
最新一期 Import AI 聚焦於三大前沿議題。首先,分析了遞迴自我改進(RSI)如何可能引發爆發性的經濟成長,並探討其預測模型。其次,面對難以預測的超智慧(Superintelligence),文章主張監管機構必須保有「極致選擇權」以彈性應對。最後,介紹了結合神經網路架構的新型運算系統(神經電腦)之最新進展。
知名 AI 專家 Nathan Lambert 親自走訪中國多家領先的 AI 實驗室(如 DeepSeek、智譜 AI、零一萬物等),分享第一手觀察。他指出,面對美國嚴苛的晶片制裁,中國實驗室展現出驚人的系統級工程與架構優化能力,並以極低成本推動開源模型(如 Qwen 與 DeepSeek)的快速迭代。然而,嚴格的政府監管審查與對即時商業變現的焦慮,也形塑了與矽谷截然不同的 AI 發展生態。
近期一系列的產業動態與產品發布,皆指向同一個核心趨勢:矽谷正認真將焦點轉向「AI 服務(Services)」。這意味著 AI 不再只是輔助人類的軟體工具(SaaS),而是能直接交付工作成果的代理人(Agents)。這種「以服務為軟體(Service-as-a-Software)」的轉變,將徹底重塑企業外包、客服及專業諮詢等數兆美元的服務業市場。
本期 Import AI 聚焦於「自動化 AI 研究」的最新趨勢。隨著大語言模型與 Agent 技術的成熟,AI 系統已開始展現出自動撰寫程式碼、設計新演算法並進行自我訓練的能力。這種「遞迴自我提升(Recursive Self-Improvement)」不僅能極大地加速 AI 研發進程,也引發了關於安全控制、運算資源分配以及 AI 演進速度失控的深思。
本文深入探討 IBM 最新開源的 Granite 4.1 大語言模型家族。詳細介紹了其從數據清洗、模型架構設計(如優化的 Transformer 結構)到指令微調與安全對齊的完整構建流程。Granite 4.1 延續了 IBM 對於企業級安全與 Apache 2.0 開源協議的承諾,並在代碼生成、工具調用及多語言推理上展現出優異性能。
NVIDIA 推出全新輕量級多模態模型 Nemotron 3 Nano Omni,主打「長文本」與「多模態」處理能力。該模型專為文件分析、語音與影片理解的 AI Agent 所設計,能在資源受限的設備上運行。這標誌著邊緣端(On-device)多模態 Agent 應用的重大突破。
Google DeepMind 宣布與大韓民國(南韓)建立全新合作關係。雙方將攜手利用最先進的前沿 AI 模型,共同加速科學領域的突破性研究。此合作旨在結合 Google DeepMind 的 AI 技術實力與韓國強大的科研生態系統,為全球科學挑戰尋找新型解決方案。
阿聯酋技術創新研究所(TII)在 Hugging Face 上推出了名為「QIMMA」(阿拉伯語意為「山頂」)的全新阿拉伯語 LLM 排行榜。該排行榜主打「品質優先」,旨在解決現有阿拉伯語評估基準中常見的翻譯失真與缺乏方言代表性等問題。QIMMA 透過更嚴格、更貼近在地文化的評測標準,為阿拉伯語 AI 模型的開發提供更具公信力的衡量指標。
本期電子報涵蓋三大核心議題:首先是利用 AI 自動化進行對齊(Alignment)研究的可能性與挑戰;其次是一項針對中國大語言模型的安全與合規性深入研究,揭示其在特定政治與文化框架下的表現;最後介紹了旨在提升推理效率的全新 4 位元浮點格式 HiFloat4。此外,作者也提出了關於金融市場何時會開始為「科技奇點」進行定價的深刻思考。
由前 DeepMind 團隊創立的法國 AI 新創 HCompany 宣布推出 AI 瀏覽器助手「HoloTab」。這款工具旨在將 AI 代理(Agent)能力直接帶入瀏覽器中,不僅能進行網頁摘要,更主打強大的網頁自動化操作。透過 HCompany 旗下的動作模型(Action Models),HoloTab 能協助使用者自動執行複雜的跨網頁任務,重新定義人機協同的瀏覽體驗。
Vercel 宣布其 AI Gateway 正式支援 Seedance 2.0 影片生成模型。開發者現在可以透過 Vercel 的統一接口,輕鬆將先進的影片生成功能整合至應用程式中。此更新讓開發者能同時享有 AI Gateway 提供的快取、速率限制及監控分析等強大功能,優化影片生成應用的開發流程與成本。
本期 Import AI 深入探討三個核心議題:首先是 AI Agent 在面對惡意輸入與複雜環境時的脆弱性與破解方法;其次介紹了代碼生成領域的新技術或基準測試 MirrorCode;最後,透過十種不同視角,探討人類因逐漸將決策權讓渡給 AI 系統而導致的「漸進式失權(Gradual Disempowerment)」風險,並以「火的發明是否等同於當時人類的奇點」進行哲學反思。
阿聯酋技術創新研究所(TII)在 Hugging Face 上發表了「Falcon Perception」模型。這標誌著著名的 Falcon 開源家族正式擴展至多模態與視覺感知領域。該模型旨在提升開源社群在視覺問答、圖像理解及多模態任務上的能力,延續了 TII 一貫的高效能與開源精神,為開發者提供強大的視覺感知工具。
IBM 於 Hugging Face 發布全新 Granite 4.0 3B Vision 模型。這款僅有 30 億參數的輕量級多模態模型,專為企業級文件理解、圖表分析與 OCR 數據提取而設計。其小巧的體積不僅大幅降低了部署門檻與運算成本,更在處理複雜商業報表與 PDF 文件時展現出極高的實用性,是企業本地化部署的理想選擇。
第 20 期《Open Artifacts》開源週報帶來了多個全新組織與新型態開源模型的發布。 重點亮點包含 NVIDIA 的 Nemotron Super 系列、專注於印度語系的 Sarvam AI,以及 Cohere 推出的 Transcribe 語音轉寫相關模型。 這波釋出展示了開源生態系正朝向更多元、更具特定領域專業化(如多語言與語音)的方向快速演進。
知名 AI 科技週報《Import AI》第 451 期聚焦三大前沿議題。首先探討「政治超智慧」對人類社會與民主體制的衝擊,並提出科技是否已無法收回的詰問;其次介紹 Google 借鑑閔斯基理論的「心智社會」多智慧體協作研究,展示群體 AI 解決複雜問題的潛力;最後則分享了結合強化學習與精準物理控制的機器人鼓手技術。
Google DeepMind 發表針對 AI 「有害操縱」風險的研究,特別聚焦於金融與醫療兩大高風險領域。隨著 AI 技術深入日常生活,如何防止 AI 系統對人類進行心理、經濟或健康決策上的惡意引導至關重要。對此,DeepMind 提出了新型的安全評估與防護機制,旨在建立更具韌性且安全的 AI 部署標準。
Google DeepMind 正式發表新一代音樂生成模型 Lyria 3 Pro。該模型突破了以往 AI 音樂長度與結構的限制,具備「結構感知(structural awareness)」能力,能創作結構更完整、長度更長的音樂作品。此外,Google 也宣布將把 Lyria 3 Pro 整合至更多旗下的產品與平台中,為創作者提供更豐富的 AI 輔助創作工具。
本期 Import AI 聚焦三大前沿議題:首先是中國研究將 AI 應用於電子戰與電磁對抗;其次是探討 LLM 在面對特定刺激或「創傷」數據時的行為與安全防禦;最後則是分析 AI 網路攻擊能力如何隨規模擴展,揭示了網路安全面臨的新型量化威脅。最後以哲學思考「無時間限制的心智如何衡量時間」收尾。
Vercel 宣布將極簡建站服務 new.website 整合至旗下的 AI 網頁生成平台 v0。這次聯手旨在消除「從 AI 生成 UI」到「正式上線網站」之間的阻礙。用戶未來將能透過 v0 的自然語言介面,不僅能生成精美的網頁組件,還能直接一鍵發布並部署,大幅降低網頁開發與上線的門檻。
本文分析了 AI 領域熱議的「自我提升(Self-improvement)」機制。作者指出,雖然模型透過生成合成數據、強化學習(RL)和自我校對確實能實現效能提升,但這個過程是「有損(Lossy)」的。每次迭代都會伴隨資訊流失與誤差累積,因此自我提升並不會導致預言中的「急遽暴漲(Fast Takeoff)」或瞬間的智能爆炸,而是呈現邊際效益遞減的漸進式成長。
Hugging Face 發布 2026 年春季開源報告,揭示開源 AI 生態的最新趨勢。報告指出,具備推理能力的開源模型(如 DeepSeek 與 Qwen 系列)已成為社群主流;同時,以 smolagents 為首的輕量級 Agent 框架與本機端(On-Device)小模型正快速普及。此外,開源多模態與影片生成技術的下載量也創下歷史新高,展現出開源社群強大的創新動能。
Jack Clark 在本期電子報中探討了三個技術趨勢與一個社會政治議題。技術上,LLM 訓練其他 LLM(合成資料與自我提升)正成為主流;社群成功完成了 72B 參數模型的分散式訓練,展示了去中心化算力的潛力;同時指出電腦視覺因物理世界的複雜性,比文本生成更具挑戰性。最後,他思考了 AI 的快速崛起是否會導致現有政治體制進入混亂的「過渡期」。
2016 年 AlphaGo 歷史性擊敗圍棋世界冠軍李世乭,開啟了現代 AI 的新紀元。十年過去,Google DeepMind 回顧這項技術如何演變,從 AlphaZero、MuZero 到徹底改變生物學的 AlphaFold。AlphaGo 奠定的強化學習與搜尋演算法,如今正持續加速材料科學、核融合及氣象預測等科學突破,成為邁向 AGI 的關鍵基石。
Vercel 推出全新 Stripe 整合功能,旨在簡化電商網站開發。開發者可利用 Next.js 範本、v0 的 AI 生成能力與一鍵整合,快速設定 Stripe 支付。此更新解決了金流設定繁瑣、環境變數配置複雜的問題,讓從想法到上線縮短至數分鐘,並確保交易安全性。