在 Google I/O 大會前夕的空檔,Latent Space 特別推薦了一篇備受關注的部落格文章。該文深入探討求職者如何準備並進入頂尖 AI 實驗室(如 OpenAI、Anthropic 等)從事核心的「預訓練(Pretraining)」工作。內容涵蓋預訓練工程師所需的關鍵技能、知識儲備與面試準備方向,是志在投身前沿 AI 研發者的必讀指南。
Simon Willison 在 PyCon US 2026 的 5 分鐘閃電演講中,回顧了自 2025 年 11 月以來的 LLM 關鍵進展。他指出這半年間「最強模型」在三大巨頭間易手五次(包含 GPT-5.1、Gemini 3 與 Claude Opus 4.5)。最重要的是,得益於可驗證獎勵的強化學習(RLVR),程式碼生成 Agent(如 Claude Code)已跨越實用門檻,成為開發者的日常主力工具。
Hugging Face 推出全新「Ettin Reranker」重排模型家族,旨在解決 RAG 系統中檢索精度不足的痛點。該系列模型涵蓋多種參數大小,支援多語言與長文本處理,並與 Hugging Face 生態系深度整合。Ettin 透過創新的架構設計,在保持低延遲的同時,顯著提升了重排(Reranking)階段的 NDCG 指標,是開發者構建高效能 RAG 應用的全新開源選擇。
Vercel 推出新功能,允許開發者在 Vercel Sandbox 中運行 Claude 託管型 Agent (Claude Managed Agents)。 此整合為 Claude Agent 提供了一個安全、隔離且完全託管的沙盒環境,用於執行動態程式碼或敏感任務。 開發者可以更輕鬆地構建具備程式碼執行能力的 AI 應用,無需自行維護複雜的安全沙盒基礎設施。
Google DeepMind 宣布生物學家成功利用其 AI 系統「Co-Scientist」加速基因篩選流程。該系統協助研究人員在龐大的基因數據中,精準辨識出能有效逆轉人類細胞衰老(細胞年輕化)的全新關鍵遺傳因子。這項突破不僅展示了 AI 在生醫領域的強大預測與實驗設計能力,也為抗衰老療法與再生醫學開闢了全新路徑。
Elon Musk 指控 Sam Altman 與 OpenAI「竊取慈善機構」的訴訟迎來重大判決。陪審團一致認為 Musk 拖延了太長時間才提起訴訟,法官隨即確認了這項裁決,宣告 Musk 敗訴。對此,Musk 的法律團隊已表示計劃提出上訴。
知名開源 OCR 工具 PaddleOCR 3.5 正式整合至 Hugging Face Transformers 生態系。開發者現在可以直接使用 PyTorch/Transformers 後端執行文字偵測、識別及表格解析等任務,無需安裝複雜的 PaddlePaddle 框架。這項更新極大地簡化了 OCR 與 RAG(檢索增強生成)等下游任務的整合流程。
Hugging Face 與 IBM Research 合作發表「Open Agent Leaderboard」,這是一個專為 AI 智能體(Agent)設計的全新開源排行榜。傳統的 LLM 評測難以衡量模型在實際任務中的多步驟規劃與工具調用能力,該排行榜整合了多個主流 Agent 評測集,提供客觀、標準化的評估標準,推動開源 Agent 生態系的發展。
本期 Latent Space 訪談了烏克蘭無人機新創 The Fourth Law 創辦人 Yaroslav Azhnyuk 與客座主持人 Noah Smith。他們深入探討了從寵物攝影機轉向 AI 導引武器的技術歷程,解析了現代自主無人機的技術棧與低成本製造經濟學。Azhnyuk 警告,西方國家在面對這場由 AI 驅動的無人機軍備競賽中顯得過於遲鈍,亟需正視其對未來國防的衝擊。
本期 Import AI 深入探討三個前沿議題:首先是「AI 版 Stuxnet」,分析自主 AI 代理如何被用於發動高精準度、具備適應性的網路攻擊;其次剖析近期在開源社群大放異彩的 Muon 優化器,探討其獨特的正交化機制及在實際應用中遇到的「詛咒」與挑戰;最後介紹「積極對齊(Positive Alignment)」概念,呼籲安全研究應從單純的「禁止有害行為」轉向「主動引導 AI 促進人類合作與福祉」。
隨著生成式 AI 的普及,許多人開始利用 AI 大量產出漏洞報告,導致企業的漏洞賞金計劃(Bug Bounty)正遭受無窮無盡的「AI 垃圾(AI slop)」轟炸。這些報告充斥著虛假資訊與幻覺,迫使安全團隊花費大量時間進行過濾,嚴重拖慢了真正關鍵漏洞的修復進度。
Google DeepMind 宣布將 Project Genie 的使用權限擴大至全球 Google AI Ultra 訂閱者,並推出結合 Google Street View(街景)的全新功能。用戶現在能將真實世界的街道與地標,直接轉化為可互動、可探索的虛擬模擬環境。這項技術結合了生成式世界模型與真實地理數據,為遊戲開發、虛擬實境及 AI 代理的空間訓練帶來全新突破。
Google DeepMind 發表新一代「Gemini Omni」模型,採用原生端到端全模態架構,能同時處理並輸出文字、音訊與視覺資訊。該模型顯著降低了互動延遲,實現如同真人般的流暢對話與即時視訊引導,未來將深度整合至 Android 系統與 Google 生態系,並透過 API 開放給開發者。
本資訊基於 Google DeepMind 釋出的標題「Google Antigravity 2.0」進行推測。鑑於 DeepMind 長期深耕「AI 應用於科學(AI for Science)」領域,此項目極可能是繼 AlphaFold 與 GNoME 之後,針對複雜物理系統、量子重力或天文物理模擬的新一代 AI 基礎模型,旨在突破傳統物理計算的瓶頸。
英國國民保健署(NHS)因「Project Glasswing」回報的 AI 安全漏洞,決定關閉其開源程式庫。對此,英國政府數位服務局(GDS)罕見公開介入,發布指引強調公共部門應「預設保持開源」,指出將程式碼私有化會增加成本並減少外部監督。專家指出,這代表英國政府內部對於開源與安全政策產生了嚴重的公開分歧。
Google DeepMind 宣布推出「Gemini for Science」計畫,整合了一系列專為科學研究設計的 AI 工具與實驗。該計畫旨在利用 Gemini 的多模態與推理能力,協助科學家擴大研究規模並提升探索的精準度。這標誌著 AI 從通用助手邁向深度的科學發現夥伴,為材料科學、生物醫學等領域帶來新的可能性。
Google DeepMind 宣布擴大其內容識別工具,協助使用者了解網頁內容的建立與編輯過程。此舉包含在 Google 搜尋與廣告中整合 C2PA(內容來源和真實性聯盟)元數據,讓使用者能透過「關於此圖片」功能查看圖片是否由 AI 生成或經過編輯。同時,Google 也持續推廣其 SynthID 數位浮水印技術,以提升數位內容的透明度與可信度。
本期《Open Artifacts》電子報彙整了近期極為熱鬧的開放模型生態。多款重量級旗艦模型接連登場,包含 Google 的 Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5 以及 GLM-5.1 等。文章除了盤點這些模型的發布外,也深入探討了 CAISI 針對最新模型所進行的 V4 安全與能力評估,呈現開源與開放權重模型在技術與安全合規上的最新進展。
隨著預測市場(如 Kalshi 和 Polymarket)的爆發性成長,美國商品期貨交易委員會(CFTC)正高度重視其中的合規問題。 監管機構計劃押注人工智慧(AI)技術,透過分析交易模式與異常數據,來捕捉預測市場中的內線交易。 此舉反映出美國政府對於新興金融預測平台加強監管的決心,並試圖利用科技手段維護市場公平性。
Google DeepMind 宣布與新加坡政府建立全新的國家級合作夥伴關係。雙方將攜手導入前沿 AI 技術,共同解決醫療保健、教育系統優化以及環境永續發展等複雜的社會與國家級挑戰。這項合作不僅強化了新加坡在亞太地區的 AI 領先地位,也展示了公私部門如何協同推動負責任的 AI 應用。
劍橋大學教授 Clare Bryant 正在使用 Google DeepMind 的 AI 系統「Co-Scientist」進行前沿醫學研究。該研究旨在識別新興傳染病中的「分子開關」(基因觸發因素),以了解病原體如何引發體內免疫反應。透過 AI 的協作,科學家能夠更快速地篩選複雜的基因數據,為未來應對大流行病和開發新療法提供關鍵線索。
Alphabet 旗下的生技公司 Calico Life Sciences 宣布與 Google DeepMind 合作,導入名為「Co-Scientist」的 AI 系統。該系統旨在協助科學家連結龐雜且零散的生物醫學研究文獻與實驗數據。透過 Co-Scientist 的強大推理與關聯能力,研究團隊得以加速發現抗老化領域的新線索,並生成具潛力的全新科學假說。
Google DeepMind 分享了研究員 Filippo Menolascina 如何利用 AI 系統「Co-Scientist」來攻克複雜的肝臟疾病。該系統不僅協助識別出全新的肝臟疾病治療方案,還成功解釋了為何現有藥物只對部分患者群體產生療效。這項突破展示了 AI 代理(AI Agents)在生物醫學與精準醫療領域的巨大潛力,能大幅縮短科學假說的驗證週期。
Google DeepMind 宣布其 AI 科學助手「Co-Scientist」成功串聯波士頓兒童醫院與麻省理工學院(MIT)的實驗室。雙方將結合生物技術工具包,共同探索基於 RNA 的肌萎縮性脊髓側索硬化症(ALS,俗稱漸凍症)全新治療方案。這項合作展示了 AI 在加速複雜生物醫學研究與跨機構協作中的巨大潛力。
史丹佛大學的遺傳學家利用 Google DeepMind 開發的 AI 系統「Co-Scientist」,加速尋找治療慢性肝病和肝纖維化的新方法。該研究專注於「老藥新用」(drug repurposing),透過 AI 分析現有藥物對抗肝纖維化的潛力。這項合作展示了 AI 代理(AI Agents)在生物醫學研究中,如何大幅縮短藥物研發時程並降低成本。
晶片獨角獸 Cerebras Systems 正式啟動估值高達 600 億美元的 IPO 案。這家以「晶圓級引擎(WSE)」巨大晶片聞名的公司,長期以來致力於透過單一超大晶片解決 AI 運算瓶頸。本次 IPO 不僅是半導體與 AI 領域的重大里程碑,也象徵著市場對 Nvidia 替代方案的強烈渴望與資金挹注。
Google DeepMind 發表案例,展示其新一代天氣預報 AI 模型「WeatherNext」如何協助美國國家颶風中心(NHC)。在面對歷史性颶風「梅麗莎」(Hurricane Melissa)襲擊牙買加時,WeatherNext 提供了極為精準的登陸預測,讓氣象預報員能提前向當地社區發出警報,爭取到前所未有的黃金準備時間,展現了 AI 在防災與氣象預報上的巨大潛力。
Google DeepMind 正式發表新一代模型 Gemini 3.5,強調「具備行動力的前沿智能」。 該模型的核心設計旨在協助使用者執行複雜的代理型工作流(agentic workflows),代表 AI 從單純的資訊檢索走向主動執行任務。 這項更新將為開發者與企業帶來更強大的自動化與多步驟決策能力。
Anthropic 涉及的 15 億美元歷史性著作權集體訴訟和解案目前進展受阻。負責法官決定延後批准該協議,主因是原告律師被指控為了奪取高達 3.2 億美元的鉅額律師費而倉促達成和解。與此同時,參與訴訟的作家們正極力爭取更高的賠償金,使這起 AI 領域最大的版權糾紛案變得更加複雜。
知名學術預印本平台 arXiv 宣布新政策,針對提交 AI 生成之「垃圾內容(slop)」與「幻覺(hallucinations)」的作者實施嚴厲懲罰。根據 arXiv 社群媒體上板主的說明,違規者將被處以「禁投一年」的處罰。此舉旨在維護學術研究的真實性與品質,防堵日益氾濫的 AI 劣質學術寫作對科研生態造成的破壞。