由知名心靈導師 Tony Robbins 與冥想 App「Calm」前團隊成員共同創立的 AI 心理健康平台「The Path」正式亮相。該公司強調其 AI 模型在心理健康安全基準測試「Vera-MH」中獲得了 95 分的高分,遠高於一般消費級聊天機器人最高僅 65 分的表現。這項技術旨在解決當前 AI 進行心理諮商時可能產生的安全與倫理風險,提供更具臨床安全性的數位支持。
Google 在 I/O 開發者大會上,將「AI Agent(智慧代理)」視為未來消費者與網路互動的核心。然而,這套雄心勃勃的生態系不僅概念複雜、令人困惑,更面臨消費者是否願意買單的嚴峻挑戰。TechCrunch 分析指出,要讓大眾接受這種新型態的網路使用方式,Google 還有一段很長的路要走。
由於全球鋁價近期飆升 20%,回收產業迎來巨大商機。許多回收新創公司正積極導入 AI 技術,藉由先進的影像識別與自動化分類系統,大幅提升鋁等關鍵礦物的回收效率與純度。此舉不僅能降低對傳統採礦的依賴,更旨在建立一個龐大且可持續的再生金屬供應源,實現循環經濟與商業利益的雙贏。
本文整理 Google 最新 AI 訂閱方案指南。除了常見的個人版外,重點解析每月 100 美元與 200 美元的高階/企業級方案差異。兩者主要在於專屬算力優先權、脈絡長度(Context Window)限制、企業級隱私安全防護,以及自動化 AI Agent 的部署權限,幫助企業與專業開發者選擇最合適的方案。
OpenAI 的新一代模型 GPT-next 展現了驚人的數學推理能力,成功證偽了由著名數學家保羅·艾狄胥(Paul Erdős)於 1946 年提出的平面單位距離猜想。 令人震驚的是,這項突破性研究所花費的運算成本竟然不到 1,000 美元。 此成果標誌著 AI 在科學與數學發現上的巨大潛力,展示了推理模型在解決未解科學難題時的高效與低成本。
Nvidia 執行長黃仁勳指出,公司的下一個重大成長動能將是專為 AI Agent(人工智慧代理)設計的 CPU 市場,估值高達 2000 億美元。隨著 AI 技術從單純的對話生成轉向能自主執行任務的 Agent,底層運算架構的需求也正在發生轉變。這項預測顯示出 Nvidia 除了在 GPU 領域稱霸外,也正積極佈局 CPU 與整體系統級的 AI 生態系。
xAI has released Grok Imagine Video 1.5, a model that animates a still image into a short video clip. It generates synchronized audio during the same pass, combining visual animation and sound creation in one workflow. The Replicate Blog post focuses on prompting techniques intended to help users get more from the model.
熱門雲端部署平台 Railway 目前擁有 300 萬用戶,每週新增 10 萬註冊,並已轉向自建裸金屬(Own-Metal)數據中心以降低成本。執行長 Jake Cooper 指出,AI 編碼 Agent 的興起正在改變軟體開發流程,Railway 內部在 AI Agent 上的支出已超 20 萬美元。他預測,未來 AI Agent 將直接進行程式碼修改與部署,傳統的 Pull Request(PR)流程將逐漸消亡,雲端基礎設施必須為此進行「Agent 原生」的重構。
根據 SpaceX 最新提交的 S-1 上市招股書,該公司已與 AI 巨頭 Anthropic 簽署雲端服務協議。Anthropic 將自 2026 年 5 月起至 2029 年 5 月,每月支付高達 12.5 億美元以租用 Colossus 與 Colossus II 超級電腦的算力。此外,招股書也證實 xAI 的 Grok 5 目前正於 Colossus II 進行訓練。
開發者 Mike Veerman 製作了一個名為「tokenspeed」的 HTML 模擬工具,能呈現大語言模型(LLM)在每秒 5 到 800 個 Token 之間的生成速度。當各大廠商宣稱其模型達到特定 Token 速度時,使用者常難以想像其實際體感。此工具能幫助開發者與設計師直觀評估不同速度下的使用者體驗與 UI 設計。
Google 在 I/O 2026 大會上展示了搜尋技術的重大變革,預計於 2026 年全面導入「Agentic AI(代理型 AI)」。搜尋將不再只是呈現網頁連結或 AI 摘要,而是能主動替用戶規劃並執行任務的 AI 代理。這一轉變將深刻影響全球網站流量、SEO 策略以及用戶與網路互動的方式。
Google 於 I/O 2026 發表對標 OpenClaw 的個人 AI 代理「Gemini Spark」,能原生串接 Gmail、雲端硬碟等服務。該代理運行於 Gemini 3.5 Flash 與全新「Antigravity」架構上。然而,Google 同時宣布將開源的 Gemini CLI 轉向閉源的 Antigravity CLI,且代理在處理敏感數據時的安全防護(如提示詞注入風險)仍面臨考驗。
人形機器人新創公司 Figure AI 近期推出了 24 小時不間斷的直播,展示其人形機器人在模擬倉庫環境中搬運與處理包裹。這個直播迅速在網路上走紅,吸引了大量觀眾駐足觀看。這項企劃不僅展示了機器人在實際工作場景中的穩定度與技術進步,也揭示了人類對於「人形」機器人從事日常勞動時所產生的獨特情感連結與好奇心。
Latent Space 報導 Google I/O 2026 最新進展。本次大會亮點包括新一代輕量快速模型 Gemini 3.5 Flash、專注於影片處理的 Omni (NanoBanana)、主打背景運作的 Agent 框架 Spark,以及技術升級的 Antigravity 2.0。這些發布顯示 Google 持續在多模態影片、自主 Agent 及模型效能上發力。
Google 在 I/O 大會上正式推出 Gemini 3.5 Flash,跳過預覽版直接進入一般可用階段,並將全面導入 Google 搜尋、Gemini App 及開發者平台。然而,新模型的 API 價格大幅上漲,輸入與輸出費用分別為每百萬代幣 1.5 美元與 9 美元,是前代 Flash 預覽版的 3 倍,顯示出各大 AI 廠商正開始測試市場對高定價的接受度。
最新研究指出,兩款 AI 科學助手在「老藥新用(Drug Retargeting)」任務中取得成功。這兩款工具皆能針對現有藥物尋找新適應症並生成科學假說,其中一款工具甚至能進一步對相關數據進行分析。這項進展顯示 AI 在加速生物醫藥研發、降低臨床前研究成本上具有極大潛力。
艾倫人工智慧研究所(AI2)推出 OlmoEarth v1.1,這是一系列專為地球觀測與衛星影像分析設計的全新高效模型。此版本在維持高精度的同時,顯著提升了運算效率與推理速度。OlmoEarth v1.1 的開源將有助於環境監測、氣候變遷研究及地理空間數據分析的普及與應用。
Google 開發的 AI 水印技術 SynthID 迎來重大突破,宣布獲得 OpenAI、NVIDIA 等多家科技巨頭採用。隨著 AI 生成的文字、影像與影音擬真度大幅提升,如何辨識真偽成為關鍵挑戰。此舉標誌著各大 AI 領導廠商在內容溯源與安全防護上達成罕見共識,有望建立統一的 AI 生成內容識別標準。
Google 發表全新 Gemini 3.5 Flash 與名為「Omni」的全能型模型。Gemini 3.5 Flash 針對 Agent(AI 代理)進行深度優化,大幅提升運作效率與速度,被視為推動實用級 Agent 應用的關鍵;而 Omni 則定位為能處理多元任務的萬能模型。兩者結合將顯著降低延遲,讓生成式 AI 在實際工作流中更具實用價值。
美國兩大電力巨頭 NextEra Energy 與 Dominion Energy 宣布進行巨額合併,這項交易的核心驅動力完全是為了應對 AI 與雲端運算資料中心爆發性的電力需求。Dominion 所在的維吉尼亞州是全球最大的資料中心樞紐,而 NextEra 則是領先的再生能源開發商。然而,這項合併案也引發了監管機構與消費者的擔憂,因為龐大的基礎設施建設成本,最終可能會轉嫁到一般民生用戶身上,導致電費費率上升。
Simon Willison 在 PyCon US 2026 的 5 分鐘閃電演講中,回顧了自 2025 年 11 月以來的 LLM 關鍵進展。他指出這半年間「最強模型」在三大巨頭間易手五次(包含 GPT-5.1、Gemini 3 與 Claude Opus 4.5)。最重要的是,得益於可驗證獎勵的強化學習(RLVR),程式碼生成 Agent(如 Claude Code)已跨越實用門檻,成為開發者的日常主力工具。
Vercel 宣布推出「固定費率 CDN」(Flat Rate CDN)的限量測試。這項新服務旨在解決開發者長期以來對 CDN 流量計費不確定性的擔憂。透過固定的費率結構,用戶可以更輕鬆地預測每月基礎設施成本,避免因網站流量突增或惡意攻擊而面臨天價帳單,為託管於 Vercel 的專案提供更高的財務安全感。
一名男子因不滿在 Facebook 知名社團「Are We Dating the Same Guy」中被指控為「糟糕的約會對象」,憤而提起報復性訴訟。然而,他使用 AI 協助撰寫起訴書,導致內容充斥著 AI 虛構的法律判例。法官識破這些「幻覺」判例後駁回訴訟,再次為濫用 AI 寫訴狀的行為敲響警鐘。
Google DeepMind 宣布生物學家成功利用其 AI 系統「Co-Scientist」加速基因篩選流程。該系統協助研究人員在龐大的基因數據中,精準辨識出能有效逆轉人類細胞衰老(細胞年輕化)的全新關鍵遺傳因子。這項突破不僅展示了 AI 在生醫領域的強大預測與實驗設計能力,也為抗衰老療法與再生醫學開闢了全新路徑。
Elon Musk 指控 Sam Altman 與 OpenAI「竊取慈善機構」的訴訟迎來重大判決。陪審團一致認為 Musk 拖延了太長時間才提起訴訟,法官隨即確認了這項裁決,宣告 Musk 敗訴。對此,Musk 的法律團隊已表示計劃提出上訴。
知名開發者 Simon Willison 在參加完 PyCon US 年會後,於啟程回家前的最後一個早晨前往加州洛杉磯河畔散步。他成功觀測並拍攝到了他一直想尋找的褐鵜鶘,同時也記錄了灰翅鷗、雪鷺以及在天鵝船湖畔活動的加拿大雁幼雛。此篇為其個人的自然觀測記錄。
本期 Latent Space 訪談了烏克蘭無人機新創 The Fourth Law 創辦人 Yaroslav Azhnyuk 與客座主持人 Noah Smith。他們深入探討了從寵物攝影機轉向 AI 導引武器的技術歷程,解析了現代自主無人機的技術棧與低成本製造經濟學。Azhnyuk 警告,西方國家在面對這場由 AI 驅動的無人機軍備競賽中顯得過於遲鈍,亟需正視其對未來國防的衝擊。
本期 Import AI 深入探討三個前沿議題:首先是「AI 版 Stuxnet」,分析自主 AI 代理如何被用於發動高精準度、具備適應性的網路攻擊;其次剖析近期在開源社群大放異彩的 Muon 優化器,探討其獨特的正交化機制及在實際應用中遇到的「詛咒」與挑戰;最後介紹「積極對齊(Positive Alignment)」概念,呼籲安全研究應從單純的「禁止有害行為」轉向「主動引導 AI 促進人類合作與福祉」。
隨著生成式 AI 的普及,許多人開始利用 AI 大量產出漏洞報告,導致企業的漏洞賞金計劃(Bug Bounty)正遭受無窮無盡的「AI 垃圾(AI slop)」轟炸。這些報告充斥著虛假資訊與幻覺,迫使安全團隊花費大量時間進行過濾,嚴重拖慢了真正關鍵漏洞的修復進度。
Google DeepMind 宣布將 Project Genie 的使用權限擴大至全球 Google AI Ultra 訂閱者,並推出結合 Google Street View(街景)的全新功能。用戶現在能將真實世界的街道與地標,直接轉化為可互動、可探索的虛擬模擬環境。這項技術結合了生成式世界模型與真實地理數據,為遊戲開發、虛擬實境及 AI 代理的空間訓練帶來全新突破。