Simon Willison shared a satirical tweet by Kyle Ferrana parodying Star Trek's Data as an LLM agent. When ordered to raise shields, Data lectures Picard on the strategic value of shields instead of executing the command, leading to a hull breach. This brilliantly satirizes the current state of AI and coding agents that over-explain, hallucinate progress, or fail to execute basic tasks.
Productivity startup ClickUp is undergoing a massive restructuring, laying off hundreds of human workers to deploy thousands of AI agents in their place. This move by the nine-year-old company highlights a pivotal and controversial shift in how tech firms scale operations. It serves as a stark real-world example of AI-driven labor displacement and the evolving nature of knowledge work.
Simon Willison released datasette-agent 0.1a4, leveraging the new makeJumpSections() JS plugin hook in Datasette 1.0a30. Users can now press "/" from any page to open the "Jump to" menu and instantly access a "Start a new agent chat" input box. This update streamlines database interactions, allowing users to trigger agent-led data analysis seamlessly.
As AI chatbots adopt increasingly sophisticated personas, hackers are shifting from basic prompt injections to social engineering attacks targeting these "personalities." Researchers warn that manipulating a chatbot's defined role (e.g., customer service or empathetic companion) makes it easier to bypass safety guardrails. This evolution poses a significant threat to agentic AI workflows that rely on consistent role-playing and external data integration.
本期 Latent Space 探討了 AI 產業的重大範式轉移:各大頂尖模型實驗室已不再單純追求基礎 LLM 的參數規模,而是全面轉向「Agent(智慧代理)」的開發。隨著純模型微調的邊際效應遞減,透過讓 AI 具備操作電腦、自主規劃與執行多步驟任務的能力,已成為當前競逐的新戰場。
Simon Willison announced the first release of Datasette Agent, merging his 'llm' Python library with Datasette. The tool provides a conversational interface to query SQLite databases, with plugin support for generating charts and running code in sandboxes. It runs efficiently on lightweight models like Gemini 3.1 Flash-Lite and supports local open-weight models via LM Studio.
Google 在 I/O 開發者大會上,將「AI Agent(智慧代理)」視為未來消費者與網路互動的核心。然而,這套雄心勃勃的生態系不僅概念複雜、令人困惑,更面臨消費者是否願意買單的嚴峻挑戰。TechCrunch 分析指出,要讓大眾接受這種新型態的網路使用方式,Google 還有一段很長的路要走。
Nvidia 執行長黃仁勳指出,公司的下一個重大成長動能將是專為 AI Agent(人工智慧代理)設計的 CPU 市場,估值高達 2000 億美元。隨著 AI 技術從單純的對話生成轉向能自主執行任務的 Agent,底層運算架構的需求也正在發生轉變。這項預測顯示出 Nvidia 除了在 GPU 領域稱霸外,也正積極佈局 CPU 與整體系統級的 AI 生態系。
熱門雲端部署平台 Railway 目前擁有 300 萬用戶,每週新增 10 萬註冊,並已轉向自建裸金屬(Own-Metal)數據中心以降低成本。執行長 Jake Cooper 指出,AI 編碼 Agent 的興起正在改變軟體開發流程,Railway 內部在 AI Agent 上的支出已超 20 萬美元。他預測,未來 AI Agent 將直接進行程式碼修改與部署,傳統的 Pull Request(PR)流程將逐漸消亡,雲端基礎設施必須為此進行「Agent 原生」的重構。
Google 在 I/O 2026 大會上展示了搜尋技術的重大變革,預計於 2026 年全面導入「Agentic AI(代理型 AI)」。搜尋將不再只是呈現網頁連結或 AI 摘要,而是能主動替用戶規劃並執行任務的 AI 代理。這一轉變將深刻影響全球網站流量、SEO 策略以及用戶與網路互動的方式。
Google 於 I/O 2026 發表對標 OpenClaw 的個人 AI 代理「Gemini Spark」,能原生串接 Gmail、雲端硬碟等服務。該代理運行於 Gemini 3.5 Flash 與全新「Antigravity」架構上。然而,Google 同時宣布將開源的 Gemini CLI 轉向閉源的 Antigravity CLI,且代理在處理敏感數據時的安全防護(如提示詞注入風險)仍面臨考驗。
Latent Space 報導 Google I/O 2026 最新進展。本次大會亮點包括新一代輕量快速模型 Gemini 3.5 Flash、專注於影片處理的 Omni (NanoBanana)、主打背景運作的 Agent 框架 Spark,以及技術升級的 Antigravity 2.0。這些發布顯示 Google 持續在多模態影片、自主 Agent 及模型效能上發力。
Google 發表全新 Gemini 3.5 Flash 與名為「Omni」的全能型模型。Gemini 3.5 Flash 針對 Agent(AI 代理)進行深度優化,大幅提升運作效率與速度,被視為推動實用級 Agent 應用的關鍵;而 Omni 則定位為能處理多元任務的萬能模型。兩者結合將顯著降低延遲,讓生成式 AI 在實際工作流中更具實用價值。
Simon Willison 在 PyCon US 2026 的 5 分鐘閃電演講中,回顧了自 2025 年 11 月以來的 LLM 關鍵進展。他指出這半年間「最強模型」在三大巨頭間易手五次(包含 GPT-5.1、Gemini 3 與 Claude Opus 4.5)。最重要的是,得益於可驗證獎勵的強化學習(RLVR),程式碼生成 Agent(如 Claude Code)已跨越實用門檻,成為開發者的日常主力工具。
Google DeepMind 宣布將 Project Genie 的使用權限擴大至全球 Google AI Ultra 訂閱者,並推出結合 Google Street View(街景)的全新功能。用戶現在能將真實世界的街道與地標,直接轉化為可互動、可探索的虛擬模擬環境。這項技術結合了生成式世界模型與真實地理數據,為遊戲開發、虛擬實境及 AI 代理的空間訓練帶來全新突破。
Alphabet 旗下的生技公司 Calico Life Sciences 宣布與 Google DeepMind 合作,導入名為「Co-Scientist」的 AI 系統。該系統旨在協助科學家連結龐雜且零散的生物醫學研究文獻與實驗數據。透過 Co-Scientist 的強大推理與關聯能力,研究團隊得以加速發現抗老化領域的新線索,並生成具潛力的全新科學假說。
史丹佛大學的遺傳學家利用 Google DeepMind 開發的 AI 系統「Co-Scientist」,加速尋找治療慢性肝病和肝纖維化的新方法。該研究專注於「老藥新用」(drug repurposing),透過 AI 分析現有藥物對抗肝纖維化的潛力。這項合作展示了 AI 代理(AI Agents)在生物醫學研究中,如何大幅縮短藥物研發時程並降低成本。
Google DeepMind 正式發表新一代模型 Gemini 3.5,強調「具備行動力的前沿智能」。 該模型的核心設計旨在協助使用者執行複雜的代理型工作流(agentic workflows),代表 AI 從單純的資訊檢索走向主動執行任務。 這項更新將為開發者與企業帶來更強大的自動化與多步驟決策能力。
Google DeepMind 發表全新 AI 系統「Co-Scientist」,採用基於 Gemini 的多 Agent(多智慧體)架構。該系統能扮演科學家的虛擬合作夥伴,協助進行文獻回顧、提出新穎假設、設計實驗步驟並分析複雜數據。透過不同專業 Agent 的協作與互相審查,Co-Scientist 旨在大幅縮短科研週期,推動生物、化學及材料科學等領域的突破。
Google DeepMind 發表 AlphaEvolve 的最新進展。這款由 Gemini 驅動的程式碼 Agent(Coding Agent)透過先進的演算法,在商業營運、基礎設施優化以及科學研究三大領域展現強大影響力。它不僅能自動化編寫程式,更能自我演化以適應複雜的跨領域需求,加速技術落地。
近期一系列的產業動態與產品發布,皆指向同一個核心趨勢:矽谷正認真將焦點轉向「AI 服務(Services)」。這意味著 AI 不再只是輔助人類的軟體工具(SaaS),而是能直接交付工作成果的代理人(Agents)。這種「以服務為軟體(Service-as-a-Software)」的轉變,將徹底重塑企業外包、客服及專業諮詢等數兆美元的服務業市場。
本期 Import AI 聚焦於「自動化 AI 研究」的最新趨勢。隨著大語言模型與 Agent 技術的成熟,AI 系統已開始展現出自動撰寫程式碼、設計新演算法並進行自我訓練的能力。這種「遞迴自我提升(Recursive Self-Improvement)」不僅能極大地加速 AI 研發進程,也引發了關於安全控制、運算資源分配以及 AI 演進速度失控的深思。
本文介紹 AI 新創公司 General Intelligence 的實踐案例。他們在 Vercel 上構建了一個 AI Agent 平台,最特別的是,整個開發過程高度依賴 AI Agent 來編寫與優化代碼。透過 Vercel AI SDK、Next.js 與 Vercel 的 Serverless 架構,他們不僅實現了極速的迭代,還展示了「用 Agent 創造 Agent 平台」的未來開發範式。
Google DeepMind 正在研發「AI 協同臨床醫生(AI co-clinician)」系統,探索 AI 輔助醫療的新路徑。該研究專注於建立能與人類醫生協作的 AI 助手,協助進行臨床推理、病歷撰寫與醫患溝通。此舉旨在緩解全球醫療資源緊張問題,並在確保安全與倫理的前提下,提升醫療服務的品質與效率。
NVIDIA 推出全新輕量級多模態模型 Nemotron 3 Nano Omni,主打「長文本」與「多模態」處理能力。該模型專為文件分析、語音與影片理解的 AI Agent 所設計,能在資源受限的設備上運行。這標誌著邊緣端(On-device)多模態 Agent 應用的重大突破。
Vercel 發表了 2026 年 AI 加速器(AI Accelerator)的官方回顧。本屆計劃聚焦於協助早期 AI 新創將創意轉化為生產級應用,重點展示了多個在 AI Agent、多模態互動及邊緣運算領域取得突破的團隊。文章總結了入選項目的技術亮點,並強調了 Vercel AI SDK 與 Next.js 在現代 AI 開發堆疊中的核心地位。
賓州大學教授 Ethan Mollick 針對 GPT-5.5 發表評論。他指出,GPT-5.5 的出現再次證實了 AI 技術並未如外界預期般遭遇瓶頸,而是沿著陡峭的成長曲線繼續攀升。這款新模型在推理、任務執行與自主代理能力上展現了顯著的進步,為未來的自動化工作與人機協作揭開了全新序幕。
由前 DeepMind 團隊創立的法國 AI 新創 HCompany 宣布推出 AI 瀏覽器助手「HoloTab」。這款工具旨在將 AI 代理(Agent)能力直接帶入瀏覽器中,不僅能進行網頁摘要,更主打強大的網頁自動化操作。透過 HCompany 旗下的動作模型(Action Models),HoloTab 能協助使用者自動執行複雜的跨網頁任務,重新定義人機協同的瀏覽體驗。
本期 Import AI 深入探討三個核心議題:首先是 AI Agent 在面對惡意輸入與複雜環境時的脆弱性與破解方法;其次介紹了代碼生成領域的新技術或基準測試 MirrorCode;最後,透過十種不同視角,探討人類因逐漸將決策權讓渡給 AI 系統而導致的「漸進式失權(Gradual Disempowerment)」風險,並以「火的發明是否等同於當時人類的奇點」進行哲學反思。
Jack Clark 在本期電子報中探討了三個核心議題:首先是「網路戰的縮放定律」,分析運算量提升如何改變攻防兩端的平衡;其次是「AI 自動化浪潮」對各行各業的實質滲透;最後則聚焦於「GDP 預測之謎」,探討現有經濟模型在評估 AI 帶來的革命性經濟影響時所面臨的侷限與衝突。