根據最新法庭裁決,法官已下令 Apple 必須向 Elon Musk 提交涉及其與 OpenAI 秘密交易的內部溝通訊息。此一法律爭議曝光之際,更有內部消息指出,OpenAI 對於 Apple 在其系統中「糟糕的」ChatGPT 整合方式感到極度失望與受挫(feels "burned"),認為該合作未達預期,雙方合作關係似乎出現裂痕。
隨著 AI 需求爆發,美國賓州迎來數據中心建設熱潮,但這引發了當地居民的強烈反彈。在最近的一場鎮民大會中,居民痛批數據中心帶來的噪音、龐大電力與水源消耗,並指責相關單位在規劃過程中缺乏透明度,嚴重損害公共信任。此事件反映出 AI 基礎設施擴張與地方社群利益之間的緊張關係。
Anthropic 旗下熱門命令列 AI 助手 Claude Code 的產品主管 Cat Wu 近日接受專訪。她透露團隊在開發這款 Agent 工具時「沒有宏偉的藍圖」,而是採取刻意為之的靈活迭代策略。訪談重點圍繞在開發者最關心的 API 使用額度與成本限制、如何透過高透明度介面建立信任,以及如何利用「精簡測試架構(lean harness)」在不犧牲效能的前提下,優化 Agent 的執行效率與準確度。
Simon Willison 發布了 Datasette 的新插件 `datasette-llm-limits 0.1a0`。該插件與 `datasette-llm` 和 `datasette-llm-accountant` 協同工作,允許管理員為 Datasette 內部的 LLM 使用設定每位用戶(或全域)的消費限制。例如,可以輕鬆配置每位用戶在滾動 24 小時內最多只能消耗 1.00 美元的 LLM 額度,有效防止 API 帳單爆表。
本期 AINews 聚焦於一個新興趨勢:「萬物皆為協調者(Conductor)」。隨著 AI 應用從單一提示詞轉向複雜的多步驟工作流,如何有效編排、調度多個 AI 代理與工具(如使用類似 Netflix Conductor 或 Temporal 的架構)成為核心。這意味著未來的 AI 開發重點將從單一模型能力,轉向系統級的流程控制與協調。
HashiCorp 創辦人 Mitchell Hashimoto 針對 Bun 從 Zig 改寫為 Rust 發表看法。他指出,過去程式語言具有強大的「鎖定效應」,但如今已變得高度可替代(fungible)。Bun 證明了他們能在短短一兩週內將程式碼移植到任何語言,這意味著在 AI 與代理工程(Agentic Engineering)時代,程式語言只是工具,隨時可以被拋棄與替換。
本期 Latent Space 專訪醫療 AI 領導品牌 Abridge 的產品副總裁 Janie Lee 與工程副總裁 Chai Asawa。Abridge 透過環境語音識別(Ambient AI)技術,將醫病對話自動轉化為結構化病歷,每週為醫生節省 10 至 20 小時。此外,他們正將應用擴展至「預先授權(Prior Auth)」等行政流程,致力將醫病對話打造為醫療系統的全新作業系統。
Datasette 的 AI 代理工具 datasette-agent 發布了 0.1a1 早期測試版本。本次更新主要改進了安全與權限邏輯,現在系統在決定向使用者展示哪些資料表時,會先檢查並遵循 `execute-sql` 權限設定。這有助於在有權限控管的 Datasette 實例中,更安全地讓 AI 代理進行資料查詢。
加州太浩湖(Lake Tahoe)地區的 49,000 名居民正面臨電力危機。當地的電力供應商決定停止服務該地區,轉而將電力資源優先供應給鄰近內華達州蓬勃發展的數據中心。這起事件凸顯了 AI 與雲端運算帶來的數據中心熱潮,已開始直接與民生用電爭奪資源,引發社會與基礎設施分配的爭議。
IBM 發布全新開源多語言嵌入模型 Granite Embedding Multilingual R2。該模型採用寬鬆的 Apache 2.0 授權,支援高達 32K 的上下文長度。在參數小於 1 億(Sub-100M)的同量級模型中,它展現出最頂尖的資訊檢索品質,非常適合用於建構高效能且低資源消耗的 RAG(檢索增強生成)系統。
本期 AINews 聚焦於 AI 寫程式 Agent 的長期發展趨勢。Anthropic 開始針對 Claude 的程式化使用(Programmatic Usage)進行計量與限制,這將直接影響開發者透過自動化腳本或第三方工具調用 Claude 的成本。另一方面,Codex 相關的自動化編程 Agent 影響力持續上升,顯示出 AI 在軟體開發流程中的滲透率正穩定增加。
本文介紹了 Hugging Face 在 LLM 推論優化上的最新技術:在連續批次處理(Continuous Batching)中解鎖非同步(Asynchronicity)機制。傳統的連續批次處理在排程、GPU 執行與 Token 處理間存在同步瓶頸。透過將這些步驟非同步化,能有效重疊 CPU 與 GPU 的工作負載,進而大幅提升推論吞吐量並優化首字輸出時間(TTFT)。
在一個相對平靜的新聞日,Latent Space 帶領讀者反思「微調(Fine-tuning)的終結」這一命題。 隨著長上下文視窗、高效 RAG 以及上下文內學習(In-context Learning)的成熟,許多原本需要微調的場景已被取代。 未來微調可能退化為僅用於調整輸出格式、風格或進行模型蒸餾的工具,而非首選的知識注入手段。
本文探討開源 AI 模型生態系的「複利效應」,特別聚焦於中國以 Qwen 和 DeepSeek 為代表的「開源優先」高參與度生態。開源模型透過社群的集體微調、工具鏈優化與應用開發,累積進步的速度已逐漸逼近甚至超越封閉模型。這種去中心化的協作模式不僅降低了技術門檻,更形成了一個自我強化的生態飛輪,對全球 AI 競爭格局產生深遠影響。
Google DeepMind 發表全新 AI 系統「Co-Scientist」,採用基於 Gemini 的多 Agent(多智慧體)架構。該系統能扮演科學家的虛擬合作夥伴,協助進行文獻回顧、提出新穎假設、設計實驗步驟並分析複雜數據。透過不同專業 Agent 的協作與互相審查,Co-Scientist 旨在大幅縮短科研週期,推動生物、化學及材料科學等領域的突破。
AI 研發團隊 Thinking Machines 推出全新原生互動模型「TML-Interaction-Small 276B-A12B」。該模型專為即時語音設計,擁有 276B 總參數與 12B 啟用參數。它不僅刷新了即時語音的技術前沿(SOTA),更透過原生互動機制,徹底取代了傳統的語音活動檢測(VAD)模組,實現更自然、無縫的雙向語音對話。
Hugging Face 與 AWS 合作介紹在 AWS 上構建基礎模型的關鍵組件。文章涵蓋如何利用 AWS Trainium 和 Inferentia 晶片,並結合 Hugging Face Optimum Neuron 庫來優化效能。同時,也探討了透過 Amazon SageMaker 與專屬深度學習容器(DLCs)來簡化分散式訓練與高吞吐量推理的部署流程。
最新一期 Import AI 聚焦於三大前沿議題。首先,分析了遞迴自我改進(RSI)如何可能引發爆發性的經濟成長,並探討其預測模型。其次,面對難以預測的超智慧(Superintelligence),文章主張監管機構必須保有「極致選擇權」以彈性應對。最後,介紹了結合神經網路架構的新型運算系統(神經電腦)之最新進展。
本文介紹 Superset 如何在 Vercel 平台上構建專為 AI Agent 設計的整合開發環境 (IDE)。Superset 利用 Vercel AI SDK 簡化多模型對接,並透過 Next.js App Router 與 Serverless Functions 處理複雜的代理人工作流與工具調用。透過 Vercel 的全球邊緣網路,他們成功解決了 Agent 運作時的即時狀態同步與高延遲問題,為開發者提供流暢的協作體驗。
本文探討了當前科技經濟中極具對比的「雙軌分歧」現象。一方面,多數科技企業正經歷超過 10% 的裁員潮與預算緊縮;另一方面,以 Anthropic 為首的頂尖 AI 公司卻以每年 10 倍的速度瘋狂成長。這種資金與人才高度向生成式 AI 領域集中的現象,正劇烈重塑科技產業的就業與發展版圖。
OpenAI 推出全新一代即時語音與音訊 API,包含 GPT-Realtime-2、GPT-Translate 以及 GPT-Whisper。這些 API 將 GPT-5 的強大能力導入語音領域,提供全新業界領先(SOTA)的即時語音互動、多語言翻譯與語音識別效能,展現了 OpenAI 將 GPT-5 架構全面鋪設至各類應用場景的野心。
知名 AI 專家 Nathan Lambert 親自走訪中國多家領先的 AI 實驗室(如 DeepSeek、智譜 AI、零一萬物等),分享第一手觀察。他指出,面對美國嚴苛的晶片制裁,中國實驗室展現出驚人的系統級工程與架構優化能力,並以極低成本推動開源模型(如 Qwen 與 DeepSeek)的快速迭代。然而,嚴格的政府監管審查與對即時商業變現的焦慮,也形塑了與矽谷截然不同的 AI 發展生態。
根據 Latent Space 報導,Anthropic 與 xAI 達成一項歷史性的算力租賃協議。Anthropic 將以每年 50 億美元的價格,租用 xAI 旗下 Colossus I 超級電腦叢集高達 300MW 的電力容量。這項交易不僅代表著 AI 算力市場的版圖重組,也讓相關實體的年化經常性收入(ARR)呈現驚人的 8000% 爆發式成長,顯示出前沿模型對算力的極度飢渴。
ServiceNow AI 發表專文探討 vLLM V0 到 V1 的架構演進。文章指出,在進行大語言模型(LLM)的強化學習(RL)訓練時,底層推理引擎(如 vLLM)的精確度與穩定性至關重要。過去在 V0 版本中,微小的推理偏差或不確定性常導致 RL 訓練難以收斂,迫使研究員進行無謂的演算法修正;而 vLLM V1 透過重構底層,實現了「正確性優先」的設計,大幅提升了 RL 訓練的效率與可預測性。
Google DeepMind 發表 AlphaEvolve 的最新進展。這款由 Gemini 驅動的程式碼 Agent(Coding Agent)透過先進的演算法,在商業營運、基礎設施優化以及科學研究三大領域展現強大影響力。它不僅能自動化編寫程式,更能自我演化以適應複雜的跨領域需求,加速技術落地。
近期一系列的產業動態與產品發布,皆指向同一個核心趨勢:矽谷正認真將焦點轉向「AI 服務(Services)」。這意味著 AI 不再只是輔助人類的軟體工具(SaaS),而是能直接交付工作成果的代理人(Agents)。這種「以服務為軟體(Service-as-a-Software)」的轉變,將徹底重塑企業外包、客服及專業諮詢等數兆美元的服務業市場。
Hugging Face 宣布為其 Open ASR(自動語音識別)排行榜引入「Benchmaxxer 驅逐劑」。此舉旨在解決模型開發者針對公開基準測試集進行過度優化(即「刷榜」)的問題。通過引入未公開的私有評估數據集,該排行榜將能更真實地反映 ASR 模型在實際應用中的泛化能力,防止虛高的排名誤導社群。
本集 Latent Space 訪談邀請到加入 OpenAI 的理論物理學家 Alex Lupsasca,深入探討 GPT-5.x 如何在極度複雜的理論物理與量子重力領域中,協助推導出前所未有的新物理結果。這不僅展示了 AI 在符號運算與高度抽象思考上的躍進,也揭示了「直覺物理」(Vibe Physics)如何與嚴謹數學結合,預示著 AI 驅動科學發現(AI for Science)的新時代。
在 AI 發展的十字路口,業界正對其定位展開深思。一派主張 AI 應如 Clippy 般作為無形、高效的「實用工具」(The Utility),專注於完成任務;另一派則主張 AI 應作為「他者」(The Other),具備獨特的性格與主體性。這場爭論不僅關乎產品設計,更深植於人類如何與非人類智慧共存的哲學思考。
近期 AI 業界出現將「知識蒸餾(Distillation)」稱為「蒸餾攻擊(Distillation attacks)」的趨勢。 這反映了閉源模型廠商(如 OpenAI、Anthropic)面對開源模型透過合成數據快速追趕時的焦慮。 作者 Nathan Lambert 指出,將這種行之有年的機器學習技術與商業競爭行為「安全化(securitize)」,試圖將其塑造成惡意網路攻擊,是非常糟糕且誤導的術語,旨在為法律訴訟或技術封鎖鋪路。