Simon Willison 發布了 Datasette 的新插件 `datasette-llm-limits 0.1a0`。該插件與 `datasette-llm` 和 `datasette-llm-accountant` 協同工作,允許管理員為 Datasette 內部的 LLM 使用設定每位用戶(或全域)的消費限制。例如,可以輕鬆配置每位用戶在滾動 24 小時內最多只能消耗 1.00 美元的 LLM 額度,有效防止 API 帳單爆表。
本期 AINews 聚焦於一個新興趨勢:「萬物皆為協調者(Conductor)」。隨著 AI 應用從單一提示詞轉向複雜的多步驟工作流,如何有效編排、調度多個 AI 代理與工具(如使用類似 Netflix Conductor 或 Temporal 的架構)成為核心。這意味著未來的 AI 開發重點將從單一模型能力,轉向系統級的流程控制與協調。
Simon Willison 開源的 Datasette AI 代理插件 datasette-agent 發布 0.1a2 版本。此版本重點在於安全與權限控制,允許將代理工具的可用性與特定的 required_permission 綁定。預設的背景代理工具現在必須具備全新的 datasette-agent-background 權限才能執行,防止未授權的背景任務運行。
Vercel 官方更新日誌宣布,Vercel CLI 現已支援原生 curl 語法。這項更新讓開發者可以直接在 Vercel 命令行工具中使用標準的 curl 格式,無需手動轉換參數。此舉大幅提升了從瀏覽器複製請求並在 Vercel 環境中進行除錯與測試的效率。
Vercel 宣布其 AI Gateway 新增動態排序功能。開發者現在可以根據即時或設定的指標(包含成本、延遲與吞吐量)來自動排序和路由不同的 AI 模型提供商。這項更新讓開發者能更彈性地在效能、預算與速度之間取得平衡,優化生產環境中的 AI 應用表現。
Simon Willison 分享,一家中型科技公司利用 AI 代理人將其 iOS 與 Android 原生 App 重寫為 React Native。 當被問及為何不繼續維護雙平台時,他們表示 React Native 已足夠成熟,且未來若後悔,隨時能靠 AI「再移植回原生代碼」。 這呼應了 Mitchell Hashimoto 的觀點:過去程式語言是強大的技術鎖定,但在 AI 時代,這種鎖定正不復存在。
HashiCorp 創辦人 Mitchell Hashimoto 針對 Bun 從 Zig 改寫為 Rust 發表看法。他指出,過去程式語言具有強大的「鎖定效應」,但如今已變得高度可替代(fungible)。Bun 證明了他們能在短短一兩週內將程式碼移植到任何語言,這意味著在 AI 與代理工程(Agentic Engineering)時代,程式語言只是工具,隨時可以被拋棄與替換。
本期 Latent Space 專訪醫療 AI 領導品牌 Abridge 的產品副總裁 Janie Lee 與工程副總裁 Chai Asawa。Abridge 透過環境語音識別(Ambient AI)技術,將醫病對話自動轉化為結構化病歷,每週為醫生節省 10 至 20 小時。此外,他們正將應用擴展至「預先授權(Prior Auth)」等行政流程,致力將醫病對話打造為醫療系統的全新作業系統。
Datasette 的 AI 代理工具 datasette-agent 發布了 0.1a1 早期測試版本。本次更新主要改進了安全與權限邏輯,現在系統在決定向使用者展示哪些資料表時,會先檢查並遵循 `execute-sql` 權限設定。這有助於在有權限控管的 Datasette 實例中,更安全地讓 AI 代理進行資料查詢。
加州太浩湖(Lake Tahoe)地區的 49,000 名居民正面臨電力危機。當地的電力供應商決定停止服務該地區,轉而將電力資源優先供應給鄰近內華達州蓬勃發展的數據中心。這起事件凸顯了 AI 與雲端運算帶來的數據中心熱潮,已開始直接與民生用電爭奪資源,引發社會與基礎設施分配的爭議。
IBM 發布全新開源多語言嵌入模型 Granite Embedding Multilingual R2。該模型採用寬鬆的 Apache 2.0 授權,支援高達 32K 的上下文長度。在參數小於 1 億(Sub-100M)的同量級模型中,它展現出最頂尖的資訊檢索品質,非常適合用於建構高效能且低資源消耗的 RAG(檢索增強生成)系統。
由於 datasette.io 網站遭受惡意爬蟲頻繁騷擾,開發者 Simon Willison 藉由 Codex (GPT-5.5 xhigh) 協同開發了一款可設定的 IP 速率限制外掛 datasette-ip-rate-limit。該外掛支援自訂 IP 標頭、排除特定路徑,並能針對特定路徑設定時間視窗、最大請求數與封鎖時間,目前已釋出 0.1a0 測試版本。
本期 AINews 聚焦於 AI 寫程式 Agent 的長期發展趨勢。Anthropic 開始針對 Claude 的程式化使用(Programmatic Usage)進行計量與限制,這將直接影響開發者透過自動化腳本或第三方工具調用 Claude 的成本。另一方面,Codex 相關的自動化編程 Agent 影響力持續上升,顯示出 AI 在軟體開發流程中的滲透率正穩定增加。
Vercel 推出「Protected Source Maps」功能,解決了生產環境除錯與原始碼安全之間的兩難。此功能允許開發者上傳 Source Maps 以利於錯誤追蹤與除錯,但限制只有授權用戶或整合工具(如 Sentry)才能存取。這確保了敏感的原始碼不會暴露給一般終端用戶,同時維持高效的線上除錯能力。
本文介紹了 Hugging Face 在 LLM 推論優化上的最新技術:在連續批次處理(Continuous Batching)中解鎖非同步(Asynchronicity)機制。傳統的連續批次處理在排程、GPU 執行與 Token 處理間存在同步瓶頸。透過將這些步驟非同步化,能有效重疊 CPU 與 GPU 的工作負載,進而大幅提升推論吞吐量並優化首字輸出時間(TTFT)。
在一個相對平靜的新聞日,Latent Space 帶領讀者反思「微調(Fine-tuning)的終結」這一命題。 隨著長上下文視窗、高效 RAG 以及上下文內學習(In-context Learning)的成熟,許多原本需要微調的場景已被取代。 未來微調可能退化為僅用於調整輸出格式、風格或進行模型蒸餾的工具,而非首選的知識注入手段。
Vercel 宣布為其「部署保護 (Deployment Protection)」功能引入「受信任來源 (Trusted Sources)」。此更新允許開發團隊設定特定的 IP 位址、網段或第三方服務,使其能安全地繞過預覽部署的密碼或 SSO 保護。這解決了自動化 CI/CD 流程中,測試工具因安全防護而無法存取預覽網頁的痛點,大幅提升開發與測試效率。
Vercel 宣布支援使用自然語言來建立 WAF(Web 應用程式防火牆)自訂規則。開發者無需手動撰寫複雜的篩選表達式,只需輸入如「阻擋特定路徑的惡意請求」等日常語言描述,系統便會自動生成對應的防火牆規則。此功能大幅降低了安全配置的門檻,提升了網站防護的部署效率。
本文探討開源 AI 模型生態系的「複利效應」,特別聚焦於中國以 Qwen 和 DeepSeek 為代表的「開源優先」高參與度生態。開源模型透過社群的集體微調、工具鏈優化與應用開發,累積進步的速度已逐漸逼近甚至超越封閉模型。這種去中心化的協作模式不僅降低了技術門檻,更形成了一個自我強化的生態飛輪,對全球 AI 競爭格局產生深遠影響。
Google DeepMind 發表全新 AI 系統「Co-Scientist」,採用基於 Gemini 的多 Agent(多智慧體)架構。該系統能扮演科學家的虛擬合作夥伴,協助進行文獻回顧、提出新穎假設、設計實驗步驟並分析複雜數據。透過不同專業 Agent 的協作與互相審查,Co-Scientist 旨在大幅縮短科研週期,推動生物、化學及材料科學等領域的突破。
Vercel 宣布其 AI Gateway 正式支援 Opus 4.7 模型的「快速模式」(Fast Mode)。此功能旨在為開發者提供更低的 API 延遲與更快的響應速度,非常適合需要即時互動的 AI 應用場景。開發者現在可以透過 Vercel AI Gateway 輕鬆啟用此模式,在維持 Opus 4.7 強大推理能力的同時,顯著提升終端用戶的使用體驗。
AI 研發團隊 Thinking Machines 推出全新原生互動模型「TML-Interaction-Small 276B-A12B」。該模型專為即時語音設計,擁有 276B 總參數與 12B 啟用參數。它不僅刷新了即時語音的技術前沿(SOTA),更透過原生互動機制,徹底取代了傳統的語音活動檢測(VAD)模組,實現更自然、無縫的雙向語音對話。
Vercel 宣布支援透過 Vercel CLI 直接管理 Vercel Firewall。開發者現在無需登入網頁控制台,即可在終端機中配置 WAF 規則、IP 封鎖與速率限制。這項更新不僅簡化了安全管理流程,更讓團隊能將防火牆配置整合至 CI/CD 自動化工作流中,實現「安全即代碼」(Security as Code)的現代化運維。
Vercel 針對其 AI 基礎建設推出「AI Gateway 生產環境指標」(AI Gateway production index)。此功能旨在幫助開發者在生產環境中,更精準地監控、索引與分析 LLM 的調用數據(如延遲、成本與錯誤率)。透過此指標,團隊能有效評估不同 AI 網關與模型的實際表現,進而優化 Serverless 環境下的 AI 應用效能。
Vercel 於 Changelog 中宣佈,其 Sandboxes(沙盒環境)已正式支援 Node.js 26.x。這項更新讓開發者能夠在 Vercel 的隔離沙盒環境中,直接測試與運行基於最新 Node.js 26.x 版本的應用程式。開發者可以藉此提早評估新版 Node.js 的效能表現、全新 API 變更以及安全性更新,確保專案在升級時的相容性與穩定性。
Hugging Face 與 AWS 合作介紹在 AWS 上構建基礎模型的關鍵組件。文章涵蓋如何利用 AWS Trainium 和 Inferentia 晶片,並結合 Hugging Face Optimum Neuron 庫來優化效能。同時,也探討了透過 Amazon SageMaker 與專屬深度學習容器(DLCs)來簡化分散式訓練與高吞吐量推理的部署流程。
最新一期 Import AI 聚焦於三大前沿議題。首先,分析了遞迴自我改進(RSI)如何可能引發爆發性的經濟成長,並探討其預測模型。其次,面對難以預測的超智慧(Superintelligence),文章主張監管機構必須保有「極致選擇權」以彈性應對。最後,介紹了結合神經網路架構的新型運算系統(神經電腦)之最新進展。
Vercel 宣布為其 Vercel Flags 服務引入「自動化漸進式發布(Progressive Rollouts)」。開發者現在可以設定規則,讓新功能自動且逐步地開放給特定比例的用戶,無需手動干預。這項更新有助於團隊在生產環境中安全地測試新功能,並在遇到問題時快速回滾,大幅提升部署的穩定性與效率。
Vercel 宣布其 Sandbox 防火牆現在支援「請求代理」與「過濾」功能。這項更新讓開發者在 Vercel 安全沙盒環境中執行程式碼時,能更精細地控制與監控網路流量。這對於需要執行第三方或 AI 生成程式碼、並防範惡意網路請求(如 SSRF 或資料外洩)的應用程式來說,是一項關鍵的安全提升。
本文介紹 Superset 如何在 Vercel 平台上構建專為 AI Agent 設計的整合開發環境 (IDE)。Superset 利用 Vercel AI SDK 簡化多模型對接,並透過 Next.js App Router 與 Serverless Functions 處理複雜的代理人工作流與工具調用。透過 Vercel 的全球邊緣網路,他們成功解決了 Agent 運作時的即時狀態同步與高延遲問題,為開發者提供流暢的協作體驗。