Simon Willison released llm-anthropic 0.25.1 with support for the new Claude Opus 4.8 model, exposed as claude-opus-4.8. The release adds a -o fast 1 option for Anthropic fast mode, limited to organizations that have the feature enabled. It also changes default max_tokens behavior so each model now defaults to its maximum output instead of 8,192.
Google 於 I/O 2026 發表對標 OpenClaw 的個人 AI 代理「Gemini Spark」,能原生串接 Gmail、雲端硬碟等服務。該代理運行於 Gemini 3.5 Flash 與全新「Antigravity」架構上。然而,Google 同時宣布將開源的 Gemini CLI 轉向閉源的 Antigravity CLI,且代理在處理敏感數據時的安全防護(如提示詞注入風險)仍面臨考驗。
Simon Willison 宣布其命令列工具外掛 `llm-gemini` 升級至 0.32 版本,正式加入對 Google 最新一代輕量高速模型 Gemini 3.5 Flash 的支援。使用者現在可以直接透過 `llm` CLI 工具調用此模型,進行快速的文字與多模態測試。
Anthropic 旗下熱門命令列 AI 助手 Claude Code 的產品主管 Cat Wu 近日接受專訪。她透露團隊在開發這款 Agent 工具時「沒有宏偉的藍圖」,而是採取刻意為之的靈活迭代策略。訪談重點圍繞在開發者最關心的 API 使用額度與成本限制、如何透過高透明度介面建立信任,以及如何利用「精簡測試架構(lean harness)」在不犧牲效能的前提下,優化 Agent 的執行效率與準確度。
本文探討如何「解放」開源 CLI 開發 Agent 工具 OpenClaw。隨著類似 Claude Code 的終端機 Agent 工具興起,Hugging Face 介紹了如何將 OpenClaw 與 Llama、Qwen 等開源模型整合。透過 Hugging Face 的推論 API 或本地部署,開發者可以不再受限於單一閉源 API,實現高自由度、低成本且隱私安全的自主開發流程。
Vercel 近期發表文章,探討在 AI Agent 時代中,「僅提供 Bash 工具」是否就能滿足所有開發需求。文章評估了讓 AI 代理直接操作終端機的潛力與極限,分析其在自動化測試、程式碼修復及部署上的表現。雖然 Bash 賦予了極高的自由度,但安全防護、錯誤處理與上下文限制仍是關鍵挑戰。
知名 AI 學者 Ethan Mollick 撰文分析 Anthropic 最新釋出的命令列工具 Claude Code。他指出,這款工具代表了 AI 從單純的「對話框」走向「自主代理人(Agent)」的重大轉變。Claude Code 不僅能寫程式,還能直接在終端機執行、測試、根據錯誤訊息自我修正並完成 Git 提交。這預示著未來所有工作流程都將被這種「給予工具並讓其自主嘗試」的 Agent 模式所顛覆。
Hugging Face 發表全新命令列工具 `hf`,旨在全面升級並替代現有的 `huggingface-cli`。這款新工具採用了更直覺、簡潔的指令設計,並大幅優化了模型與資料集的下載與上傳效能。此外,它還提供了更美觀且流暢的終端機進度條與互動式介面,讓開發者在管理 Hugging Face Hub 資源時更加得心應手,是 AI 開發者不可或缺的全新利器。
OpenAI 正式發表新一代推理模型 o3 與 o4-mini,強調透過 10 倍強化學習(RL)算力提升推理效率。o4-mini 不僅價格更便宜,在多項指標、視覺與工具調用能力上皆有顯著進步。此外,OpenAI 還驚喜推出了完全開源的終端機 AI 工具 Codex CLI,直接對標 Anthropic 的 Claude Code。