Simon Willison released datasette-agent-micropython 0.1a0, an alpha aimed at letting Datasette Agent generate and execute Python safely. The project focuses on sandboxing, with MicroPython and WebAssembly-related techniques suggested by the tags. Willison says the early results look promising and that GPT-5.5 has not yet escaped the sandbox, though this remains an early alpha.
Hugging Face 旗下的輕量級 Agent 開源庫 smolagents 迎來重大更新,正式支援視覺語言模型(VLM)。開發者現在可以讓 Agent 接收並處理影像輸入,適用於網頁視覺導航、圖表分析及多模態任務。此更新大幅擴展了程式碼 Agent(Code Agent)的應用場景,使其能「看見」並理解真實世界的視覺資訊。
Hugging Face 發表輕量級 AI Agent 框架「smolagents」,核心概念為「Code Agents」。與傳統輸出 JSON 的 Agent 不同,它讓 LLM 直接生成 Python 程式碼來執行複雜任務,大幅提升表達力與靈活性。該框架程式碼極簡(約千行),並內置安全的 Python 執行沙箱,支援多種主流 LLM 供應商。
傳統的 HumanEval 程式碼評測基準已逐漸飽和且過於簡單。Hugging Face 與研究團隊合作推出新一代基準 BigCodeBench,包含 1,140 個實用編程任務,涵蓋 139 個第三方 Python 函式庫。此基準旨在考驗 LLM 在複雜、多步驟及真實開發場景下的程式碼生成與指令遵循能力,成為評估 Code LLM 的新一代標準。
Replicate 發布了一篇趣味實用的技術教學,展示如何利用網路攝影機(Webcam)捕捉畫面,並透過 LLaVA 或 GPT-4V 等多模態視覺模型分析影像,最後結合 ElevenLabs 的語音合成技術,以經典自然紀錄片主持人大衛·艾登堡(David Attenborough)的口吻與聲音,為你的日常生活進行即時的幽默旁白。