Hugging Face has published a comprehensive glossary of AI agent terminology to resolve industry-wide confusion. The guide focuses on defining critical concepts such as "scaffold" (the code wrapping the LLM) and "harness" (the evaluation and execution environment). This standardization helps developers and researchers communicate more precisely when building and benchmarking agentic systems.
Hugging Face 發表最新技術,展示如何讓 AI Agent(如基於 smolagents 框架)具備編寫自訂 CUDA/Triton Kernel 的「技能」。透過將編譯器、正確性驗證與基準測試(Benchmarking)工具整合為 Agent 的 Tool,Agent 能自主撰寫低階 GPU 程式碼、讀取錯誤訊息進行 Debug,並持續優化效能。這項突破大幅降低了 GPU 算子開發的門檻。
Hugging Face 介紹了與 Intel 合作的 DeepMath 專案,這是一個基於 smolagents 輕量級框架構建的數學推理 Agent。傳統 LLM 在數學計算上容易出錯,而 DeepMath 採用「Code Agent」機制,讓輕量級開源模型透過撰寫並執行 Python 程式碼來解答複雜數學題。此方案不僅降低了算力門檻,還能在 Intel 硬體上實現高效能的本地端推理。
Hugging Face 探討了將「結構化約束(Structure)」引入 Code Agent 的全新設計範式。傳統 Code Agent 透過撰寫 Python 程式碼來執行任務,雖具備極高的靈活性,但自由度過高也容易帶來語法錯誤與安全隱憂。新方法透過結合 Pydantic 驗證、結構化解碼與型別限制,讓 Agent 在保有程式碼強大表達力的同時,確保輸出與行為的預測性與安全性,大幅提升複雜任務的執行成功率。
Hugging Face 發表最新教學,展示如何利用 Model Context Protocol (MCP) 協定,在僅 50 行程式碼內構建出功能完整的 AI Agent。透過 MCP,這個輕量級 Agent 可以直接連接並使用現有的各種 MCP 工具伺服器(如搜尋、資料庫等),無需繁瑣的 API 對接。這項技術大幅降低了開發 Agent 的門檻,並展現了開源標準在 AI 生態系中的強大潛力。
為對抗封閉的商業 Deep Research 服務,Hugging Face 推出開源版 DeepResearch。該專案基於其輕量級 Agent 框架 smolagents,能驅動開源模型(如 Qwen 或 Llama)進行多步驟網頁搜尋、資訊整合並產出詳盡報告。這不僅降低了研究型 Agent 的門檻,也讓開發者能完全掌控資料與搜尋邏輯。
Hugging Face 發表全新的 Transformers Code Agent,透過讓 AI 撰寫並執行 Python 程式碼來解決複雜任務。該方法在評估通用 AI 助理能力的 GAIA 基準測試上取得了 SOTA(當前最佳)表現,證明了「程式碼執行」作為 Agent 推理工具,遠比傳統的 JSON 工具調用(Tool Calling)更具彈性與效率。此專案已完全開源,為開發者提供構建高效能 Agent 的新選擇。