Hugging Face BlogJan 24, 2025, 12:00 AM重要 80

We now support VLMs in smolagents!

Hugging Face 的輕量級 Agent 框架 smolagents 宣布支援視覺語言模型(VLM),讓 AI Agent 具備視覺能力。

Hugging Face 旗下的輕量級 Agent 開源庫 smolagents 迎來重大更新,正式支援視覺語言模型(VLM)。開發者現在可以讓 Agent 接收並處理影像輸入,適用於網頁視覺導航、圖表分析及多模態任務。此更新大幅擴展了程式碼 Agent(Code Agent)的應用場景,使其能「看見」並理解真實世界的視覺資訊。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。