Hugging Face BlogSep 23, 2025, 12:00 AM重要 80
Smol2Operator: Post-Training GUI Agents for Computer Use
Hugging Face 推出 Smol2Operator,展示如何透過後訓練將輕量級視覺語言模型轉化為高效的本地電腦操作 GUI 代理。
Hugging Face 發表 Smol2Operator,這是一套針對「電腦操作(Computer Use)」設計的後訓練 GUI 代理方案。基於輕量級視覺語言模型(如 SmolVLM),透過特定的監督微調(SFT)與強化學習,使其能精準識別螢幕元素並執行點擊、輸入等操作。此項目開源了模型權重與訓練方法,讓開發者能在消費級硬體上部署隱私安全、低延遲的本地 GUI 代理。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。