Hugging Face BlogFeb 20, 2025, 12:00 AM重要 80
SmolVLM2: Bringing Video Understanding to Every Device
Hugging Face 推出全新輕量級視覺語言模型 SmolVLM2,主打在邊緣裝置上實現高效的影片與多圖理解。
Hugging Face 正式發布 SmolVLM2 系列模型,專為手機與筆電等個人裝置設計。此版本最大亮點是引入了強大的「影片理解」與「多圖處理」能力,其中 2.2B 旗艦版本在保持極低運算資源消耗的同時,能在多項視覺與影片基準測試中媲美更大尺寸的模型。模型完全開源並採用 Apache 2.0 授權,極具實用價值。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。