Hugging Face BlogJun 3, 2025, 12:00 AM重要 75
SmolVLA: Efficient Vision-Language-Action Model trained on Lerobot Community Data
Hugging Face 推出 SmolVLA,這是一款基於 LeRobot 社群數據訓練的高效開源視覺-語言-動作(VLA)模型,降低機器人具身智能的部署門檻。
Hugging Face 發表全新開源模型 SmolVLA,專為具身智能與機器人控制設計。該模型屬於「Smol」輕量化系列,結合視覺、語言與動作(VLA)能力,並完全採用 LeRobot 社群的真實機器人操作數據進行訓練。SmolVLA 的高效能與小體積,讓開發者能在邊緣設備上實現低延遲的機器人視覺決策與控制。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。