Hugging Face BlogAug 27, 2024, 12:00 AM重要 70

Scaling robotics datasets with video encoding

Hugging Face 分享如何利用影片編碼技術將機器人數據集體積縮減數十倍,並克服訓練時的隨機存取讀取瓶頸。

機器人學習(如模仿學習)需要大量的多視角相機數據,傳統以獨立圖片儲存會導致硬碟與網路傳輸極大負擔。Hugging Face 團隊分享了如何透過影片編碼(如 H.264/MP4)與優化關鍵影格(GOP)設定,在維持高訓練讀取效能的前提下,將數據集體積壓縮 10 到 50 倍,並整合至 LeRobot 生態系中。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。