Hugging Face BlogOct 27, 2025, 12:00 AM重要 85
Streaming datasets: 100x More Efficient
Hugging Face 升級 datasets 串流功能,透過底層架構優化實現 100 倍的資料載入與處理效率提升。
Hugging Face 宣布對其開源 `datasets` 庫的串流(Streaming)模式進行重大升級,效率提升達 100 倍。新版本優化了底層資料讀取架構,顯著降低了記憶體佔用並提高了 I/O 吞吐量。這讓開發者在訓練超大型模型時,無需事先下載數百 GB 的完整資料集,即可實現極速的即時資料餵送,解決了 GPU 因等待資料而閒置的痛點。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。