Hugging Face BlogJun 28, 2022, 12:00 AM重要 75
Accelerate Large Model Training using DeepSpeed
Hugging Face 介紹如何透過 Accelerate 輕鬆整合 DeepSpeed,免改程式碼即可利用 ZeRO 技術訓練百億參數大型模型。
本文介紹 Hugging Face Accelerate 與 Microsoft DeepSpeed 的整合方案。開發者只需透過簡單的 CLI 設定,即可在不修改 PyTorch 程式碼的前提下,啟用 ZeRO-Stage 1/2/3 與 ZeRO-Offload 技術。這大幅降低了單機多卡或多機多卡訓練超大型模型的門檻,有效解決 GPU 記憶體不足(OOM)的痛點。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →相關
摘要由 AI 整理,以原文為準。