Hugging Face BlogSep 13, 2023, 12:00 AM重要 72
Fine-tuning Llama 2 70B using PyTorch FSDP
本文介紹如何利用 PyTorch FSDP 與 Hugging Face 工具,在有限的 CPU 記憶體下安全且高效地微調 Llama 2 70B 模型。
微調 Llama 2 70B 等超大型模型時,開發者常因多進程重複載入模型而面臨 CPU 記憶體崩潰(OOM)的困境。本文介紹如何結合 PyTorch FSDP(完全分片數據並行)與 Hugging Face Accelerate 的延遲初始化與分片載入技術,在有限的硬體資源下實現記憶體高效的微調流程,大幅降低大模型訓練的門檻。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。