Hugging Face BlogSep 27, 2022, 12:00 AM重要 80

How 🤗 Accelerate runs very large models thanks to PyTorch

本文深入探討 Hugging Face Accelerate 如何利用 PyTorch 的「元設備」與權重分片技術,在有限硬體下運行超大型模型。

Hugging Face 介紹了其 `Accelerate` 函式庫如何解決超大型模型(如 BLOOM-176B)在單一或有限 GPU 上因記憶體不足而無法加載的痛點。透過 PyTorch 的「元設備(Meta Device)」進行空權重初始化,並結合 `device_map="auto"` 自動將模型層分配至 GPU、CPU 甚至硬碟。這項技術讓開發者與研究人員能在消費級硬體或有限的資源下,進行超大模型的推理與微調。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。