Hugging Face BlogDec 8, 2021, 12:00 AM
Training CodeParrot 🦜 from Scratch
Hugging Face 分享如何從頭訓練 CodeParrot 程式碼生成模型,涵蓋數據清洗、分詞與分佈式訓練全流程。
Hugging Face 詳細公開了 CodeParrot 專案的訓練全紀錄,展示如何從零開始構建一個專門用於 Python 程式碼生成的 GPT-2 規模模型。 文章深入探討了大規模 GitHub 數據集的清洗與去重、專屬 Tokenizer 的訓練,以及使用 Accelerate 進行多 GPU 分佈式訓練的實務技巧。 此專案不僅提供了一個開源的程式碼模型,更為開發者提供了一套完整的、可複製的大型語言模型(LLM)預訓練工作流。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。