Hugging Face BlogNov 3, 2022, 12:00 AM重要 80
Fine-Tune Whisper For Multilingual ASR with 🤗 Transformers
Hugging Face 官方指南:教你如何使用 Transformers 庫微調 OpenAI Whisper 模型以提升多語言語音辨識(ASR)效能。
本教學詳細介紹如何使用 Hugging Face 的 `transformers` 庫微調 OpenAI 的 Whisper 語音辨識模型。內容涵蓋從載入 Common Voice 資料集、音訊預處理(重採樣至 16kHz 並轉換為 Log-Mel 聲譜圖)、設定 Tokenizer,到使用 `Seq2SeqTrainer` 進行訓練與評估(以 WER 為指標)的完整流程。這對於想在特定低資源語言或專業領域提升語音轉文字精準度的開發者與研究人員來說,是極具價值的實戰指南。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。