Hugging Face BlogJan 12, 2022, 12:00 AM

Boosting Wav2Vec2 with n-grams in 🤗 Transformers

Hugging Face 介紹如何結合 Wav2Vec2 與 n-gram 語言模型,大幅降低語音識別(ASR)的字錯率(WER)。

Hugging Face 推出整合 pyctcdecode 的新功能,讓開發者能輕鬆將 n-gram 語言模型與 Wav2Vec2 結合。 此方法能有效修正 Wav2Vec2 在 CTC 解碼時產生的拼寫錯誤,顯著降低語音識別的字錯率(WER)。 本指南提供完整的實作步驟,展示如何載入預訓練語言模型並應用於多語系的語音識別任務。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。