Hugging Face BlogFeb 8, 2023, 12:00 AM重要 75

Speech Synthesis, Recognition, and More With SpeechT5

Microsoft 統一語音模型 SpeechT5 登陸 Hugging Face,一鍵搞定語音合成、辨識與聲音轉換!

Microsoft 開源的 SpeechT5 模型正式整合至 Hugging Face Transformers。該模型採用統一的編碼器-解碼器架構,能同時處理語音轉文字(ASR)、文字轉語音(TTS)和語音對語音(如聲音轉換)等多種任務。開發者現在可以透過簡單的 Transformers API,輕鬆實現高質量的多模態語音應用。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。