OpenAI 推出全新一代即時語音與音訊 API,包含 GPT-Realtime-2、GPT-Translate 以及 GPT-Whisper。這些 API 將 GPT-5 的強大能力導入語音領域,提供全新業界領先(SOTA)的即時語音互動、多語言翻譯與語音識別效能,展現了 OpenAI 將 GPT-5 架構全面鋪設至各類應用場景的野心。
本文介紹 Hugging Face 將 Facebook AI (FAIR) 的 Fairseq WMT19 機器翻譯系統移植至 `transformers` 程式庫(FSMT)的過程。WMT19 模型在英德、英俄翻譯中表現極佳,但過去需依賴複雜的 `fairseq` 框架。移植後,開發者只需幾行程式碼即可調用這些強大的翻譯模型,大幅降低了學術與工業界的部署難度。