Google DeepMind 發表全新語音模型 Gemini 3.1 Flash TTS。該模型引入了「細粒度音訊標籤」(granular audio tags),讓開發者與創作者能夠精確引導 AI 語音的生成細節。這項技術大幅提升了 AI 語音的表現力與可控性,為下一代語音互動與內容創作奠定基礎。
Google DeepMind 發表最新語音模型 Gemini 3.1 Flash Live。該模型專為即時語音互動設計,透過顯著降低延遲與提升精準度,讓 AI 語音對話變得更加流暢與自然。這項更新將大幅優化語音助理與即時互動應用的使用者體驗,並為開發者提供更強大的即時語音 API 支持。