ElevenLabs has introduced a new music generation model focused on finer-grained song editing. According to TechCrunch, users will be able to regenerate a section of a track without affecting the rest of the song. The headline also highlights genre switching mid-track, suggesting the model is aimed at more flexible AI music creation workflows.
Google DeepMind 發表全新語音模型 Gemini 3.1 Flash TTS。該模型引入了「細粒度音訊標籤」(granular audio tags),讓開發者與創作者能夠精確引導 AI 語音的生成細節。這項技術大幅提升了 AI 語音的表現力與可控性,為下一代語音互動與內容創作奠定基礎。
Google DeepMind 正式發表新一代音樂生成模型 Lyria 3 Pro。該模型突破了以往 AI 音樂長度與結構的限制,具備「結構感知(structural awareness)」能力,能創作結構更完整、長度更長的音樂作品。此外,Google 也宣布將把 Lyria 3 Pro 整合至更多旗下的產品與平台中,為創作者提供更豐富的 AI 輔助創作工具。