Google 發表了全新的「任意對任意(anything-to-anything)」AI 模型 Gemini Omni。外媒記者實測將其用於將小孩的毛絨鹿玩具「Buddy」合成到各種度假場景中,發現其生成效果極其逼真且操作簡單。這款模型不僅展現了強大的多模態影片生成與編輯能力,同時也再度引發了關於深偽(Deepfake)技術門檻降低與倫理界線的討論。
Google DeepMind 宣布在 Gemini 應用程式中整合其最先進的音樂生成模型 Lyria 3。用戶現在只需輸入文字描述或上傳圖片,即可輕鬆生成 30 秒的高品質音樂片段。這項功能大幅降低了音樂創作門檻,為社群創作者、設計師及一般大眾提供全新的多模態創作工具。
Google DeepMind 宣布推出名為「Nano Banana Pro」的 Gemini 3 Pro 圖像模型。作為 Gemini 3 世代的專業級視覺模型,它旨在為開發者提供更強大的影像生成或理解能力。標題「Build with...」顯示該模型已開放 API 或開發工具,鼓勵開發者將其整合至各式應用中。