Google DeepMind BlogMay 17, 2026, 7:50 PM重要 95
Introducing Gemini Omni
Google 推出 Gemini Omni 模型,主打原生全模態架構,支援超低延遲的即時語音、影像與文字無縫互動。
Google DeepMind 發表新一代「Gemini Omni」模型,採用原生端到端全模態架構,能同時處理並輸出文字、音訊與視覺資訊。該模型顯著降低了互動延遲,實現如同真人般的流暢對話與即時視訊引導,未來將深度整合至 Android 系統與 Google 生態系,並透過 API 開放給開發者。
想看英文原文 / 完整內容?
前往 Google DeepMind Blog 原文 →摘要由 AI 整理,以原文為準。