Hugging Face BlogDec 15, 2021, 12:00 AM重要 70
Perceiver IO: a scalable, fully-attentional model that works on any modality
DeepMind 推出 Perceiver IO,透過潛在空間技術解決 Transformer 高複雜度痛點,實現跨文字、圖像及音訊的通用多模態處理。
DeepMind 提出的 Perceiver IO 已正式整合至 Hugging Face。該模型透過引入「潛在瓶頸」與「輸出查詢」機制,成功將 Transformer 的二次方複雜度降至線性,使其能高效處理高維度的多模態數據(如圖像、音訊、3D 點雲)。Perceiver IO 不僅能接收任意輸入,還能靈活輸出各種結構的數據,是邁向通用 AI 架構的重要一步。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。