Showing:multimodalResearchersClear ×
DeepMind 提出的 Perceiver IO 已正式整合至 Hugging Face。該模型透過引入「潛在瓶頸」與「輸出查詢」機制,成功將 Transformer 的二次方複雜度降至線性,使其能高效處理高維度的多模態數據(如圖像、音訊、3D 點雲)。Perceiver IO 不僅能接收任意輸入,還能靈活輸出各種結構的數據,是邁向通用 AI 架構的重要一步。