Hugging Face BlogJan 4, 2024, 12:00 AM

Welcome aMUSEd: Efficient Text-to-Image Generation

Hugging Face 推出基於 Masked Image Modeling 的輕量級開源圖像生成模型 aMUSEd,主打極速與低資源消耗。

Hugging Face 發表了名為 aMUSEd 的開源文字生成圖片模型,基於 Google 的 MUSE 架構。與主流的擴散模型(Diffusion Models)不同,aMUSEd 採用遮罩圖像建模(MIM)技術,僅需 12 個步驟即可生成圖像。其參數規模僅約 8 億,非常適合在消費級硬體上進行快速推理與微調,並支援圖生圖與局部重繪。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。