Hugging Face BlogFeb 24, 2025, 12:00 AM重要 75

Remote VAEs for decoding with Inference Endpoints 🤗

Hugging Face 推出 Remote VAE 功能,可分離圖像解碼步驟,大幅降低 Inference Endpoints 的 GPU 顯存佔用。

Hugging Face 宣布在 Inference Endpoints 中支援「Remote VAE」解碼功能。在運行 FLUX.1 或 Stable Diffusion 等大型圖像生成模型時,VAE 解碼通常會消耗大量 GPU 顯存(VRAM)。透過將 VAE 解碼步驟與潛在空間生成解耦並進行遠端處理,開發者可以在較小、較便宜的 GPU 上部署大型擴散模型,同時優化整體的推論吞吐量與頻寬傳輸。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。