Hugging Face 介紹了如何結合 ComfyUI 與 Gradio,並在 Spaces 上免費運行。使用者只需將 ComfyUI 工作流導出為 API JSON 格式,即可透過 Gradio 建立簡潔的前端介面。這項技術讓創作者能輕鬆分享複雜的 AI 圖像生成工作流,無需讓終端用戶面對複雜的節點圖。
本文回顧了文字生成圖像(Text-to-Image)技術的演進歷程。從早期的 GAN 限制,到 2021 年 VQGAN+CLIP 掀起的社群藝術熱潮,再到 2022 年 DALL-E 2 與 Stable Diffusion 的爆發。隨著 Stable Diffusion 迎來一週年及 SDXL 的推出,開源社群與微調技術正以前所未有的速度重塑視覺創作。
Hugging Face 慶祝旗下核心開源庫 Diffusers 推出一週年。在過去一年中,Diffusers 憑藉直覺的 API 設計,成功降低了 Stable Diffusion 等擴散模型的技術門檻。該庫不僅支援了 ControlNet、LoRA 等多種前沿技術,還透過記憶體優化與硬體加速,讓生成式 AI 走入消費級硬體,成為開源 AI 生態系中不可或缺的基石。
本期 Hugging Face 倫理與社會電子報聚焦於文字生成圖像(Text-to-Image)模型的偏見。文章指出,這些模型在生成職業、社會角色等圖像時,常顯露出嚴重的性別與種族刻板印象。這源於訓練數據中不均衡的代表性,Hugging Face 呼籲社群透過開發評估工具與推動數據透明化來共同應對此挑戰。
本教學為 Hugging Face 遊戲開發系列的第一部分,記錄了如何利用 AI 技術在 5 天內開發出一款農場模擬遊戲。文章重點介紹了開發初期的規劃、如何利用 Stable Diffusion 生成像素風(Pixel Art)美術資產,以及如何藉由 AI 輔助編寫 Unity 遊戲腳本,展示了 AI 如何大幅降低獨立遊戲開發的門檻。
Hugging Face 發布 Diffusers 開源庫推出兩個月的進展報告。本次更新核心在於全面整合 Stable Diffusion,並推出圖生圖(Img2Img)與局部繪製(Inpainting)等全新 Pipeline。此外,團隊大幅優化了記憶體佔用,引入 Attention Slicing 技術,讓 4GB 顯存的 GPU 也能順利運行擴散模型,並新增了多種採樣調度器(Schedulers)。
Hugging Face 於 2022 年 8 月宣布將剛發布的 Stable Diffusion 整合至其 🧨 Diffusers 函式庫中。這項合作讓開發者與研究人員能夠透過極簡的 Python API,輕鬆載入權重並進行文字生成圖像(Text-to-Image)的推論。文章詳細介紹了潛在擴散模型(Latent Diffusion)的運作原理,並提供多種記憶體優化技術,大幅降低了開源 AI 繪圖的硬體門檻。