Replicate 宣布支援透過其 HTTP API 微調 FLUX.1 [dev] 模型。開發者只需準備好訓練圖片並發送 API 請求,即可自動完成微調,並直接在 Replicate 上部署與運行專屬的客製化圖像生成模型。這項更新大幅簡化了自動化工作流與產品整合的難度,讓開發者能輕鬆將客製化 AI 繪圖功能嵌入自己的應用程式中。
本教學介紹如何利用 LoRA 技術微調 FLUX.1 [dev] 模型以生成個人專屬圖像。使用者只需準備 10 至 20 張不同角度與背景的個人照片並打包成 ZIP 檔,即可透過 Replicate 的 Web 介面或 API 進行訓練。訓練過程僅需約 20 分鐘、花費數美元,完成後即可使用自訂觸發詞生成各種風格的個人寫真。
Replicate 發布第 12 期情報,重點介紹 FLUX.1 [dev] 的 LoRA 微調訓練功能正式上線,用戶能以極低成本訓練專屬圖像模型。同時,社群利用 Flux 生成的「帥氣祖克柏(Hot Zuck)」迷因引發熱潮,展現了極致的寫實度。此外,Replicate 作為開源 AI 部署首選平台,在知名播客 Lex Fridman 的節目中獲得高度關注。
Replicate 發布第 11 期技術週報,重點介紹開源影像生成模型 FLUX.1 的微調方法,讓開發者能以低成本訓練專屬風格。同時探討了「生成式電子遊戲」的最新進展,展示 AI 如何即時生成遊戲畫面與互動內容。最後,文章展望了生成式 AI 結合 3D 技術,為未來元宇宙與虛擬空間帶來的全新創作範式。
Replicate 宣布為熱門開源圖像生成模型 FLUX.1 推出微調(LoRA)支援。用戶現在可以透過 Replicate 的 API,僅需一行程式碼就能使用自己的圖片訓練專屬模型。這讓開發者與創作者能更輕易地在 FLUX.1 上實現特定人物、產品或藝術風格的客製化生成,大幅降低了商業應用的技術門檻。
由 Stable Diffusion 原班人馬創立的 Black Forest Labs 推出全新圖像生成模型家族 FLUX.1。該模型包含 Schnell、Dev 和 Pro 三個版本,在文字生成、複雜指令遵循以及人體細節上展現出驚人實力。Replicate 平台第一時間上架並進行深度實測,認為其美學風格與寫實度已能與 Midjourney v6 匹敵,為開源 AI 繪圖立下新標竿。
Replicate Intelligence 第 9 期彙整了近期三大 AI 技術突破。首先是 Black Forest Labs 推出的開源影像生成模型 FLUX.1,其品質直逼 Midjourney v6;其次是 Meta 釋出的 SAM 2,將物件分割技術從靜態圖片延伸至動態影片;最後是 fast.ai 創辦人 Jeremy Howard 推出專為快速開發設計的全新 Python 網頁框架 FastHTML。
Stable Diffusion 3 (SD3) 引入了全新的架構與三種文字編碼器。本指南介紹如何透過自然語言描述(而非標籤堆疊)來獲得最佳圖像、如何精準渲染文字,以及如何調整 CFG 比例(建議 4.5-6.0)與步數等關鍵參數,幫助開發者與創作者在 Replicate 上發揮 SD3 的最大潛力。
本教學指導搭載 Apple Silicon(M 系列晶片)Mac 的使用者,如何利用 PyTorch 的 MPS(Metal Performance Shaders)硬體加速技術,在本地端部署並運行 Stable Diffusion 3 圖像生成模型。這讓開發者與創作者無需依賴雲端 API,即可在個人電腦上進行高效、隱私且免費的本地 AI 繪圖。
Replicate 宣布支援用戶部署自定義版本的 Stable Diffusion 3 (SD3)。開發者可以使用開源工具 Cog 將微調後的 SD3 模型、自定義權重(如 LoRA)打包,並上傳至 Replicate 平台。部署完成後,即可透過直觀的網頁介面進行測試,或利用生產級的 API 進行大規模圖像生成,大幅降低了雲端 GPU 部署、自動擴展與維護的門檻,非常適合新創團隊與獨立開發者快速將 AI 應用落地。
Replicate 發布了簡易教學,指導使用者如何在本地 GPU 設備上透過 ComfyUI 運行最新發布的 Stable Diffusion 3 (SD3)。讀者只需在終端機複製並貼上幾行指令,即可快速完成環境部署,開始體驗 SD3 的本地圖像生成能力。這對於想要避開雲端限制、進行本地客製化創作的設計師與開發者非常實用。
Stability AI 的最新文字生成圖像模型 Stable Diffusion 3 已正式上架雲端託管平台 Replicate。此版本模型在圖像生成品質、文字排版精準度、複雜提示詞理解能力以及資源運行效率上,皆比前代有顯著的提升。開發者現在可以透過 Replicate 提供的雲端 API,僅需編寫一行程式碼,就能輕鬆將其整合至應用程式中。
Hugging Face 宣布與 Artificial Analysis 合作推出「文字生成圖片排行榜與競技場」(Text to Image Leaderboard & Arena)。該平台結合了類似 LMSYS 的人類盲測對決(Arena Elo 評分)以及客觀的效能指標(如生成速度與成本)。這為開發者與創作者提供了一個透明、標準化的基準,用以評估與比較市面上主流的開源與閉源圖像生成模型。
Segmind 發表 SegMoE 框架,借鑑 LLM 的混合專家(MoE)架構並將其應用於 Stable Diffusion 等擴散模型。該技術允許開發者將多個專門的 SDXL 專家模型合併為一個,並透過路由機制動態分配生成任務。此方法無需從頭訓練,即可結合不同風格模型的優勢,為影像生成帶來更高的靈活性與效率。
Hugging Face 於 Diffusers 推出全新的 SDXL LoRA 進階訓練腳本,旨在整合開源社群(如 Kohya)的各種訓練技巧。該腳本支援雙文字編碼器微調、Offset Noise、Min-SNR 權重及多解析度訓練,讓開發者與創作者能以更標準、高效的方式訓練出高品質的 SDXL LoRA 模型。
Hugging Face 與 LCM 團隊合作推出 LCM-LoRA,這是一種通用的低秩自適應(LoRA)蒸餾技術。它能將 SDXL 等擴散模型的推理步數縮減至 4 步,同時保持極佳的影像品質。最重要的是,它能直接套用於現有的任何 SDXL 微調模型與 LoRA,無需重新訓練,為即時圖像生成帶來突破。
本文為 Replicate 釋出的技術教學,指導讀者如何在 Apple Silicon (M1/M2) Mac 上本地運行 Latent Consistency Model (LCM)。LCM 透過大幅減少去噪步數(僅需 1-4 步),將原本需要數十秒的 Stable Diffusion 圖片生成時間縮短至一秒以內,非常適合需要即時反饋的創作者與開發者。
Hugging Face 宣布與騰訊 ARC 實驗室合作,將 T2I-Adapter 引入 Stable Diffusion XL (SDXL)。相較於體積龐大的 ControlNet,T2I-Adapter 僅有約 79M 參數,能在不犧牲生成品質的前提下,大幅降低顯示記憶體(VRAM)佔用並提升推理速度。目前已支援 Canny 邊緣偵測、草圖(Sketch)、深度圖(Depth)等多種控制模式,並已整合至 diffusers 函式庫中。
AI 雲端託管平台 Replicate 宣布為 SDXL 1.0 推出微調(Fine-tuning)功能,支援 Dreambooth、Textual Inversion 和 LoRA 等技術。開發者與創作者現在可以透過 Replicate API,僅需一行程式碼就能上傳自己的圖片並訓練出客製化的 SDXL 模型,大幅降低了客製化圖像生成模型的技術門檻與算力維護成本。
Hugging Face 宣布開源基於 Stable Diffusion 蒸餾的輕量化模型 SD-Small(約 5.11 億參數)與 SD-Tiny(約 3.23 億參數)的權重與完整訓練程式碼。透過知識蒸餾技術減少 UNet 的層數,這些模型在保留高圖像質量的同時,實現了 1.5 到 2 倍的推理加速。此舉不僅降低了消費級顯卡與行動裝置運行 AI 繪圖的門檻,也讓開發者能自行蒸餾客製化的 SD 模型。
Hugging Face 發表了將 Stable Diffusion XL (SDXL) 部署於 Mac 的 Core ML 最佳化方案。透過先進的量化技術(如 6-bit 與 8-bit 量化),成功將龐大的 SDXL 模型體積縮減,使其能在 Apple Silicon(M1/M2 系列晶片)的 Mac 上流暢運行,顯著降低記憶體需求,並充分釋放 Apple 神經網路引擎(ANE)的硬體效能。
Replicate 宣布支援 Stability AI 的 SDXL 1.0 圖像生成模型。開發者無需自行維護昂貴的 GPU 基礎設施,只需透過簡單的 Python、JavaScript 或 cURL API 呼叫,即可在雲端運行 SDXL 1.0。本指南展示了如何設定提示詞、尺寸等參數,並快速將高品質的 AI 繪圖功能整合至應用程式中。
Hugging Face 宣布將 ControlNet 整合至 🧨 diffusers 庫中。ControlNet 是一種能為 Stable Diffusion 等擴散模型加入額外控制條件(如 Canny 邊緣、OpenPose 姿勢、Depth 深度圖等)的架構。透過全新的 StableDiffusionControlNetPipeline,開發者只需幾行程式碼即可實現高精度的圖像生成與編輯,大幅提升了 AI 繪圖的可控性。
Replicate 宣布支援 LoRA 技術,用於快速微調 Stable Diffusion 模型。相比於傳統的 DreamBooth,LoRA 不僅訓練速度大幅提升,產出的權重檔案也極小(僅數十 MB),讓創作者能以極低成本且更有效率地在雲端部署與切換不同的客製化風格。
本教學為 Hugging Face 遊戲開發 AI 系列的第四篇,專注於 2D 資產生成。文章深入探討如何利用 Stable Diffusion、DreamBooth 與 Image-to-Image 等技術,克服遊戲開發中「風格一致性」與「精確控制」的挑戰。讀者將學習如何生成無縫貼圖、角色概念圖及 UI 元素,並將其無縫整合至遊戲引擎的工作流中。
本文為 Hugging Face 官方介紹 LoRA(低秩適應)技術在 Stable Diffusion 微調上的應用。LoRA 透過凍結原模型並僅訓練新增的低秩矩陣,將顯存需求降至消費級顯卡即可運行的水平,且產出的權重檔案僅有數 MB(相較於完整微調的數 GB),極大地降低了個性化圖像生成模型的訓練門檻與分享成本。
本文介紹 Hugging Face 於 2022 年 11 月舉辦的「Diffusion Models Live Event」直播活動。該活動旨在向開發者與研究人員推廣擴散模型技術,並介紹當時新推出的 diffusers 函式庫。活動內容涵蓋從零開始訓練擴散模型、圖像生成原理及社群實作分享,是開源 AI 圖像生成發展史上的重要里程碑。
Replicate 宣布推出 DreamBooth API,大幅簡化了個人化圖像生成模型的訓練流程。開發者只需提供少數幾張特定主體的照片,並透過單次 API 呼叫,就能在雲端自動完成微調。訓練完成的模型會直接託管於 Replicate,並立即提供 API 端點供後續的圖像生成預測使用。
本指南為 Hugging Face 官方發布的 DreamBooth 訓練教學。透過 diffusers 函式庫,開發者與創作者只需提供 3 到 5 張特定主體的照片,即可微調 Stable Diffusion 模型。文中詳細介紹了訓練原理、先驗保持損失(Prior Preservation Loss)的重要性,以及如何利用 8-bit Adam 和 xFormers 等技術在消費級 GPU 上完成訓練。
Stability AI 於 2022 年 10 月推出了「Japanese Stable Diffusion」模型。該模型專為日語語境進行優化,解決了先前英文版 Stable Diffusion 難以精確理解日語輸入與日本文化細節的問題。用戶可以直接使用日語進行 Prompt 創作,生成更符合日本審美與文化背景的圖像,並已開源託管於 Hugging Face。