本文回顧了文字生成圖像(Text-to-Image)技術的演進歷程。從早期的 GAN 限制,到 2021 年 VQGAN+CLIP 掀起的社群藝術熱潮,再到 2022 年 DALL-E 2 與 Stable Diffusion 的爆發。隨著 Stable Diffusion 迎來一週年及 SDXL 的推出,開源社群與微調技術正以前所未有的速度重塑視覺創作。
本文探討基於文字生成向量草圖的 CLIPDraw 工具,並介紹「可微程式設計」概念。透過在優化過程中加入筆畫數量、顏色或幾何形狀等限制,創作者能引導 AI 擺脫雜亂線條,生成更具結構性與獨特藝術風格的向量作品,為生成藝術的微調與控制提供了清晰的實踐路徑。