Hugging Face 釋出 3D Gaussian Splatting (3DGS) 的技術入門指南。3DGS 是 3D 重建領域的革命性技術,透過將稀疏點雲轉化為數百萬個 3D 高斯橢圓體,實現了超越 NeRF 的即時渲染速度(100+ FPS)與極短的訓練時間。本文詳細解析其運作原理,並介紹如何在 Hugging Face 平台上整合與展示 3DGS 成果。
Vercel 探討了現代前端開發的核心痛點,並提出打造最佳開發者工作流(Developer Workflow)的關鍵要素。文章強調縮短反饋循環的重要性,並透過 Vercel 的「預覽部署(Preview Deployments)」與「工具列(Vercel Toolbar)」實現即時協作。此外,結合自動化 CI/CD、環境變數管理與生產環境一致性,能顯著提升團隊的開發效率與產品品質。
Hugging Face 宣布與騰訊 ARC 實驗室合作,將 T2I-Adapter 引入 Stable Diffusion XL (SDXL)。相較於體積龐大的 ControlNet,T2I-Adapter 僅有約 79M 參數,能在不犧牲生成品質的前提下,大幅降低顯示記憶體(VRAM)佔用並提升推理速度。目前已支援 Canny 邊緣偵測、草圖(Sketch)、深度圖(Depth)等多種控制模式,並已整合至 diffusers 函式庫中。
本文回顧了文字生成圖像(Text-to-Image)技術的演進歷程。從早期的 GAN 限制,到 2021 年 VQGAN+CLIP 掀起的社群藝術熱潮,再到 2022 年 DALL-E 2 與 Stable Diffusion 的爆發。隨著 Stable Diffusion 迎來一週年及 SDXL 的推出,開源社群與微調技術正以前所未有的速度重塑視覺創作。
AI 雲端託管平台 Replicate 宣布為 SDXL 1.0 推出微調(Fine-tuning)功能,支援 Dreambooth、Textual Inversion 和 LoRA 等技術。開發者與創作者現在可以透過 Replicate API,僅需一行程式碼就能上傳自己的圖片並訓練出客製化的 SDXL 模型,大幅降低了客製化圖像生成模型的技術門檻與算力維護成本。
Hugging Face 宣布開源基於 Stable Diffusion 蒸餾的輕量化模型 SD-Small(約 5.11 億參數)與 SD-Tiny(約 3.23 億參數)的權重與完整訓練程式碼。透過知識蒸餾技術減少 UNet 的層數,這些模型在保留高圖像質量的同時,實現了 1.5 到 2 倍的推理加速。此舉不僅降低了消費級顯卡與行動裝置運行 AI 繪圖的門檻,也讓開發者能自行蒸餾客製化的 SD 模型。
本指南介紹如何利用開源 AI 模型(如 OpenAI 的 Shap-E 和 Zero-1-to-3)從文本或單張圖片快速生成 3D 模型。 詳細說明了將 AI 生成的原始 3D 網格(Mesh)匯入 Blender 進行減面(Decimation)與材質修復的實務工作流。 為遊戲開發者與 3D 設計師提供了一套降低創作門檻、加速原型設計的實用開源解決方案。
Hugging Face 發表了將 Stable Diffusion XL (SDXL) 部署於 Mac 的 Core ML 最佳化方案。透過先進的量化技術(如 6-bit 與 8-bit 量化),成功將龐大的 SDXL 模型體積縮減,使其能在 Apple Silicon(M1/M2 系列晶片)的 Mac 上流暢運行,顯著降低記憶體需求,並充分釋放 Apple 神經網路引擎(ANE)的硬體效能。
Replicate 宣布支援 Stability AI 的 SDXL 1.0 圖像生成模型。開發者無需自行維護昂貴的 GPU 基礎設施,只需透過簡單的 Python、JavaScript 或 cURL API 呼叫,即可在雲端運行 SDXL 1.0。本指南展示了如何設定提示詞、尺寸等參數,並快速將高品質的 AI 繪圖功能整合至應用程式中。
Hugging Face 舉辦的首屆開源 AI 遊戲創作大賽(Open Source AI Game Jam)圓滿落幕。本次活動吸引了上千名開發者參與,並提交了眾多將開源 AI 技術(如 LLM、圖像生成、語音辨識)融入遊戲玩法的創意作品。獲獎作品展示了如何利用 Hugging Face 的工具生態系與開源模型,為傳統遊戲注入全新的動態生成與互動機制。
Vercel 深入探討了前端開發流程的演變,指出傳統「設計、交付、開發、部署」的線性流程正被快速的「設計到部署」迭代所取代。隨著 AI 技術與視覺化工具的興起,設計師與開發者之間的界線變得模糊,非技術人員也能更直接地參與產品的構建與發布。文章強調未來的「Builder」(建構者)將不再受限於傳統職能,而是能利用現代平台與 AI 協作,以極高的速度將創意轉化為線上運行的產品。
本文為 Vercel 撰寫的 Web Streaming 串流技術入門指南。傳統 SSR 需等待所有數據準備完畢才渲染,而 Streaming 允許伺服器將網頁拆分為多個區塊(Chunks),並透過 HTTP 傳輸協議逐步推送至瀏覽器。這不僅能顯著降低首位元組時間(TTFB),還能結合 React Suspense 實現漸進式渲染,是現代前端開發與 AI 串流生成(LLM Streaming)不可或缺的底層效能優化手段。
Vercel 宣布為 Headless CMS 推出增強的內容管理功能,核心在於「視覺化編輯(Visual Editing)」。此功能與 Sanity、Contentful 等主流 CMS 深度整合,允許非技術人員直接在 Vercel 預覽頁面上點擊任意元素,即可快速定位並編輯 CMS 中的對應內容,大幅提升跨團隊協作效率。
Vercel 宣布其「視覺化編輯(Visual Editing)」功能正式支援 Markdown。這項更新讓團隊成員可以直接在網站預覽畫面上點擊由 Markdown 渲染的文字,並直接跳轉至對應的 CMS 或 Git 原始碼進行修改。此舉大幅降低了維護 Markdown 內容的門檻,完美結合了所見即所得的直觀性與 Markdown 的結構化優勢。
Vercel 發表專文介紹其「虛擬產品導覽(Virtual Product Tour)」的設計與開發幕後。團隊詳細拆解了如何利用 React Three Fiber、Framer Motion 等前端技術,在網頁上實現兼具高畫質 3D 視覺與流暢互動的引導體驗。這篇案例研究為追求極致網頁體驗的前端開發者與 UI/UX 設計師提供了寶貴的實踐指南。
本文介紹如何使用 Hugging Face 專為 Unity 開發者設計的開源 API 套件,在遊戲中輕鬆整合 AI 語音辨識(ASR)功能。透過該套件,開發者可以直接調用 Hugging Face Inference API(如 OpenAI 的 Whisper 模型),將玩家的麥克風錄音即時轉換為文字。這為遊戲內語音指令、與 NPC 的語音對話等互動機制提供了極低門檻的實現路徑,且無需在本地運行龐大的深度學習模型。
Hugging Face 宣布舉辦「Open Source AI Game Jam」,邀請全球開發者在限定時間內,利用開源 AI 工具與模型(如 Hugging Face 上的各類模型)來創作遊戲。此活動旨在探索 AI 在遊戲開發(如美術生成、NPC 對話、音效等)的實際應用,並促進遊戲與 AI 社群的跨界交流。
React 迎來開源 10 週年!Vercel 撰文回顧 React 自 2013 年問世以來的發展。從最初 JSX 語法備受社群質疑,到如今成為全球前端開發的絕對標準,React 徹底改變了 UI 開發範式。近年 Vercel 與 React 團隊緊密合作,共同推動 React Server Components (RSC),將網頁效能與開發體驗推向新高度,持續引領下一個世代的網頁開發。
Vercel 宣布與 Headless CMS 平台 Sanity 展開深度合作,共同推出「視覺化編輯(Visual Editing)」技術。此功能讓團隊成員能直接在 Vercel 的預覽網頁上點擊任意元素,並直接跳轉至 Sanity 後台對應的欄位進行修改。這項整合大幅消除了開發者與內容創作者之間的溝通隔閡,開創了更快速、更直觀的網頁協作新時代。
Vercel 是一個「前端雲端平台(Frontend Cloud)」,旨在簡化 Web 應用程式的部署與維護流程。它與 GitHub 等版本控制系統深度整合,實現 Git-push 即部署。除了作為 Next.js 的母公司,Vercel 還提供全球 Edge 網路、Serverless 函數、即時預覽(Preview Deployments)以及強大的 AI SDK,幫助開發者與團隊快速構建高效能、具備 AI 能力的現代網頁應用。
Vercel 發表全新「Visual Editing(視覺化編輯)」功能,解決了 Headless CMS 缺乏直覺編輯介面的痛點。編輯與開發人員現在可以直接在 Vercel 的預覽部署畫面上點擊任何元件,系統會自動導向 Headless CMS 中對應的欄位進行修改。此功能首波支援 Sanity 等主流 CMS,大幅提升跨團隊協作效率。
Hugging Face 推出官方 Unity API 套件,讓遊戲開發者能直接在 Unity 專案中調用 Hugging Face Hub 上的數千個 AI 模型。本文詳細介紹如何透過 Unity Package Manager 進行安裝,並展示如何設定 API 金鑰以啟用文本生成、語音識別及圖像生成等功能。這為獨立遊戲開發者開闢了將生成式 AI 融入遊戲機制的新途徑。
Hugging Face 官方發布教學,指導開發者如何將 Unity 遊戲部署至 Hugging Face Spaces。透過將 Unity 專案匯出為 WebGL 格式,並利用 Spaces 的 Docker 或靜態網頁託管功能,開發者可以輕鬆在平台上展示結合 AI 技術的互動式 3D 遊戲與 Demo,促進 AI 與遊戲開發的結合。
Vercel 介紹了 Next.js 的 `next/font` 功能,旨在解決網頁字型載入時的效能與排版問題。該功能會自動下載並託管字型檔案,消除外部網路請求以提升隱私與速度。最重要的是,它透過自動調整字型大小(size-adjust)來實現「零版面配置位移(Zero Layout Shift)」,讓自訂字型與 Google Fonts 的整合變得無比流暢。
Hugging Face 宣布將 ControlNet 整合至 🧨 diffusers 庫中。ControlNet 是一種能為 Stable Diffusion 等擴散模型加入額外控制條件(如 Canny 邊緣、OpenPose 姿勢、Depth 深度圖等)的架構。透過全新的 StableDiffusionControlNetPipeline,開發者只需幾行程式碼即可實現高精度的圖像生成與編輯,大幅提升了 AI 繪圖的可控性。
Hugging Face 發布全新開源專案 swift-diffusers,專為 Apple 生態系設計。該專案利用 Apple 的 Core ML 技術,讓 Stable Diffusion 模型能在 Mac(Apple Silicon)及 iOS 裝置上發揮極致效能。開發者可藉此輕鬆將 AI 繪圖功能整合至原生 App 中,並享有低記憶體佔用與神經網路引擎(ANE)加速的優勢。
Replicate 宣布支援 LoRA 技術,用於快速微調 Stable Diffusion 模型。相比於傳統的 DreamBooth,LoRA 不僅訓練速度大幅提升,產出的權重檔案也極小(僅數十 MB),讓創作者能以極低成本且更有效率地在雲端部署與切換不同的客製化風格。
本教學為 Hugging Face 遊戲開發系列的第五部分,專注於「故事生成」。文章探討如何利用大型語言模型(LLM)來突破傳統遊戲線性敘事的限制,創造出動態、互動性強的遊戲劇情與 NPC 對話。讀者將學習如何透過 Prompt 工程引導模型,並將其整合至 Unity 等遊戲引擎中,實現自動化且具備上下文連貫性的遊戲敘事。
本教學為 Hugging Face 遊戲開發 AI 系列的第四篇,專注於 2D 資產生成。文章深入探討如何利用 Stable Diffusion、DreamBooth 與 Image-to-Image 等技術,克服遊戲開發中「風格一致性」與「精確控制」的挑戰。讀者將學習如何生成無縫貼圖、角色概念圖及 UI 元素,並將其無縫整合至遊戲引擎的工作流中。
本文為 Hugging Face 官方介紹 LoRA(低秩適應)技術在 Stable Diffusion 微調上的應用。LoRA 透過凍結原模型並僅訓練新增的低秩矩陣,將顯存需求降至消費級顯卡即可運行的水平,且產出的權重檔案僅有數 MB(相較於完整微調的數 GB),極大地降低了個性化圖像生成模型的訓練門檻與分享成本。