Hugging Face 介紹了全新解碼方法「對比搜索(Contrastive Search)」,現已整合至 Transformers 庫中。該方法透過引入「退化懲罰」機制,在保持模型預測概率的同時,避免生成與前文語意重複的詞彙。相比傳統的束搜索(Beam Search)或隨機採樣(Sampling),對比搜索能生成更具連貫性、多樣性且無重複的長文本,達到接近人類寫作的水準。
本教學詳細介紹如何使用 Hugging Face 的 `transformers` 庫微調 OpenAI 的 Whisper 語音辨識模型。內容涵蓋從載入 Common Voice 資料集、音訊預處理(重採樣至 16kHz 並轉換為 Log-Mel 聲譜圖)、設定 Tokenizer,到使用 `Seq2SeqTrainer` 進行訓練與評估(以 WER 為指標)的完整流程。這對於想在特定低資源語言或專業領域提升語音轉文字精準度的開發者與研究人員來說,是極具價值的實戰指南。
Hugging Face 介紹了 `optimum-intel` 與 Intel OpenVINO 的整合。開發者可使用簡單的 `OVModel` API 直接在 Intel CPU 和 GPU 上載入、優化並運行 Hugging Face 模型。此工具還整合了 NNCF 框架,支援將模型量化至 INT8,在極低精度損失下顯著提升推理效率並降低延遲,非常適合邊緣運算與伺服器部署。
Hugging Face 推出 evaluate 函式庫,旨在簡化機器學習模型的評估流程。本文重點介紹如何利用該工具評估語言模型中的偏見與毒性,包含使用 regard、toxicity 等評估指標。透過標準化的評估流程,開發者能更輕易地量化模型在性別、種族等維度上的潛在社會偏見,從而打造更安全、公平的 AI 應用。
Hugging Face Inference Endpoints 是一項完全託管的服務,旨在簡化機器學習模型的部署流程。用戶只需點擊幾下,即可將 Hugging Face Hub 上的任何模型部署到 AWS 或 Azure 等雲端基礎設施。該服務支援 GPU/CPU 彈性縮放、自訂容器與私有連線(VPC),大幅降低了開發者與企業維護生產級推論 API 的門檻與成本。
Hugging Face 宣布在 diffusers 庫中支援 JAX 和 Flax 版本的 Stable Diffusion。藉由 JAX 的 XLA 編譯與硬體加速,開發者可以在 TPU 和 GPU 上實現極致的推理速度,並輕鬆透過並行運算(pmap)在數秒內生成大量高品質圖片。這為大規模圖像生成與研究提供了全新的高效能選擇。
本文探討 Hugging Face 優化 1760 億參數大模型 BLOOM 推理的技術細節。面對 FP16 下高達 352GB 的顯示記憶體需求,團隊結合了 8-bit 量化(LLM.int8())、Tensor Parallelism(張量並行)以及 Hugging Face Accelerate 的 CPU/NVMe 卸載技術。這些優化成功將記憶體需求減半,並顯著提升吞吐量,降低了開源社群部署超大型語言模型的門檻。
Hugging Face 宣布支援 DOI(數位物件識別碼),允許用戶為其託管的模型和資料集生成永久且可信賴的引用連結。此舉旨在解決機器學習領域中學術引用不規範與版本混亂的問題。研究人員現在可以一鍵生成 BibTeX 引用格式,大幅提升開源研究的可重複性與學術影響力追蹤。
Stability AI 於 2022 年 10 月推出了「Japanese Stable Diffusion」模型。該模型專為日語語境進行優化,解決了先前英文版 Stable Diffusion 難以精確理解日語輸入與日本文化細節的問題。用戶可以直接使用日語進行 Prompt 創作,生成更符合日本審美與文化背景的圖像,並已開源託管於 Hugging Face。
隨著大型語言模型(LLM)體積急劇膨脹,如何公平且標準化地評估其性能成為一大挑戰。Hugging Face 宣布與 EleutherAI 合作,將其著名的 lm-evaluation-harness 整合至 Hugging Face Hub。用戶現在可以直接在 Hub 上對託管的模型進行零樣本(Zero-shot)與少樣本(Few-shot)評估,這不僅簡化了評估流程,更促進了開源 AI 社群的基準測試透明度與可重複性。
Hugging Face 介紹了其 `Accelerate` 函式庫如何解決超大型模型(如 BLOOM-176B)在單一或有限 GPU 上因記憶體不足而無法加載的痛點。透過 PyTorch 的「元設備(Meta Device)」進行空權重初始化,並結合 `device_map="auto"` 自動將模型層分配至 GPU、CPU 甚至硬碟。這項技術讓開發者與研究人員能在消費級硬體或有限的資源下,進行超大模型的推理與微調。
Hugging Face 與 Intel Labs 等機構合作推出 SetFit 框架,專為少樣本(Few-shot)文字分類設計。不同於傳統大模型依賴複雜的 Prompt 工程,SetFit 結合了 Sentence Transformers 的對比微調與簡單的分類器。它不僅訓練速度極快、推理成本低,在每類僅需十幾個樣本的情況下,準確度甚至能超越傳統大型語言模型。
Hugging Face 發表第一期《倫理與社會電子報》,正式介紹其倫理與社會研究團隊的願景。內容涵蓋 BigScience 專案的倫理憲章、推動限制惡意使用的「負責任 AI 授權條款(RAIL)」,以及資料集偏見評估工具。此舉旨在倡導開源社群在追求技術進步的同時,兼顧社會責任與倫理規範。
Hugging Face 釋出技術指南,針對 1760 億參數的開源巨型模型 BLOOM 提供高效推理方案。透過結合 DeepSpeed-Inference 的張量並行(Tensor Parallelism)與 Accelerate 的彈性部署,解決了超大模型需要超高 VRAM 的痛點。文章提供具體 PyTorch 腳本與基準測試,展示如何在多卡環境下將推理延遲降至最低。
Hugging Face 發布 Diffusers 開源庫推出兩個月的進展報告。本次更新核心在於全面整合 Stable Diffusion,並推出圖生圖(Img2Img)與局部繪製(Inpainting)等全新 Pipeline。此外,團隊大幅優化了記憶體佔用,引入 Attention Slicing 技術,讓 4GB 顯存的 GPU 也能順利運行擴散模型,並新增了多種採樣調度器(Schedulers)。
這是一篇由 Hugging Face 發布的實用教學,指導開發者如何使用 NVIDIA 的 Megatron-LM 框架來訓練超越單張 GPU 顯存限制的大型語言模型(LLM)。文章深入探討了張量並行(Tensor Parallelism)與流水線並行(Pipeline Parallelism)的核心概念,並詳細說明了從數據準備、訓練配置到最後將 Megatron 權重轉換回 Hugging Face Transformers 格式的完整工作流。
Hugging Face 介紹了 OpenRAIL(開放負責任 AI 授權)框架,旨在解決傳統開源授權無法約束 AI 濫用的問題。該框架允許用戶自由下載、修改和商業化 AI 模型,但同時在授權條款中加入「使用限制條款」,禁止將 AI 用於惡意用途(如生成深偽造、違法行為等)。這項舉措在促進技術共享與防範 AI 風險之間取得了平衡,成為 Stable Diffusion 等知名模型所採用的授權基礎。
本教學指導開發者如何在 M1 Mac 上利用 PyTorch 的 MPS (Metal Performance Shaders) 後端,本地端調用 GPU 運行 Stable Diffusion。內容涵蓋 Python 環境設定、安裝支援 MPS 的 PyTorch 與 Hugging Face diffusers 庫,並提供完整的程式碼範例,讓開發者能完全免費、私密地在 local 端進行 AI 圖像生成與二次開發。
Hugging Face 於 2022 年 8 月宣布將剛發布的 Stable Diffusion 整合至其 🧨 Diffusers 函式庫中。這項合作讓開發者與研究人員能夠透過極簡的 Python API,輕鬆載入權重並進行文字生成圖像(Text-to-Image)的推論。文章詳細介紹了潛在擴散模型(Latent Diffusion)的運作原理,並提供多種記憶體優化技術,大幅降低了開源 AI 繪圖的硬體門檻。
本文詳細說明如何將 Hugging Face 的 ViT (Vision Transformer) 模型部署至 Google Cloud Vertex AI。步驟包含編寫自定義預測腳本、打包 Docker 容器、將模型註冊至 Model Registry,並最終部署到端點進行即時線上推論,是電腦視覺模型落地的實用指南。
Hugging Face 深入探討如何結合 Optimum 庫與 Graphcore 的 IPU(智慧處理單元)來加速 Vision Transformer (ViT) 模型。文章詳細說明了 optimum-graphcore 的整合方式,展示如何透過簡單的代碼修改,在 IPU 上實現高效的圖像分類模型微調與推理。這為需要處理大規模電腦視覺任務的開發者提供了一個強大且具成本效益的硬體加速方案。
Hugging Face 宣布與 bitsandbytes 深度整合,支援 LLM.int8() 8-bit 量化技術。此技術透過混合精度分解,將極端值保留在 FP16,其餘進行 8-bit 量化,成功讓大模型(如 BLOOM-176B)的記憶體需求減半。開發者現在只需在 from_pretrained 中加入 load_in_8bit=True,即可在消費級 GPU 上運行原本需要多張顯卡的大型語言模型。
Hugging Face 闡述了其對 TensorFlow (TF) 的核心哲學:將 TF 視為一等公民,確保與 PyTorch 模型的雙向互操作性。透過將 TF 模型設計為 `tf.keras.Model` 的子類別,開發者能直接使用 Keras 的 `fit()` 等 API,並支援 XLA 編譯與 `tf.data`,為 TF 社群提供無縫且直覺的開發體驗。
本指南詳細介紹如何訓練與微調 Sentence Transformers 模型。內容涵蓋雙編碼器(Bi-Encoder)與交叉編碼器(Cross-Encoder)的差異、如何準備訓練數據(如成對文本或三元組),以及如何選擇適合的損失函數(如 MultipleNegativesRankingLoss)來提升語意搜尋與向量檢索的精準度,是優化 RAG 系統必讀的經典教學。
本文探討如何利用 CLIP 的語意搜尋能力與龐大的 LAION-5B 開源影像數據集,自動化建立自定義圖像數據集。讀者可以透過輸入文字描述,精準篩選並批次下載成千上萬張相關圖片與其標籤。這對於需要訓練專屬 AI 模型(如 Stable Diffusion 微調)的開發者與研究人員來說,是一個極具實用價值的工具與工作流。
Hugging Face 針對美國「國家 AI 研究資源(NAIRR)」中期報告提交官方反饋。其核心訴求包括:大力支持開源 AI 與開放科學、推動運算與數據資源的民主化分配以扶植中小型研究機構,以及建立完善的模型與數據集文件規範(如 Model Cards)。此舉旨在確保國家級 AI 資源能真正惠及大眾,而非僅由少數科技巨頭壟斷。
Hugging Face 針對其熱門開源庫 `datasets` 發布了全新的音訊與電腦視覺專屬文件。此更新旨在引導開發者如何載入、預處理及操作非文本資料,並詳細介紹了 `Audio` 與 `Image` 特徵類型的使用方法。這標誌著 Hugging Face 從純文本領域向多模態 AI 邁出的重要一步。
Hugging Face 官方部落格介紹了結合 TensorFlow 與 XLA(加速線性代數)編譯器來優化文本生成的方法。透過在 generate() 函數中啟用 jit_compile=True,開發者可以顯著減少推論延遲。然而,由於 XLA 需要靜態形狀(static shapes),使用時必須對輸入進行固定長度的填充與截斷。
Replicate 介紹了如何透過其 API 運行文字生成圖片模型。讀者將學習到如何使用 Python 客戶端,只需幾行程式碼即可呼叫雲端託管的 AI 模型,並輸入提示詞(Prompt)來生成影像。這為開發者提供了一個無需本地高階 GPU 即可快速整合圖像生成功能的途徑。
Hugging Face 介紹了一種利用對抗性數據動態訓練模型的方法。透過 Gradio 建立互動介面(以 MNIST 為例),讓使用者主動找出能騙過模型的樣本。這些對抗性數據會被自動收集並儲存至 Hugging Face Datasets,進而觸發模型的動態重新訓練,有效提升模型的魯棒性。