Hugging Face 發布圖形機器學習(Graph ML)入門教學,介紹如何處理非歐幾里得空間的圖形數據。文章涵蓋節點分類、邊界預測與整圖分類三大核心任務,並解釋圖神經網路(GNN)如何透過「訊息傳遞」機制聚合鄰近節點資訊。這項技術在社群網路分析、藥物研發與推薦系統中扮演關鍵角色。
Hugging Face 與 Intel 合作,展示如何在新一代 Intel Sapphire Rapids 處理器上加速 Transformer 模型。 透過內建的 Intel AMX(進階矩陣擴充)指令集,能顯著提升 BF16 與 INT8 的運算效率。 開發者只需搭配 optimum-intel 庫,即可輕鬆在 CPU 上實現高達數倍的推理與訓練加速,無需繁瑣的底層代碼修改。
Hugging Face 介紹了 CLIPSeg 模型,這是一個基於 CLIP 的零樣本圖像分割工具。使用者只需輸入簡單的文字提示(如「貓」或「杯子」)或參考影像,模型就能精確分割出目標物體。此技術免去了傳統分割模型需要大量標記資料與重新訓練的痛點,並已整合至 Hugging Face transformers 庫中,開發者只需幾行程式碼即可輕鬆上手。
Elixir 官方與 Hugging Face 合作推出 Bumblebee 專案,將主流的深度學習模型引入 Elixir 生態系。 基於 Nx 與 Axon 框架,開發者無需依賴 Python,即可在 Elixir 中直接載入並運行 GPT-2、Stable Diffusion 等模型。 搭配 Livebook 的智慧儲存格(Smart Cells),開發者只需點擊幾下,就能在數秒內部署並測試各種 AI 應用。
本文為 Hugging Face 針對生物資訊與深度學習結合的入門指南。文章介紹了蛋白質語言模型(pLM)的基本概念,將氨基酸序列視為文本,並展示如何利用 Meta 的 ESM-2 模型進行微調。讀者可以學習如何使用 Hugging Face transformers 庫來預測蛋白質的定位與功能,為 AI 驅動的藥物研發與生物科技奠定基礎。
Hugging Face 介紹了其首個專用於時間序列預測的 Transformer 模型。此模型採用 Encoder-Decoder 架構,並與熱門的時間序列庫 GluonTS 整合,能預測未來的機率分佈(而非單一數值),從而提供不確定性估計。文章詳細說明了如何利用時間特徵、滯後特徵(Lags)進行資料預處理,並透過實際程式碼展示了從資料準備、模型訓練到預測視覺化的完整流程。
Hugging Face 介紹了微軟開發的 VQ-Diffusion 模型,這是一種基於離散空間的文本到圖像生成技術。與傳統在連續空間運作的擴散模型不同,它結合了 VQ-VAE 的離散 Token 表示法與擴散模型,有效解決了自迴歸模型的誤差累積問題。開發者與研究人員可以透過 Hugging Face 的 `diffusers` 套件輕鬆調用此模型進行高效的影像生成。
本文介紹 Hugging Face 於 2022 年 11 月舉辦的「Diffusion Models Live Event」直播活動。該活動旨在向開發者與研究人員推廣擴散模型技術,並介紹當時新推出的 diffusers 函式庫。活動內容涵蓋從零開始訓練擴散模型、圖像生成原理及社群實作分享,是開源 AI 圖像生成發展史上的重要里程碑。
本文探討 Hugging Face 在文件 AI(Document AI)領域的加速方案。針對 LayoutLMv3 與免 OCR 的 Donut 等多模態模型,Hugging Face 介紹了如何利用 Optimum 庫、ONNX Runtime 及量化技術,克服多模態模型在生產環境中的高延遲與高成本挑戰,實現高效能的文件自動化處理。
本教學詳細介紹如何使用 Hugging Face 的 `transformers` 庫微調 OpenAI 的 Whisper 語音辨識模型。內容涵蓋從載入 Common Voice 資料集、音訊預處理(重採樣至 16kHz 並轉換為 Log-Mel 聲譜圖)、設定 Tokenizer,到使用 `Seq2SeqTrainer` 進行訓練與評估(以 WER 為指標)的完整流程。這對於想在特定低資源語言或專業領域提升語音轉文字精準度的開發者與研究人員來說,是極具價值的實戰指南。
本指南深入探討了在 PyTorch 中進行分散式訓練的三種層次。首先介紹底層的 PyTorch DDP(Distributed Data Parallel),展示其強大但繁瑣的設定;接著引入 Hugging Face Accelerate,它保留了 PyTorch 的靈活性,同時簡化了多 GPU、TPU 與混合精度的設定;最後介紹高階的 Trainer API,讓開發者只需幾行程式碼就能自動處理完整的分散式訓練流程。這篇文章非常適合想優化模型訓練效率的機器學習工程師。
本教學為 Hugging Face 官方指南,介紹如何訓練第一個 Decision Transformer (DT)。DT 將強化學習(RL)重新框架為序列建模問題,利用 Transformer 架構預測動作。教學涵蓋離線強化學習(Offline RL)的概念、如何使用 Hugging Face 的 `transformers` 庫與 `DecisionTransformerModel`,並在 Gym 環境中進行實作與評估,是結合 NLP 技術與控制任務的經典入門。
Hugging Face 宣布支援在 Spaces 中整合 3Dmol.js 視覺化工具。這項功能讓生物資訊與 AI 領域的研究人員,能直接在 Gradio 或 Streamlit 應用中呈現 3D 分子模型。對於展示如 AlphaFold 或 ESMFold 等蛋白質預測模型結果非常實用,大幅降低了生醫 AI 展示工具的開發門檻。
本指南介紹如何結合 Hugging Face Transformers 與 Intel Habana Gaudi (HPU) 進行 BERT 模型的預訓練。透過 optimum-habana 整合,開發者只需修改幾行程式碼,即可將訓練任務轉移至 Gaudi 晶片,大幅提升訓練效率並降低成本。文章提供完整的程式碼範例與配置步驟,適合需要大規模預訓練自訂模型的工程師。
本文詳細說明如何將 Hugging Face 的 ViT (Vision Transformer) 模型部署至 Google Cloud Vertex AI。步驟包含編寫自定義預測腳本、打包 Docker 容器、將模型註冊至 Model Registry,並最終部署到端點進行即時線上推論,是電腦視覺模型落地的實用指南。
本文詳細說明了將 Hugging Face 的 Vision Transformer (ViT) 模型部署到生產環境的完整流程。內容涵蓋將模型轉換為 TensorFlow SavedModel 格式、配置 TF Serving 服務,以及撰寫 Kubernetes 部署與服務 YAML 檔。最後展示了如何透過 API 進行高效能的圖像分類推理,是 MLOps 工程師將視覺模型落地生產環境的實用指南。
本文探討如何利用 CLIP 的語意搜尋能力與龐大的 LAION-5B 開源影像數據集,自動化建立自定義圖像數據集。讀者可以透過輸入文字描述,精準篩選並批次下載成千上萬張相關圖片與其標籤。這對於需要訓練專屬 AI 模型(如 Stable Diffusion 微調)的開發者與研究人員來說,是一個極具實用價值的工具與工作流。
Hugging Face 官方部落格介紹了 Nyströmformer 模型。該模型旨在解決傳統 Transformer 在處理長序列時面臨的平方級(O(n²))時間與記憶體複雜度限制。透過引入數學上的 Nyström 方法,Nyströmformer 能夠以線性(O(n))的複雜度高效逼近標準的 Self-Attention 機制,並已整合至 Hugging Face transformers 庫中,方便開發者直接調用。
Hugging Face 官方部落格介紹了結合 TensorFlow 與 XLA(加速線性代數)編譯器來優化文本生成的方法。透過在 generate() 函數中啟用 jit_compile=True,開發者可以顯著減少推論延遲。然而,由於 XLA 需要靜態形狀(static shapes),使用時必須對輸入進行固定長度的填充與截斷。
本教學詳細說明如何將 Hugging Face 平台上的 TensorFlow 電腦視覺模型(如 ViT)導出為 SavedModel 格式。接著,展示如何利用 TensorFlow Serving (TF Serving) 搭配 Docker 進行模型部署,並透過 REST API 進行高效能的影像分類推論,為開發者提供一套將研發成果轉化為生產線服務的標準流程。
本指南為 Hugging Face 官方實戰教學,指導開發者如何利用 Transformers 庫對 Twitter (X) 貼文進行情緒分析。內容涵蓋使用 Pipeline API 進行快速推論、選用針對社群媒體優化的 twitter-roberta-base 模型,以及如何使用自訂資料集進行模型微調,是 NLP 初學者與社群輿情分析師的必讀經典。
本文為 Hugging Face 經典的擴散模型(Diffusion Models)深度教學,以 DDPM 為核心。透過 PyTorch 程式碼逐步實作前向加噪與反向去噪過程,並詳細拆解 U-Net 架構與損失函數。適合想從底層程式碼理解生成式 AI 影像生成原理的開發者與研究者。
本文為 Hugging Face 深度強化學習(Deep RL)課程的第三單元,專注於「深度 Q 學習(Deep Q-Learning, DQN)」。文章詳細介紹了 DQN 的核心概念(如時間差分學習、經驗回放與目標網路),並手把手教學如何使用 Stable-Baselines3 程式庫訓練一個能玩經典街機遊戲《Space Invaders》的 AI 代理人,最後將模型上傳至 Hugging Face Hub。
本文探討基於文字生成向量草圖的 CLIPDraw 工具,並介紹「可微程式設計」概念。透過在優化過程中加入筆畫數量、顏色或幾何形狀等限制,創作者能引導 AI 擺脫雜亂線條,生成更具結構性與獨特藝術風格的向量作品,為生成藝術的微調與控制提供了清晰的實踐路徑。
Hugging Face 與 Graphcore 宣布推出全新支援 IPU(Intelligence Processing Unit)的 Transformers 模型陣容。透過專屬的 optimum-graphcore 工具包,開發者可以輕鬆在 Graphcore 的硬體上部署與加速 BERT、GPT-2 等主流模型。此合作旨在降低硬體加速門檻,為開發者提供除了 GPU 之外的高效能替代方案。
本文為 Hugging Face 深度強化學習系列教程中 Q-Learning 的後半部分。內容專注於 Q-Learning 演算法的具體執行步驟,詳細解析 Epsilon-Greedy 策略如何平衡「探索與利用」,並引導讀者使用 Python 與 Gymnasium 庫在 FrozenLake 等經典環境中從零實作 Q-Table,最後將訓練好的 Agent 上傳至 Hugging Face Hub。
Hugging Face 宣布與 Intel 旗下的 Habana Labs 展開合作,旨在提升 Transformer 模型的訓練與部署效率。 雙方共同推出了 `optimum-habana` 開源庫,讓開發者能輕鬆將 Hugging Face 模型遷移至 Habana Gaudi 處理器(HPU)上運行。 此合作為開發者提供除了傳統 GPU 之外,更具性價比的高性能深度學習硬體選擇,僅需修改幾行程式碼即可啟用。
Hugging Face 探討了其開源庫 Transformers 的核心設計哲學。與傳統軟體工程極力避免重複程式碼(DRY 原則)不同,他們選擇了「重複自己」的「單一檔案政策」(Single-file policy)。這種設計讓每個模型(如 BERT、GPT)的程式碼都獨立完整,極大地提升了機器學習研究者的閱讀與修改效率,雖然增加了維護重複程式碼的成本,但換來了極高的靈活性。
Hugging Face 宣布在其 transformers 函式庫中正式支援 Decision Transformer (DT)。此模型顛覆傳統強化學習(RL)方法,不使用價值函數或策略梯度,而是將狀態、動作與目標回報視為序列,利用類似 GPT 的自注意力機制來預測下一步動作。這項整合大幅降低了離線強化學習(Offline RL)的門檻,讓開發者能用熟悉的 Transformer 工具鏈進行決策模型的訓練。
本指南介紹如何利用 Hugging Face 的 Transformers 庫微調 SegFormer 進行語義分割。內容涵蓋自定義資料集的準備、使用 SegformerImageProcessor 進行圖像預處理,以及設定 Trainer API 進行訓練。最後,教學展示了如何使用 mIoU 評估模型效能並進行推理。