本文為 Hugging Face 官方教學,詳細介紹如何使用 `transformers` 與 `datasets` 函式庫微調 Vision Transformer (ViT) 模型。內容涵蓋從載入 Beans 資料集、使用影像處理器進行資料前處理、設定 `Trainer` API 進行訓練,到最後將微調後的模型上傳至 Hugging Face Hub 的完整流程,是電腦視覺開發者的必讀入門指南。
本文介紹如何利用 Hugging Face 的 `transformers` 庫在 Python 中進行情緒分析。內容涵蓋使用 `pipeline` 進行快速推理、從 Hugging Face Hub 選擇特定領域的預訓練模型(如 RoBERTa 或 FinBERT),以及如何使用自定義數據集微調模型,是 NLP 初學者的必讀指南。
Hugging Face 與 Explosion 合作,展示如何將 Prodigy 資料標記工具與 AutoNLP(現為 AutoTrain)整合。透過主動學習(Active Learning)機制,系統能自動篩選出模型最不確定的樣本供人工標記,大幅減少標記成本。此工作流讓開發者無需編寫複雜代碼,即可快速迭代並優化 NLP 模型。
Hugging Face 與 Intel 合作,展示如何利用 Intel Extension for PyTorch (IPEX) 和 oneCCL 提升 CPU 上的模型微調效率。透過自動混合精度(BFloat16)與優化的分散式通訊,開發者可以在 Intel Xeon 處理器上實現高效的多節點分散式訓練。這為缺乏 GPU 資源或希望活化現有 CPU 叢集的企業提供了極具成本效益的替代方案。
本教學詳細介紹如何利用 Hugging Face Transformers 庫,針對缺乏訓練數據的低資源語言微調 Meta 的 XLSR-Wav2Vec2 語音模型。內容涵蓋從 Common Voice 數據集下載、音訊預處理、建立專屬 Tokenizer,到使用 CTC 損失函數進行模型訓練的完整工作流。對於想在特定方言或少數語言上實現高精度語音辨識(ASR)的開發者與研究人員,這是極具價值的實戰指南。
本文探討如何針對遙測(衛星)影像微調 OpenAI 的 CLIP 多模態模型。由於通用 CLIP 在處理俯視、高空等特殊視角的衛星影像時表現不佳,研究團隊利用 RSICD 數據集與 JAX/Flax 框架進行微調。微調後的模型能顯著提升衛星影像的文本檢索與分類準確度,為地理資訊與遙測領域提供強大的開源工具。
這是一篇 Hugging Face 官方教學,指導開發者如何使用 Amazon SageMaker 的分散式訓練功能來微調大型 Seq2Seq 模型(如 BART 和 T5)。文章詳細說明了如何將 Hugging Face 的 Seq2SeqTrainer 與 SageMaker Data Parallelism 庫結合,以解決單一 GPU 記憶體不足或訓練過慢的問題。讀者將學會如何準備訓練腳本、配置 SageMaker Estimator,並在 AWS 的多 GPU 實例上啟動高效的分散式訓練任務。
本指南詳細介紹如何利用 🤗 Transformers 與 Datasets 庫微調 Meta 的 Wav2Vec2 模型以進行英文語音辨識(ASR)。教學涵蓋了語音數據預處理(重採樣至 16kHz)、使用 CTC 損失函數、配置 Wav2Vec2Processor,以及使用 Trainer API 進行模型訓練與字錯率(WER)評估,是語音 AI 領域的經典必讀教學。
Hugging Face 發表技術部落格,介紹如何使用 `EncoderDecoderModel` 將現有的預訓練編碼器(如 BERT)與解碼器(如 GPT-2)結合。 這種「熱啟動(Warm-starting)」方法免去了從頭訓練 Seq2Seq 模型的巨大成本,特別適合摘要生成和機器翻譯等任務。 文章詳細說明了架構原理、交叉注意力機制的初始化,並提供了實用的 Transformers 程式碼範例。
本文介紹 Hugging Face Transformers 與 Ray Tune 的整合。透過 Trainer API 內建的 hyperparameter_search 功能,開發者只需幾行程式碼即可啟用分散式超參數搜尋。文章詳細說明了如何設定搜尋空間、使用 ASHA 等高效排程演算法,並在多 GPU 環境下加速模型微調與優化過程。