Hugging Face 宣布將其廣受歡迎的經典「NLP 課程(NLP Course)」正式轉型並升級為「LLM 課程(LLM Course)」。這項轉變反映了 AI 領域從傳統 NLP(如 BERT、分類與命名實體識別)向大語言模型(如 Llama、生成式 AI、RAG 與 Agent)的典範轉移。新課程將全面更新,涵蓋現代 LLM 架構、微調(PEFT/LoRA)、對齊(RLHF/DPO)及應用開發,繼續提供免費且高品質的開源學習資源。
本指南是 Hugging Face 專為零基礎新手撰寫的 Transformers 入門教學。文章深入淺出地介紹了 Hugging Face Hub 的生態系,並透過最簡單的 pipeline API 示範如何進行情感分析、文本生成等任務。讀者無需深厚的機器學習背景,即可快速學會如何載入並運行開源 AI 模型。
本指南為 Hugging Face 官方實戰教學,指導開發者如何利用 Transformers 庫對 Twitter (X) 貼文進行情緒分析。內容涵蓋使用 Pipeline API 進行快速推論、選用針對社群媒體優化的 twitter-roberta-base 模型,以及如何使用自訂資料集進行模型微調,是 NLP 初學者與社群輿情分析師的必讀經典。
這是一篇由 Hugging Face 官方撰寫的經典入門指南,系統性地介紹了向量嵌入(Embeddings)的核心概念。文章解釋了如何將文字、圖像等非結構化數據轉化為高維向量,並透過餘弦相似度等指標計算語意相關性。此外,也展示了如何利用 sentence-transformers 庫快速實作語意搜尋與推薦系統。
本文為 Hugging Face「機器學習專家」系列訪談,主角為《Natural Language Processing with Transformers》共同作者 Lewis Tunstall。他分享了自己如何從理論物理學博士轉型為 AI 專家,並深入探討了撰寫該本暢銷書的挑戰、在 Hugging Face 推動開源生態系的經驗,以及他對未來 NLP 技術發展與新手學習路徑的實用建議。
本指南深入淺出地解析了 Google 提出的革命性 NLP 模型 BERT。文章詳細介紹了其基於 Transformer Encoder 的雙向架構,並剖析了「遮罩語言模型 (MLM)」與「下一句預測 (NSP)」兩大核心預訓練機制。最後,展示了如何透過 Hugging Face 輕鬆將 BERT 應用於各種下游自然語言處理任務。
本文介紹如何利用 Hugging Face 的 `transformers` 庫在 Python 中進行情緒分析。內容涵蓋使用 `pipeline` 進行快速推理、從 Hugging Face Hub 選擇特定領域的預訓練模型(如 RoBERTa 或 FinBERT),以及如何使用自定義數據集微調模型,是 NLP 初學者的必讀指南。
本活動公告為 Hugging Face 於 2021 年 10 月舉辦的「課程發布社群活動」。該活動旨在慶祝 Hugging Face 官方 NLP 課程的推出,並透過社群黑客松、技術講座與交流,引導開發者與研究人員深入學習 Transformers、Datasets 和 Tokenizers 等開源工具,促進開源 AI 生態系的發展。
本文為 Hugging Face 的經典指南,詳細介紹如何從頭訓練全新的語言模型。內容涵蓋使用 tokenizers 快速訓練 Byte-Level BPE 分詞器、準備 Esperanto(世界語)數據集、配置 RoBERTa 模型架構,並利用 Trainer API 進行高效預訓練。這對於想為特定領域或罕見語言構建專屬模型的開發者與研究人員而言,是極具價值的實戰教學。