Hugging Face 闡述了其對 TensorFlow (TF) 的核心哲學:將 TF 視為一等公民,確保與 PyTorch 模型的雙向互操作性。透過將 TF 模型設計為 `tf.keras.Model` 的子類別,開發者能直接使用 Keras 的 `fit()` 等 API,並支援 XLA 編譯與 `tf.data`,為 TF 社群提供無縫且直覺的開發體驗。
Hugging Face 介紹了一種利用對抗性數據動態訓練模型的方法。透過 Gradio 建立互動介面(以 MNIST 為例),讓使用者主動找出能騙過模型的樣本。這些對抗性數據會被自動收集並儲存至 Hugging Face Datasets,進而觸發模型的動態重新訓練,有效提升模型的魯棒性。
本文為 Hugging Face 針對機器學習初學者撰寫的入門指南。文章詳細介紹了從定義問題、準備數據集、選擇預訓練模型,到使用 Trainer API 進行微調,最後透過 Hugging Face Spaces 與 Gradio 部署展示的完整流程。這是一份幫助新手快速跨越 ML 門檻的實用路線圖,讓開發者能以最快速度實現從數據到 Demo 的完整閉環。
這是一篇由 Hugging Face 官方撰寫的經典入門指南,系統性地介紹了向量嵌入(Embeddings)的核心概念。文章解釋了如何將文字、圖像等非結構化數據轉化為高維向量,並透過餘弦相似度等指標計算語意相關性。此外,也展示了如何利用 sentence-transformers 庫快速實作語意搜尋與推薦系統。
本文為 Hugging Face 經典的擴散模型(Diffusion Models)深度教學,以 DDPM 為核心。透過 PyTorch 程式碼逐步實作前向加噪與反向去噪過程,並詳細拆解 U-Net 架構與損失函數。適合想從底層程式碼理解生成式 AI 影像生成原理的開發者與研究者。
Hugging Face 於 2022 年 5 月宣布推出 Fellowship 獎學金計畫,旨在支持全球的學生與研究人員投入開源機器學習項目。該計畫提供入選者導師指導、運算資源(如 GPU)以及資金資助,幫助他們在 Hugging Face 生態系中開發具影響力的 AI 工具與模型,進一步促進 AI 技術的民主化與開源社群發展。
本指南為 Hugging Face 深度強化學習課程的第一章。文章系統性地介紹了強化學習(RL)的核心架構,包含 Agent 與環境的互動循環、獎勵機制,並深入探討「探索與利用」(Exploration vs. Exploitation)的權衡。最後介紹如何結合深度學習形成 Deep RL,並引導讀者使用 Stable-Baselines3 等開源工具進行實作。
Hugging Face 宣布推出「Hugging Face for Education」計劃,旨在為全球教師與學生提供免費的機器學習教學資源。該計劃允許教師在 Hugging Face Hub 上建立專屬的班級組織,方便學生協作與提交專案。此外,學生還能利用 Spaces 與 Gradio 輕鬆建立並展示互動式 AI 應用,讓學術界能更無縫地接軌前沿 AI 技術。
本文為 Hugging Face「機器學習專家」系列訪談,主角為《Natural Language Processing with Transformers》共同作者 Lewis Tunstall。他分享了自己如何從理論物理學博士轉型為 AI 專家,並深入探討了撰寫該本暢銷書的挑戰、在 Hugging Face 推動開源生態系的經驗,以及他對未來 NLP 技術發展與新手學習路徑的實用建議。
Hugging Face 宣布啟動「AI 研究駐點計畫」,旨在打破傳統學術界限,邀請不同背景的研究員與工程師加入團隊。參與者將獲得豐富的算力資源、資深研究員的導師指導,並有機會發表學術論文。此計畫強調開源精神與遠端協作,致力於推動 AI 技術的民主化。
本文為 Hugging Face 官方教學,詳細介紹如何使用 `transformers` 與 `datasets` 函式庫微調 Vision Transformer (ViT) 模型。內容涵蓋從載入 Beans 資料集、使用影像處理器進行資料前處理、設定 `Trainer` API 進行訓練,到最後將微調後的模型上傳至 Hugging Face Hub 的完整流程,是電腦視覺開發者的必讀入門指南。
本文介紹如何利用 Hugging Face 的 `transformers` 庫在 Python 中進行情緒分析。內容涵蓋使用 `pipeline` 進行快速推理、從 Hugging Face Hub 選擇特定領域的預訓練模型(如 RoBERTa 或 FinBERT),以及如何使用自定義數據集微調模型,是 NLP 初學者的必讀指南。
本活動公告為 Hugging Face 於 2021 年 10 月舉辦的「課程發布社群活動」。該活動旨在慶祝 Hugging Face 官方 NLP 課程的推出,並透過社群黑客松、技術講座與交流,引導開發者與研究人員深入學習 Transformers、Datasets 和 Tokenizers 等開源工具,促進開源 AI 生態系的發展。
Hugging Face 發表 2021 年夏季回顧,重點介紹其暑期實習生在多個前沿 AI 領域的貢獻。實習生們參與了包括 Wav2Vec2 語音模型優化、多模態模型開發、Datasets 庫擴充,以及與 Google 合作的 JAX/Flax 社群黑客松。這段期間也見證了 Hugging Face Spaces 的快速成長,為開源 AI 社群注入了強大動力。
本文為 Hugging Face 撰寫的經典技術指南,深入探討基於 Transformer 的編碼器-解碼器(Encoder-Decoder)架構。文章詳細解析了雙向編碼器、自迴歸解碼器以及兩者之間的交叉注意力機制(Cross-Attention),並介紹如何利用 Hugging Face `EncoderDecoderModel` 結合預訓練模型(如 BERT 與 GPT-2)來建構強大的序列到序列(Seq2Seq)模型。
本文為 Hugging Face 的經典指南,詳細介紹如何從頭訓練全新的語言模型。內容涵蓋使用 tokenizers 快速訓練 Byte-Level BPE 分詞器、準備 Esperanto(世界語)數據集、配置 RoBERTa 模型架構,並利用 Trainer API 進行高效預訓練。這對於想為特定領域或罕見語言構建專屬模型的開發者與研究人員而言,是極具價值的實戰教學。