本教學介紹了一套無程式碼/低程式碼的 NLP 工作流。首先利用 Kili Technology 平台進行高效的文本數據標註與品質管理,接著將標註好的輿情數據集導入 Hugging Face AutoTrain。AutoTrain 會自動嘗試多種開源模型架構並進行微調,讓開發者在無需編寫複雜深度學習程式碼的情況下,快速構建出高精度的輿情與觀點分類模型。
本報告源自 Hugging Face 針對多位企業機器學習主管(Director of ML)的調查與訪談。內容指出,將模型從實驗室原型轉化為穩定生產服務(Deployment Gap)仍是企業最大痛點。主管們強調了 MLOps 工具鏈整合、開源模型在企業級應用的崛起,以及跨團隊(數據科學與軟體工程)協作與人才招募的持續挑戰。
Hugging Face 與 Intel Habana Labs 合作推出 optimum-habana 庫。開發者只需將標準的 Trainer 替換為 GaudiTrainer,即可在 AWS DL1 等 Gaudi 實例上進行高效能、低成本的 Transformer 模型訓練。這為 NVIDIA 之外的 AI 晶片生態系提供了一個強大的替代方案,能有效降低高達 40% 的訓練成本。
Hugging Face 探討了機器學習在現代客服系統中的關鍵應用。透過自動工單分類、即時情緒分析以及基於語意搜尋的知識庫問答,企業能顯著縮短回應時間並提升客戶滿意度。文章也介紹了如何利用 Hugging Face AutoTrain 與 Inference API 快速部署這些解決方案,降低企業導入 AI 的技術門檻。
Hugging Face 宣布推出「Hugging Face for Education」計劃,旨在為全球教師與學生提供免費的機器學習教學資源。該計劃允許教師在 Hugging Face Hub 上建立專屬的班級組織,方便學生協作與提交專案。此外,學生還能利用 Spaces 與 Gradio 輕鬆建立並展示互動式 AI 應用,讓學術界能更無縫地接軌前沿 AI 技術。
Hugging Face 在世界地球日宣布於 Hugging Face Hub 推出新功能,旨在追蹤並公開 AI 模型的碳排放量。開發者現在可以在模型卡片(Model Cards)的元數據中加入 co2_eq_emissions 欄位,直接展示模型訓練所產生的二氧化碳當量。此舉旨在提升 AI 社群對環境影響的意識,並倡導更具永續性的「綠色 AI」開發實踐。
本文為 Hugging Face「機器學習專家」系列訪談,主角為《Natural Language Processing with Transformers》共同作者 Lewis Tunstall。他分享了自己如何從理論物理學博士轉型為 AI 專家,並深入探討了撰寫該本暢銷書的挑戰、在 Hugging Face 推動開源生態系的經驗,以及他對未來 NLP 技術發展與新手學習路徑的實用建議。
本篇專訪介紹了 Hugging Face 首席倫理科學家 Margaret Mitchell 的學術背景與願景。作為「模型卡(Model Cards)」的共同倡議者,她分享了從 Google 到 Hugging Face 的心路歷程。她強調在開源社群中建立 AI 倫理工具的重要性,並探討如何透過透明度與多樣性來減少機器學習模型中的偏見與危害。
Hugging Face 宣布啟動「AI 研究駐點計畫」,旨在打破傳統學術界限,邀請不同背景的研究員與工程師加入團隊。參與者將獲得豐富的算力資源、資深研究員的導師指導,並有機會發表學術論文。此計畫強調開源精神與遠端協作,致力於推動 AI 技術的民主化。
Hugging Face 介紹了如何使用其 datasets 庫來實現圖像搜尋系統。透過整合預訓練的視覺模型(如 CLIP)來提取圖像的特徵向量(embeddings),並利用內建的 FAISS 索引功能,開發者可以輕鬆對大規模圖像數據集進行高效的相似度檢索。這為以圖搜圖、多模態檢索等應用提供了極為簡便的實作路徑。
本文介紹 Hugging Face Transformers 支援的「受約束的束搜索(Constrained Beam Search)」技術。傳統束搜索僅依賴機率,而此技術允許開發者指定必須出現在生成結果中的特定詞彙或短語。這在機器翻譯、摘要生成及特定領域的文本生成中非常實用,能有效控制輸出品質並確保關鍵資訊不遺漏。
本文為 Hugging Face 官方教學,詳細介紹如何使用 `transformers` 與 `datasets` 函式庫微調 Vision Transformer (ViT) 模型。內容涵蓋從載入 Beans 資料集、使用影像處理器進行資料前處理、設定 `Trainer` API 進行訓練,到最後將微調後的模型上傳至 Hugging Face Hub 的完整流程,是電腦視覺開發者的必讀入門指南。
本文介紹如何利用 Hugging Face 的 `transformers` 庫在 Python 中進行情緒分析。內容涵蓋使用 `pipeline` 進行快速推理、從 Hugging Face Hub 選擇特定領域的預訓練模型(如 RoBERTa 或 FinBERT),以及如何使用自定義數據集微調模型,是 NLP 初學者的必讀指南。
Hugging Face 推出全新升級的 Hub 搜尋功能,大幅提升資源檢索效率。用戶現在可以透過機器學習任務、支援的庫(如 PyTorch、TensorFlow)、語言及授權條款等多重條件進行精確篩選。此更新旨在幫助開發者在快速增長的開源生態系中,迅速定位最適合的 AI 模型、數據集與 Spaces。
Hugging Face 宣布將熱門的 PyTorch 強化學習庫 Stable-baselines3 (SB3) 整合至 Hugging Face Hub。開發者現在可以使用簡單的 API 儲存和載入訓練好的 RL 代理人(Agents),並在社群中分享。此整合還支援在瀏覽器中直接預覽代理人的運行畫面,大幅降低了強化學習模型的分享與協作門檻。
本文介紹如何將 EleutherAI 的 GPT-J 6B 模型部署至 Amazon SageMaker。透過 Hugging Face 專為 SageMaker 設計的深度學習容器(DLC),開發者無需繁瑣設定即可完成託管。內容涵蓋環境準備、模型載入、端點建立及推論測試,適合需要在 AWS 雲端部署開源大模型的開發者。
開源機器學習互動介面庫 Gradio 宣布正式加入 Hugging Face。此次合併旨在加速機器學習的民主化,讓開發者能更輕鬆地為模型建立直觀的 Web 介面。Gradio 將保持開源與免費,並與 Hugging Face Spaces 深度整合,讓任何人都能在幾分鐘內部署並分享自己的 AI 模型 Demo。
Hugging Face 詳細公開了 CodeParrot 專案的訓練全紀錄,展示如何從零開始構建一個專門用於 Python 程式碼生成的 GPT-2 規模模型。 文章深入探討了大規模 GitHub 數據集的清洗與去重、專屬 Tokenizer 的訓練,以及使用 Accelerate 進行多 GPU 分佈式訓練的實務技巧。 此專案不僅提供了一個開源的程式碼模型,更為開發者提供了一套完整的、可複製的大型語言模型(LLM)預訓練工作流。
Hugging Face 與 Graphcore 合作推出 Optimum 整合方案,讓開發者能輕鬆在 IPU(智慧處理單元)上運行 Transformers 模型。透過專屬的 IPUTrainer,開發者只需修改極少程式碼,即可將現有的 PyTorch 訓練流程轉移至 IPU,大幅提升特定 AI 任務的運算效率。
本文探討大型語言模型(LLM)參數規模以驚人速度增長的現象,並將其與「摩爾定律」相提並論。然而,這種「越大越好」的趨勢伴隨著極高的算力成本、碳排放以及技術壟斷風險。Hugging Face 呼籲社群關注模型民主化,並透過開源合作(如 BigScience 專案)與高效能技術(如蒸餾、量化)來打破巨頭壟斷,尋求更永續的 AI 發展路徑。
本活動公告為 Hugging Face 於 2021 年 10 月舉辦的「課程發布社群活動」。該活動旨在慶祝 Hugging Face 官方 NLP 課程的推出,並透過社群黑客松、技術講座與交流,引導開發者與研究人員深入學習 Transformers、Datasets 和 Tokenizers 等開源工具,促進開源 AI 生態系的發展。
Hugging Face 介紹了如何利用超過 10 億個句子對(Sentence Pairs)的大規模數據集,訓練出高效且精準的句子嵌入模型。文中詳細說明了數據集整合、對比學習(Contrastive Learning)的訓練方法,並釋出了包含 all-MiniLM-L6-v2 在內的多款熱門開源模型。這些模型至今仍是 RAG 和語意搜尋系統中非常經典且高效的基準選擇。
本文探討如何針對遙測(衛星)影像微調 OpenAI 的 CLIP 多模態模型。由於通用 CLIP 在處理俯視、高空等特殊視角的衛星影像時表現不佳,研究團隊利用 RSICD 數據集與 JAX/Flax 框架進行微調。微調後的模型能顯著提升衛星影像的文本檢索與分類準確度,為地理資訊與遙測領域提供強大的開源工具。
Hugging Face 發表 2021 年夏季回顧,重點介紹其暑期實習生在多個前沿 AI 領域的貢獻。實習生們參與了包括 Wav2Vec2 語音模型優化、多模態模型開發、Datasets 庫擴充,以及與 Google 合作的 JAX/Flax 社群黑客松。這段期間也見證了 Hugging Face Spaces 的快速成長,為開源 AI 社群注入了強大動力。
Hugging Face 宣布推出全新開源專案 Optimum,旨在簡化 Transformer 模型在特定硬體上的優化流程。透過與 Intel、Graphcore 等硬體夥伴合作,Optimum 提供模型量化、剪枝與圖優化等工具,讓開發者能輕鬆在各式加速器上實現最大化的生產線部署效率。
Hugging Face 宣佈將熱門的工業級自然語言處理(NLP)庫 spaCy 整合至 Hugging Face Hub。開發者現在可以使用全新推出的 `spacy-huggingface-hub` 工具,輕鬆將訓練好的 spaCy 管道模型上傳至 Hub 進行版本控制與分享。此外,Hub 還為 spaCy 模型提供了專屬的互動式瀏覽器測試介面(Widget),大幅提升了模型展示與協作的便利性。
Hugging Face 宣布與 AWS 深度整合,推出專屬的 SageMaker 深度學習容器(DLC)。開發者現在可以直接利用 SageMaker Python SDK,將 Hugging Face Hub 上的數萬個預訓練模型一鍵部署至託管的 SageMaker 端點。這項合作大幅簡化了 NLP 模型的正式生產環境部署流程,並兼顧了 AWS 的安全與彈性擴展優勢。
本文介紹如何使用 EleutherAI 的開源模型 GPT-Neo,結合 Hugging Face 的 Accelerated Inference API 進行「少樣本學習(Few-shot learning)」。讀者將了解如何透過精心設計的提示詞(Prompt),讓模型在不需重新訓練或微調的情況下,僅憑幾個範例就能執行特定任務。這為開發者提供了一種快速、低成本且無需維護複雜基礎設施的 NLP 實作方案。
Gradio 2.0 迎來與 Hugging Face 的重大整合,推出全新功能讓開發者能直接載入並混合 Model Hub 中的模型。透過簡單的 Python 程式碼,即可快速建立機器學習應用的 Web 介面。這項更新不僅簡化了模型展示流程,更支援並排比較與多模型串聯,極大提升了原型開發與分享的效率。
本文為 Hugging Face 與 Intel 合作的 CPU 優化指南首篇。文章深入探討 CPU 物理核心與超線程對深度學習的影響,並詳細說明如何透過正確配置 PyTorch 的 Intra-op/Inter-op 執行緒與環境變數(如 OMP_NUM_THREADS)來避免資源競爭。最後介紹了利用 ONNX Runtime 進行算子融合,為 BERT 在 CPU 上的部署奠定高效基礎。