Hugging Face 詳細公開了 1760 億參數開源模型 BLOOM 的訓練技術細節。該模型在法國 Jean Zay 超級電腦上,利用 384 張 NVIDIA A100 80GB GPU 進行了為期 117 天的訓練。核心技術採用 Megatron-DeepSpeed 框架,結合了張量並行、流水線並行與數據並行的「3D 並行」方案,並透過 BF16 精度解決了大規模訓練中的數值不穩定問題。
本文探討如何使用 Sentence Transformers 建立一個智慧歌單生成器。透過將歌曲描述、風格或歌詞轉化為向量嵌入(Embeddings),並利用餘弦相似度比對使用者的文字輸入,系統能精準推薦符合當下心情或情境的音樂。這展示了語意搜尋與向量嵌入技術在現代推薦系統中的實際應用。
Hugging Face 協同 BigScience 社群正式發表 BLOOM,這是一個擁有 1760 億參數的開源多語言大模型。該模型由全球 70 多國、上千名研究人員歷時一年多共同協作完成,並在法國 Jean Zay 超級電腦上進行訓練。BLOOM 支援 46 種自然語言與 13 種程式語言,旨在打破科技巨頭壟斷,推動 AI 學術研究的民主化與開放合作。
本文為 Hugging Face 針對機器學習初學者撰寫的入門指南。文章詳細介紹了從定義問題、準備數據集、選擇預訓練模型,到使用 Trainer API 進行微調,最後透過 Hugging Face Spaces 與 Gradio 部署展示的完整流程。這是一份幫助新手快速跨越 ML 門檻的實用路線圖,讓開發者能以最快速度實現從數據到 Demo 的完整閉環。
Hugging Face 宣布推出「Evaluation on the Hub」功能。用戶無需編寫任何程式碼,即可直接在瀏覽器中評估 Hub 上的模型與數據集。該功能與 AutoTrain 整合,評估結果會自動發布並連結至模型卡片,大幅提升了 AI 模型評估的便利性、透明度與可重複性。
本文介紹 Hugging Face Accelerate 與 Microsoft DeepSpeed 的整合方案。開發者只需透過簡單的 CLI 設定,即可在不修改 PyTorch 程式碼的前提下,啟用 ZeRO-Stage 1/2/3 與 ZeRO-Offload 技術。這大幅降低了單機多卡或多機多卡訓練超大型模型的門檻,有效解決 GPU 記憶體不足(OOM)的痛點。
這是一篇由 Hugging Face 官方撰寫的經典入門指南,系統性地介紹了向量嵌入(Embeddings)的核心概念。文章解釋了如何將文字、圖像等非結構化數據轉化為高維向量,並透過餘弦相似度等指標計算語意相關性。此外,也展示了如何利用 sentence-transformers 庫快速實作語意搜尋與推薦系統。
本文介紹 Hugging Face 推出的一站式硬體優化工具包 Optimum,展示如何將 Transformers 模型轉換為 ONNX 格式。透過簡單的 optimum-cli 命令行工具或 Python API,開發者即可完成轉換,並利用 ONNX Runtime 在各種硬體上實現顯著的推理加速與量化優化,解決過去手動轉換繁瑣且易出錯的痛點。
Intel 與 Hugging Face 宣布建立長期合作夥伴關係,旨在簡化 Transformer 模型在 Intel 硬體上的加速與部署。雙方合作推出了 Optimum Intel 開源庫,整合了 OpenVINO、IPEX 等優化工具,讓開發者無需繁瑣修改代碼,即可在 Intel Xeon 處理器及 Habana Gaudi 加速器上獲得極致的推理與訓練效能,大幅降低硬體加速門檻。
本文為 Hugging Face 訪談金融業機器學習主管的專題。內容深入探討金融機構如何導入 Transformer 與 NLP 技術,並分析在高度監管環境中,面臨的資料隱私、模型可解釋性(XAI)與法規合規性等核心挑戰,同時分享開源生態系如何協助金融機構避免供應商鎖定並加速 AI 創新。
本文為 Hugging Face 經典的擴散模型(Diffusion Models)深度教學,以 DDPM 為核心。透過 PyTorch 程式碼逐步實作前向加噪與反向去噪過程,並詳細拆解 U-Net 架構與損失函數。適合想從底層程式碼理解生成式 AI 影像生成原理的開發者與研究者。
微軟提出的 TAPEX(Table Pre-training via Execution)是一種創新的表格預訓練方法,現已整合至 Hugging Face。它不依賴網路爬取的真實表格,而是利用隨機生成的 SQL 查詢及其執行結果(合成數據)來訓練 Seq2Seq 模型。這種「藉由執行來學習」的方式,顯著提升了模型對表格數據的推理能力,並在 WikiSQL 和 WikiTableQuestions 等基準測試中取得領先。
醫療科技公司 Sempre Health 透過加入 Hugging Face 的專家加速計畫(EAP),加速了其機器學習技術的落地。在 Hugging Face 專家的指導下,Sempre Health 成功將先進的 Transformer 模型應用於患者簡訊互動的意圖識別,不僅縮短了模型開發與部署週期,更大幅優化了推理延遲與雲端基礎設施成本,有效提升患者的服藥遵從率。
Hugging Face 於 2022 年 5 月宣布推出 Fellowship 獎學金計畫,旨在支持全球的學生與研究人員投入開源機器學習項目。該計畫提供入選者導師指導、運算資源(如 GPU)以及資金資助,幫助他們在 Hugging Face 生態系中開發具影響力的 AI 工具與模型,進一步促進 AI 技術的民主化與開源社群發展。
本篇為 Hugging Face 專家訪談系列,訪問了致力於 AI 永續性的研究科學家 Sasha Luccioni。她分享了自己從語言學跨入 AI 的歷程,並深入探討如何量化機器學習模型的碳排放與能源消耗。她呼籲社群在追求模型效能的同時,也應重視環境成本,並積極推動負責任的 AI 開發。
本文為 Hugging Face 訪談系列,聚焦於 SaaS 領域的機器學習主管洞察。內容涵蓋 SaaS 企業如何構建 ML 團隊、如何平衡「自行開發」與「採用現成服務」,以及在處理高併發、低延遲需求時的架構選擇。受訪者強調了開源生態系在加速產品落地與降低研發成本上的關鍵作用。
Hugging Face 介紹了如何將硬體優化工具包 Optimum 與受歡迎的 Transformers Pipelines 整合。開發者現在能直接載入 ONNX 格式模型並傳入 Pipeline 中,在 CPU 或 GPU 上實現顯著的延遲降低與吞吐量提升。這項更新免去了手動導出 ONNX 的繁瑣步驟,極大地簡化了生產環境的部署流程。
Hugging Face 宣布完成 1 億美元的 C 輪融資,由 Lux Capital 領投,估值達到 20 億美元。本輪資金將用於擴大團隊,並持續建構開源與協作式的機器學習平台。Hugging Face 致力於讓 AI 技術民主化,挑戰科技巨頭的壟斷,並提供社群更豐富的模型、數據集與 Spaces 應用,鞏固其作為「AI 界 GitHub」的地位。
本指南為 Hugging Face 深度強化學習課程的第一章。文章系統性地介紹了強化學習(RL)的核心架構,包含 Agent 與環境的互動循環、獎勵機制,並深入探討「探索與利用」(Exploration vs. Exploitation)的權衡。最後介紹如何結合深度學習形成 Deep RL,並引導讀者使用 Stable-Baselines3 等開源工具進行實作。
Hugging Face 宣布在其 Accelerate 庫中整合 PyTorch FSDP(完全分片數據並行)技術。FSDP 透過將模型參數、梯度和優化器狀態分片到多個 GPU 上,解決了單一 GPU 記憶體不足(OOM)的問題。這項技術讓開發者與研究人員能夠以更低的硬體門檻,高效訓練和微調擁有數十億甚至數百億參數的超大型語言模型。
本教學介紹了一套無程式碼/低程式碼的 NLP 工作流。首先利用 Kili Technology 平台進行高效的文本數據標註與品質管理,接著將標註好的輿情數據集導入 Hugging Face AutoTrain。AutoTrain 會自動嘗試多種開源模型架構並進行微調,讓開發者在無需編寫複雜深度學習程式碼的情況下,快速構建出高精度的輿情與觀點分類模型。
本報告源自 Hugging Face 針對多位企業機器學習主管(Director of ML)的調查與訪談。內容指出,將模型從實驗室原型轉化為穩定生產服務(Deployment Gap)仍是企業最大痛點。主管們強調了 MLOps 工具鏈整合、開源模型在企業級應用的崛起,以及跨團隊(數據科學與軟體工程)協作與人才招募的持續挑戰。
Hugging Face 與 Intel Habana Labs 合作推出 optimum-habana 庫。開發者只需將標準的 Trainer 替換為 GaudiTrainer,即可在 AWS DL1 等 Gaudi 實例上進行高效能、低成本的 Transformer 模型訓練。這為 NVIDIA 之外的 AI 晶片生態系提供了一個強大的替代方案,能有效降低高達 40% 的訓練成本。
Hugging Face 宣布推出「Hugging Face for Education」計劃,旨在為全球教師與學生提供免費的機器學習教學資源。該計劃允許教師在 Hugging Face Hub 上建立專屬的班級組織,方便學生協作與提交專案。此外,學生還能利用 Spaces 與 Gradio 輕鬆建立並展示互動式 AI 應用,讓學術界能更無縫地接軌前沿 AI 技術。
Hugging Face 在世界地球日宣布於 Hugging Face Hub 推出新功能,旨在追蹤並公開 AI 模型的碳排放量。開發者現在可以在模型卡片(Model Cards)的元數據中加入 co2_eq_emissions 欄位,直接展示模型訓練所產生的二氧化碳當量。此舉旨在提升 AI 社群對環境影響的意識,並倡導更具永續性的「綠色 AI」開發實踐。
本文為 Hugging Face「機器學習專家」系列訪談,主角為《Natural Language Processing with Transformers》共同作者 Lewis Tunstall。他分享了自己如何從理論物理學博士轉型為 AI 專家,並深入探討了撰寫該本暢銷書的挑戰、在 Hugging Face 推動開源生態系的經驗,以及他對未來 NLP 技術發展與新手學習路徑的實用建議。
本篇專訪介紹了 Hugging Face 首席倫理科學家 Margaret Mitchell 的學術背景與願景。作為「模型卡(Model Cards)」的共同倡議者,她分享了從 Google 到 Hugging Face 的心路歷程。她強調在開源社群中建立 AI 倫理工具的重要性,並探討如何透過透明度與多樣性來減少機器學習模型中的偏見與危害。
Hugging Face 宣布啟動「AI 研究駐點計畫」,旨在打破傳統學術界限,邀請不同背景的研究員與工程師加入團隊。參與者將獲得豐富的算力資源、資深研究員的導師指導,並有機會發表學術論文。此計畫強調開源精神與遠端協作,致力於推動 AI 技術的民主化。
Hugging Face 介紹了如何使用其 datasets 庫來實現圖像搜尋系統。透過整合預訓練的視覺模型(如 CLIP)來提取圖像的特徵向量(embeddings),並利用內建的 FAISS 索引功能,開發者可以輕鬆對大規模圖像數據集進行高效的相似度檢索。這為以圖搜圖、多模態檢索等應用提供了極為簡便的實作路徑。
本文介紹 Hugging Face Transformers 支援的「受約束的束搜索(Constrained Beam Search)」技術。傳統束搜索僅依賴機率,而此技術允許開發者指定必須出現在生成結果中的特定詞彙或短語。這在機器翻譯、摘要生成及特定領域的文本生成中非常實用,能有效控制輸出品質並確保關鍵資訊不遺漏。