Hugging Face 協同 BigScience 社群正式發表 BLOOM,這是一個擁有 1760 億參數的開源多語言大模型。該模型由全球 70 多國、上千名研究人員歷時一年多共同協作完成,並在法國 Jean Zay 超級電腦上進行訓練。BLOOM 支援 46 種自然語言與 13 種程式語言,旨在打破科技巨頭壟斷,推動 AI 學術研究的民主化與開放合作。
本指南為 Hugging Face 官方實戰教學,指導開發者如何利用 Transformers 庫對 Twitter (X) 貼文進行情緒分析。內容涵蓋使用 Pipeline API 進行快速推論、選用針對社群媒體優化的 twitter-roberta-base 模型,以及如何使用自訂資料集進行模型微調,是 NLP 初學者與社群輿情分析師的必讀經典。
AI 託管平台 Replicate 宣布推出全新模型 README 模板。該模板靈感源自「Model Cards(模型卡)」概念,旨在引導開發者系統化地記錄模型的用途、輸入輸出格式、局限性與偏見。此舉將大幅提升 Replicate 平台上開源模型的透明度與易用性。
本文為 Hugging Face 深度強化學習課程的第四單元,詳細介紹了策略梯度(Policy Gradient)與 REINFORCE 演算法的理論基礎。讀者將學習如何使用 PyTorch 建立策略網路、進行動作採樣、計算損失函數並更新權重。最後,教學還包含如何將訓練好的 Agent 部署並分享至 Hugging Face Hub。
本文為 Hugging Face 針對機器學習初學者撰寫的入門指南。文章詳細介紹了從定義問題、準備數據集、選擇預訓練模型,到使用 Trainer API 進行微調,最後透過 Hugging Face Spaces 與 Gradio 部署展示的完整流程。這是一份幫助新手快速跨越 ML 門檻的實用路線圖,讓開發者能以最快速度實現從數據到 Demo 的完整閉環。
本文介紹 Hugging Face Accelerate 與 Microsoft DeepSpeed 的整合方案。開發者只需透過簡單的 CLI 設定,即可在不修改 PyTorch 程式碼的前提下,啟用 ZeRO-Stage 1/2/3 與 ZeRO-Offload 技術。這大幅降低了單機多卡或多機多卡訓練超大型模型的門檻,有效解決 GPU 記憶體不足(OOM)的痛點。
Hugging Face 宣布推出「Evaluation on the Hub」功能。用戶無需編寫任何程式碼,即可直接在瀏覽器中評估 Hub 上的模型與數據集。該功能與 AutoTrain 整合,評估結果會自動發布並連結至模型卡片,大幅提升了 AI 模型評估的便利性、透明度與可重複性。
這是一篇由 Hugging Face 官方撰寫的經典入門指南,系統性地介紹了向量嵌入(Embeddings)的核心概念。文章解釋了如何將文字、圖像等非結構化數據轉化為高維向量,並透過餘弦相似度等指標計算語意相關性。此外,也展示了如何利用 sentence-transformers 庫快速實作語意搜尋與推薦系統。
本文介紹 Hugging Face 推出的一站式硬體優化工具包 Optimum,展示如何將 Transformers 模型轉換為 ONNX 格式。透過簡單的 optimum-cli 命令行工具或 Python API,開發者即可完成轉換,並利用 ONNX Runtime 在各種硬體上實現顯著的推理加速與量化優化,解決過去手動轉換繁瑣且易出錯的痛點。
Intel 與 Hugging Face 宣布建立長期合作夥伴關係,旨在簡化 Transformer 模型在 Intel 硬體上的加速與部署。雙方合作推出了 Optimum Intel 開源庫,整合了 OpenVINO、IPEX 等優化工具,讓開發者無需繁瑣修改代碼,即可在 Intel Xeon 處理器及 Habana Gaudi 加速器上獲得極致的推理與訓練效能,大幅降低硬體加速門檻。
本文為 Hugging Face 訪談金融業機器學習主管的專題。內容深入探討金融機構如何導入 Transformer 與 NLP 技術,並分析在高度監管環境中,面臨的資料隱私、模型可解釋性(XAI)與法規合規性等核心挑戰,同時分享開源生態系如何協助金融機構避免供應商鎖定並加速 AI 創新。
本文為 Hugging Face 經典的擴散模型(Diffusion Models)深度教學,以 DDPM 為核心。透過 PyTorch 程式碼逐步實作前向加噪與反向去噪過程,並詳細拆解 U-Net 架構與損失函數。適合想從底層程式碼理解生成式 AI 影像生成原理的開發者與研究者。
本文為 Hugging Face 深度強化學習(Deep RL)課程的第三單元,專注於「深度 Q 學習(Deep Q-Learning, DQN)」。文章詳細介紹了 DQN 的核心概念(如時間差分學習、經驗回放與目標網路),並手把手教學如何使用 Stable-Baselines3 程式庫訓練一個能玩經典街機遊戲《Space Invaders》的 AI 代理人,最後將模型上傳至 Hugging Face Hub。
本文探討基於文字生成向量草圖的 CLIPDraw 工具,並介紹「可微程式設計」概念。透過在優化過程中加入筆畫數量、顏色或幾何形狀等限制,創作者能引導 AI 擺脫雜亂線條,生成更具結構性與獨特藝術風格的向量作品,為生成藝術的微調與控制提供了清晰的實踐路徑。
Hugging Face 與 Graphcore 宣布推出全新支援 IPU(Intelligence Processing Unit)的 Transformers 模型陣容。透過專屬的 optimum-graphcore 工具包,開發者可以輕鬆在 Graphcore 的硬體上部署與加速 BERT、GPT-2 等主流模型。此合作旨在降低硬體加速門檻,為開發者提供除了 GPU 之外的高效能替代方案。
Hugging Face 宣布在 Hub 上推出「Pull Requests」與「Discussions」兩大社群協作功能。使用者現在可以像使用 GitHub 一樣,直接針對平台上的 Models、Datasets 和 Spaces 提交修改建議並進行社群討論。這項更新大幅提升了開源 AI 專案的協作效率,標誌著 Hugging Face 朝向「AI 界的 GitHub」邁出關鍵一步。
微軟提出的 TAPEX(Table Pre-training via Execution)是一種創新的表格預訓練方法,現已整合至 Hugging Face。它不依賴網路爬取的真實表格,而是利用隨機生成的 SQL 查詢及其執行結果(合成數據)來訓練 Seq2Seq 模型。這種「藉由執行來學習」的方式,顯著提升了模型對表格數據的推理能力,並在 WikiSQL 和 WikiTableQuestions 等基準測試中取得領先。
本文為 Hugging Face 深度強化學習系列教程中 Q-Learning 的後半部分。內容專注於 Q-Learning 演算法的具體執行步驟,詳細解析 Epsilon-Greedy 策略如何平衡「探索與利用」,並引導讀者使用 Python 與 Gymnasium 庫在 FrozenLake 等經典環境中從零實作 Q-Table,最後將訓練好的 Agent 上傳至 Hugging Face Hub。
Hugging Face 發布針對多模態 AI 研究的倫理憲章。該憲章強調「價值敏感設計」,主張在資料治理、模型訓練、評估與釋出的每個階段皆須融入倫理考量。此舉旨在推動更具包容性、透明且負責任的開源 AI 協作生態,為全球研究人員在開發結合文字、影像與語音的多模態模型時,提供具體的道德指引與實踐框架。
醫療科技公司 Sempre Health 透過加入 Hugging Face 的專家加速計畫(EAP),加速了其機器學習技術的落地。在 Hugging Face 專家的指導下,Sempre Health 成功將先進的 Transformer 模型應用於患者簡訊互動的意圖識別,不僅縮短了模型開發與部署週期,更大幅優化了推理延遲與雲端基礎設施成本,有效提升患者的服藥遵從率。
本教程為 Hugging Face 深度強化學習課程的第一部分,深入淺出地介紹了 Q-Learning 的基本原理。內容涵蓋強化學習的核心要素(如 Agent、環境、獎勵)、馬可夫決策過程(MDP),以及如何利用 Bellman 方程式更新 Q-table。適合想要踏入強化學習與 RLHF 領域的開發者與研究人員。
本篇為 Hugging Face 專家訪談系列,訪問了致力於 AI 永續性的研究科學家 Sasha Luccioni。她分享了自己從語言學跨入 AI 的歷程,並深入探討如何量化機器學習模型的碳排放與能源消耗。她呼籲社群在追求模型效能的同時,也應重視環境成本,並積極推動負責任的 AI 開發。
Hugging Face 於 2022 年 5 月宣布推出 Fellowship 獎學金計畫,旨在支持全球的學生與研究人員投入開源機器學習項目。該計畫提供入選者導師指導、運算資源(如 GPU)以及資金資助,幫助他們在 Hugging Face 生態系中開發具影響力的 AI 工具與模型,進一步促進 AI 技術的民主化與開源社群發展。
Gradio 3.0 迎來重大更新,核心推出「Gradio Blocks」API,打破以往 Interface 只能左右對稱的版面限制。開發者現在能透過 Row、Column 與 Tab 自由設計 UI,並自訂複雜的多步驟事件觸發流程。此版本也優化了前端架構,為建立複雜的 AI 應用(如多模型比較、自訂工作流)奠定強大基礎。
本文為 Hugging Face 訪談系列,聚焦於 SaaS 領域的機器學習主管洞察。內容涵蓋 SaaS 企業如何構建 ML 團隊、如何平衡「自行開發」與「採用現成服務」,以及在處理高併發、低延遲需求時的架構選擇。受訪者強調了開源生態系在加速產品落地與降低研發成本上的關鍵作用。
Hugging Face 介紹了如何將硬體優化工具包 Optimum 與受歡迎的 Transformers Pipelines 整合。開發者現在能直接載入 ONNX 格式模型並傳入 Pipeline 中,在 CPU 或 GPU 上實現顯著的延遲降低與吞吐量提升。這項更新免去了手動導出 ONNX 的繁瑣步驟,極大地簡化了生產環境的部署流程。
Hugging Face 宣布完成 1 億美元的 C 輪融資,由 Lux Capital 領投,估值達到 20 億美元。本輪資金將用於擴大團隊,並持續建構開源與協作式的機器學習平台。Hugging Face 致力於讓 AI 技術民主化,挑戰科技巨頭的壟斷,並提供社群更豐富的模型、數據集與 Spaces 應用,鞏固其作為「AI 界 GitHub」的地位。
Hugging Face 宣布正式整合熱門深度學習庫 fastai。現在,fastai 用戶只需幾行程式碼,即可將訓練好的模型直接推送到 Hugging Face Hub 進行託管。這項合作不僅簡化了模型的分享與版本控制流程,還能讓 fastai 模型無縫對接 Hugging Face 的推理 API 與 Spaces 應用展示。
本指南為 Hugging Face 深度強化學習課程的第一章。文章系統性地介紹了強化學習(RL)的核心架構,包含 Agent 與環境的互動循環、獎勵機制,並深入探討「探索與利用」(Exploration vs. Exploitation)的權衡。最後介紹如何結合深度學習形成 Deep RL,並引導讀者使用 Stable-Baselines3 等開源工具進行實作。
Hugging Face 宣布在其 Accelerate 庫中整合 PyTorch FSDP(完全分片數據並行)技術。FSDP 透過將模型參數、梯度和優化器狀態分片到多個 GPU 上,解決了單一 GPU 記憶體不足(OOM)的問題。這項技術讓開發者與研究人員能夠以更低的硬體門檻,高效訓練和微調擁有數十億甚至數百億參數的超大型語言模型。