知名開源 OCR 工具 PaddleOCR 3.5 正式整合至 Hugging Face Transformers 生態系。開發者現在可以直接使用 PyTorch/Transformers 後端執行文字偵測、識別及表格解析等任務,無需安裝複雜的 PaddlePaddle 框架。這項更新極大地簡化了 OCR 與 RAG(檢索增強生成)等下游任務的整合流程。
Hugging Face 宣布將在即將推出的 Transformers v5 中,對核心的 Tokenization(分詞)系統進行重大重構。新版本旨在解決長期以來 Fast 與 Slow Tokenizer 行為不一致的痛點,簡化特殊 Token 與 Chat Template 的處理流程,並透過模組化設計讓開發者能更輕鬆地自定義分詞步驟,大幅提升開發體驗與模型部署的穩定性。
熱門本地推論工具 llama.cpp 推出全新的「模型管理(Model Management)」機制。此更新深化了與 Hugging Face Hub 的整合,用戶可直接透過命令列下載與快取 GGUF 模型,無需手動操作。此外,llama-server 也新增了動態載入、卸載與熱切換多個模型的能力,並優化了 LoRA 權重的動態掛載,大幅提升本地 LLM 部署的靈活性與 GPU 記憶體利用率。
Hugging Face 發表全新的輕量級開源實驗追蹤工具 Trackio。旨在解決現有 MLOps 工具過於臃腫的問題,Trackio 提供在地優先(Local-first)的架構與極簡 API,並能與 Hugging Face Hub 及 Transformers 生態系無縫整合。開發者只需幾行程式碼即可記錄參數、指標與模型權重,並能透過輕量網頁介面進行可視化,是 AI 研究者的全新輕量化選擇。
Hugging Face 宣布推出其 Model Context Protocol (MCP) 伺服器。這項工具讓支援 MCP 的 AI 客戶端(如 Claude Desktop、Cursor)能夠直接與 Hugging Face Hub 互動。使用者可以直接在對話中搜尋熱門模型、查詢資料集結構與讀取 Model Card,大幅簡化了 AI 開發者與研究人員的工作流程。
Hugging Face 針對其核心 `transformers` 函式庫進行重大架構更新,旨在標準化模型定義。過去為了易讀性而採用的「單一檔案政策」導致了嚴重的程式碼重複,難以進行全域優化。新標準化方案將引入模組化設計,統一常見組件(如 Attention、MLP),在保持可讀性的同時,大幅簡化新模型開發與硬體加速(如 Flash Attention)的整合。
Hugging Face 與 Kaggle 展開全新整合,優化數據科學家在 Kaggle 環境中調用模型的體驗。此更新簡化了身份驗證流程,讓用戶能更輕鬆地存取受限模型(如 Llama 或 Gemma),並提升了模型下載速度與工作流順暢度,讓開發者能更專注於模型微調與競賽。
Hugging Face 官方宣布重構其 `huggingface_hub` SDK 的傳輸架構。新架構從傳統的「分塊(Chunks)」改為「區塊(Blocks)」管理,支援並行傳輸、獨立區塊重試與更低的記憶體佔用。這項更新顯著提升了數 GB 甚至數百 GB 級模型(如 Safetensors)與數據集的上傳與下載速度,並增強了網路不穩定時的容錯能力。
隨著大語言模型(LLM)處理的上下文長度不斷增加,KV Cache(鍵值快取)已成為記憶體與推理速度的主要瓶頸。NVIDIA 與 Hugging Face 合作推出了開源庫 KVPress,旨在簡化各種 KV Cache 壓縮技術的實現與評估。KVPress 提供統一的 API,支援多種剪枝與壓縮策略,能有效降低長文本推理時的硬體門檻,並與 Hugging Face transformers 生態系無縫整合。
Hugging Face 宣布推出新功能,現在平台上的「組織(Organizations)」帳號也可以直接撰寫並發布部落格文章。過去此功能主要開放給個人,如今企業、研究機構與開源團隊將能以官方名義直接在平台上分享技術細節、模型發布公告與教學,進一步強化 Hugging Face 作為 AI 社群知識樞紐的地位。
Hugging Face 與開源安全掃描工具 TruffleHog 的開發商 Truffle Security 達成合作。此項合作旨在自動掃描 Hugging Face 平台上的所有儲存庫(包括模型、數據集和 Spaces),以偵測並清除不小心上傳的敏感憑證與 API 金鑰。這項主動防禦機制將大幅提升 AI 開源社群的資安防護水準,避免開發者因疏忽而造成重大損失。
Hugging Face 官方部落格盤點了 5 個被低估的「幕後英雄」工具。這些工具能解決開發者在處理 AI 模型與資料集時的痛點,包括支援多線程與斷點續傳的 huggingface-cli、免費測試 15 萬個模型的 Serverless 推論 API、免下載即可用 SQL 查詢的 Dataset Viewer、完全在瀏覽器運行的 Gradio-lite,以及兼顧安全與極速載入的 safetensors 格式。這些工具能顯著優化 AI 開發工作流。
Hugging Face 針對其最受歡迎的開源庫 Transformers 進行了官方文件的全面重新設計。為了解決因支援數千個模型、多種框架(PyTorch/TF/JAX)及多模態任務而日益混亂的結構,新版文件採用了更清晰的分類法。這項更新大幅提升了開發者查找 API、教學與概念指南的效率。
Hugging Face 與 LangChain 宣布推出全新的官方合作夥伴套件 langchain-huggingface。此套件旨在簡化開源模型與 LangChain 生態系的整合,提供更穩定、高效的連接方式。開發者現在可以透過統一的 API,輕鬆調用 Hugging Face 上的嵌入模型、本地 Pipeline 以及託管端點,大幅提升開發效率。
Google 正式推出全新開源模型家族 Gemma,包含 2B 與 7B 兩種參數大小,並提供預訓練與指令微調版本。 Gemma 採用與 Gemini 相同的技術與架構,在多項基準測試中表現優於同尺寸的 Llama 2 與 Mistral。 Hugging Face 已同步支援 Gemma,開發者可直接透過 Transformers、TGI、PEFT 等工具進行部署與微調。
Bark 是 Suno 推出基於 Transformer 的文字轉語音(TTS)與音訊生成模型。由於其包含多個子模型,推理時極耗資源。本文詳細說明如何透過 Hugging Face Transformers 整合的優化技術,包括啟用半精度(fp16)、智慧 CPU 卸載(CPU Offloading)、PyTorch 2.0 的 SDPA(縮放點積注意力)以及 `torch.compile`,在不犧牲音質的前提下,將 VRAM 佔用降低 50% 以上,並顯著提升生成速度。
本文介紹如何利用 Hugging Face Inference Endpoints 託管服務,在幾分鐘內將 Meta 的開源音樂生成模型 MusicGen 部署為生產級 API。使用者無需自行管理複雜的 GPU 基礎設施,只需選擇模型與硬體規格,即可一鍵生成專屬的 API 端點,並透過簡單的 HTTP 請求實現文字生成音樂的功能。
Hugging Face 發表全新 JavaScript 函式庫「Agents.js」(@huggingface/agents),旨在讓 Web 與 Node.js 開發者能輕鬆為大型語言模型(LLM)配置工具。透過此庫,開發者可以使用 JS/TS 建立具備推理與執行能力的 AI Agent,使其能自動選擇並調用 Hugging Face 上的各種模型(如圖像生成、翻譯、語音合成等)來完成複雜任務。
針對學術界對 Transformer 是否適用於時間序列預測的質疑,Hugging Face 撰文平反。文章重點介紹已整合至其函式庫的 Autoformer 模型,該模型透過「序列分解」與「自相關機制」克服傳統 Transformer 的效能瓶頸。這證明了只要設計得當,Transformer 在長期時間序列預測(LSTF)上依然能展現卓越的準確度。
本教學詳細介紹如何使用 Hugging Face 的 `transformers` 庫微調 OpenAI 的 Whisper 語音辨識模型。內容涵蓋從載入 Common Voice 資料集、音訊預處理(重採樣至 16kHz 並轉換為 Log-Mel 聲譜圖)、設定 Tokenizer,到使用 `Seq2SeqTrainer` 進行訓練與評估(以 WER 為指標)的完整流程。這對於想在特定低資源語言或專業領域提升語音轉文字精準度的開發者與研究人員來說,是極具價值的實戰指南。
Hugging Face 宣布推出「Evaluation on the Hub」功能。用戶無需編寫任何程式碼,即可直接在瀏覽器中評估 Hub 上的模型與數據集。該功能與 AutoTrain 整合,評估結果會自動發布並連結至模型卡片,大幅提升了 AI 模型評估的便利性、透明度與可重複性。
Hugging Face 宣布將熱門的 PyTorch 強化學習庫 Stable-baselines3 (SB3) 整合至 Hugging Face Hub。開發者現在可以使用簡單的 API 儲存和載入訓練好的 RL 代理人(Agents),並在社群中分享。此整合還支援在瀏覽器中直接預覽代理人的運行畫面,大幅降低了強化學習模型的分享與協作門檻。
Gradio 2.0 迎來與 Hugging Face 的重大整合,推出全新功能讓開發者能直接載入並混合 Model Hub 中的模型。透過簡單的 Python 程式碼,即可快速建立機器學習應用的 Web 介面。這項更新不僅簡化了模型展示流程,更支援並排比較與多模型串聯,極大提升了原型開發與分享的效率。