Hugging Face 發表全新命令列工具 `hf`,旨在全面升級並替代現有的 `huggingface-cli`。這款新工具採用了更直覺、簡潔的指令設計,並大幅優化了模型與資料集的下載與上傳效能。此外,它還提供了更美觀且流暢的終端機進度條與互動式介面,讓開發者在管理 Hugging Face Hub 資源時更加得心應手,是 AI 開發者不可或缺的全新利器。
Hugging Face 宣布將其平台(Hub)的底層大檔案版本控制系統從 Git LFS 遷移至 Xet 技術。Git LFS 在面對數百 GB 的模型與超大數據集時常遇到效能瓶頸,而 Xet 透過「內容定義分塊(CDC)」技術實現區塊級去重,能顯著減少儲存空間並加速上傳與下載。此遷移將為開發者帶來更流暢的超大型 AI 資產管理體驗。
Hugging Face 宣佈在 Hub 上整合「Inference Providers」功能。開發者現在可以直接在模型頁面或透過 SDK,自由選擇 Groq、Together AI、Fireworks AI 等第三方推理服務商來運行開源模型。這項更新簡化了 API 調用流程,讓用戶能根據速度、成本與延遲,彈性切換最適合的後端算力,無需自行維護基礎設施。
Hugging Face 宣布在 Hub 上推出「儲存區域(Storage Regions)」功能。此功能允許組織與企業用戶指定其模型、數據集和 Spaces 的物理儲存位置(例如歐洲或美國)。這對於有嚴格數據主權、隱私合規(如歐盟 GDPR)要求的企業來說是一大重要更新,同時也能優化在地化存取的延遲。
Hugging Face 宣布與微軟 ONNX Runtime 深度整合,Hub 上超過 13 萬個模型現在能輕鬆轉換並加速。開發者只需透過 Hugging Face Optimum 庫,即可在 CPU 和 GPU 上實現顯著的推理延遲降低與吞吐量提升。此舉大幅降低了開源模型在生產環境中的部署門檻與硬體成本。
Hugging Face 官方宣布,為了提升平台安全性,將逐步棄用傳統的 Git 密碼驗證方式。未來用戶在進行 Git 操作(如 clone 或 push)時,必須改用個人存取權杖(PAT)或 SSH 金鑰。此項變更將影響所有託管在 Hugging Face 上的模型、數據集和 Space 倉庫,開發者需盡快更新自動化腳本。
Hugging Face 發表「Huggy Lingo」專案,旨在解決 Hub 上許多模型和數據集缺乏或標記錯誤語言元數據(Metadata)的問題。該系統利用機器學習(如語言識別模型)分析 README 內容與數據集樣本,自動預測並補全正確的語言標籤(如 ISO 639 代碼)。這項改進將大幅提升全球開發者在 Hub 上搜尋、篩選特定語言資源的效率,特別是針對低資源語言的發掘。
Hugging Face 官方宣佈與百度的開源深度學習平台 PaddlePaddle(飛槳)達成合作,正式將其引入 Hugging Face Hub 生態系。開發者現在可以直接在 Hub 上分享、探索和下載 PaddlePaddle 的模型。這項整合進一步擴大了 Hugging Face 的多框架支援版圖,為全球開發者提供更豐富的開源模型選擇,特別是在中文 NLP 和 OCR 等 PaddlePaddle 強勢的領域。
Hugging Face 在世界地球日宣布於 Hugging Face Hub 推出新功能,旨在追蹤並公開 AI 模型的碳排放量。開發者現在可以在模型卡片(Model Cards)的元數據中加入 co2_eq_emissions 欄位,直接展示模型訓練所產生的二氧化碳當量。此舉旨在提升 AI 社群對環境影響的意識,並倡導更具永續性的「綠色 AI」開發實踐。
Hugging Face 宣布與熱門的 Sentence Transformers 庫深度整合。開發者現在可以直接在 Hub 上託管、分享和發現語義嵌入模型。Hub 同時新增了專屬的互動式小工具,讓使用者能在瀏覽器中直接測試句子相似度,並提供自動生成的程式碼範例,大幅簡化了 NLP 嵌入模型的應用流程。