本文由 Hugging Face 撰寫,深入剖析文字生成影片(Text-to-Video)模型的底層原理,包含如何將 2D 擴散模型擴展至 3D 時間維度。文章介紹了當時主流的開源模型(如 ModelScope),並提供使用 diffusers 函式庫進行實作的程式碼範例,是理解早期開源 AI 影片生成技術的經典指南。
Hugging Face 推出官方 Unity API 套件,讓遊戲開發者能直接在 Unity 專案中調用 Hugging Face Hub 上的數千個 AI 模型。本文詳細介紹如何透過 Unity Package Manager 進行安裝,並展示如何設定 API 金鑰以啟用文本生成、語音識別及圖像生成等功能。這為獨立遊戲開發者開闢了將生成式 AI 融入遊戲機制的新途徑。
Hugging Face 官方宣布正式啟用中文部落格,為中文讀者提供第一手的技術文章與社群動態。此舉旨在打破語言壁壘,進一步促進開源 AI 技術在中文開發者與研究者社群中的傳播。未來將透過該平台分享更多關於模型、數據集以及開源生態的中文優質內容。
Replicate 發布了 2023 年 4 月的開源語言模型(LLM)彙整報告。文章介紹了當時快速崛起的開源模型,包括基於 LLaMA 微調的 Vicuna、首款可商用的 Dolly v2,以及 Stability AI 推出的 StableLM。讀者可以透過 Replicate 的雲端 API 輕鬆部署與測試這些模型,大幅降低了開發者使用開源大模型的門檻與硬體成本。
Owkin 開源的聯邦學習框架 Substra 已託管於 LF AI & Data 基金會。該框架允許開發者在分散且不公開的數據集上協同訓練 AI 模型,特別適合醫療等高隱私需求領域。本文介紹如何結合 Substra 與 Hugging Face 生態系,實現可追溯、安全且合規的隱私保護機器學習。
本指南是 Hugging Face 介紹如何使用 TRL(Transformer Reinforcement Learning)與 PEFT(LoRA)技術,對 LLaMA 模型進行人類回饋強化學習(RLHF)的經典實戰教學。文章以 Stack Exchange 數據集為例,詳細拆解了監督式微調(SFT)、獎勵模型(RM)訓練,以及近端策略最佳化(PPO)三大核心步驟,展示了如何在有限的硬體資源下完成大語言模型的對齊(Alignment)訓練。
Hugging Face 在第三期《倫理與社會簡報》中深入探討了「倫理開放性(Ethical Openness)」的概念。他們強調開源 AI 不應是毫無限制的釋出,而需在促進科學協作與防範技術濫用之間取得平衡。文章介紹了 Hugging Face 如何透過「閘門式模型(Gated Models)」、負責任 AI 授權條款(RAIL)以及社群檢舉機制,在實踐開放科學的同時降低潛在風險。
本文介紹了 2023 年開源 AI 圈的重要里程碑技術——Alpaca-LoRA。透過低秩適應(LoRA)技術,開發者可以在消費級硬體或 Replicate 雲端平台上,以極低的算力與時間成本微調 LLaMA-7B 模型。藉由 Stanford Alpaca 的 52,000 筆指令數據,即可讓開源模型獲得類似 ChatGPT 的對話與指令遵循能力,大幅降低了客製化大語言模型的門檻。
Hugging Face 宣布與 Jupyter 生態系深度整合,推出全新的 Notebooks Hub。用戶現在可以直接在 Hugging Face 上瀏覽、搜尋與託管 Jupyter Notebooks。此外,平台提供一鍵啟動功能,讓開發者能直接將 Notebook 導入 Google Colab、Kaggle 或 Paperspace 等雲端環境,大幅降低了運行與測試開源 AI 模型的門檻。
本文彙整了 LLaMA 發布第三週時的關鍵進展。當時開源社群展現了驚人的生命力,包括 Georgi Gerganov 推出可在 Mac 本地運行的 llama.cpp,以及史丹佛大學以極低成本微調出指令遵循模型 Alpaca。這些突破降低了大型語言模型的運行門檻,奠定了今日開源 AI 生態系蓬勃發展的基礎。
本文介紹如何使用 Replicate 微調 LLaMA 模型,使其模仿《辛普森家庭》中荷馬·辛普森的說話風格。作者展示了如何篩選劇本數據、將其格式化,並在短短一小時內完成訓練。這項技術證明了即使在數據與預算有限的情況下,開發者也能輕鬆為開源模型注入獨特的個性。
Stanford Alpaca 是基於 Meta LLaMA-7B 微調而成的指令遵循模型,具備類似 ChatGPT 的對話能力。 Replicate 發表指南,詳細說明如何使用開源工具 Cog 將 Alpaca 打包,並在本地機器或 Replicate 雲端平台上運行。 此教學還涵蓋了如何利用自訂資料集對 LLaMA 進行微調,大幅降低了開發者構建專屬開源 LLM 的門檻。
韓國科技巨頭 Kakao 旗下的 AI 研究部門 Kakao Brain,在 Hugging Face 上釋出了全新的 ViT 與 ALIGN 模型。這些模型基於其先前開源的 COYO-700M 超大規模圖文對數據集進行訓練。本次開源不僅補足了 ALIGN 模型缺乏開源權重的遺憾,也為多模態表徵、圖像檢索與零樣本分類等任務提供了強大的新選擇。
Hugging Face 針對旗下熱門的 Diffusers 函式庫發布倫理指南,探討開源生成式圖像模型帶來的社會影響。指南重點涵蓋偏見緩解、安全過濾器(如 NSFW 偵測)、隱形浮水印技術,以及推動負責任的授權條款(如 OpenRAIL)。此舉旨在為開源社群提供一個在促進技術創新與防範惡意濫用之間取得平衡的實踐框架。
Hugging Face 與 AWS 宣布建立戰略合作夥伴關係,AWS 成為其首選雲端供應商。雙方將深度整合,讓開發者能透過 Amazon SageMaker 輕鬆訓練與部署 Hugging Face 上的超大型 AI 模型。此外,合作也將優化 AWS 自研晶片(Trainium 與 Inferentia)對開源模型的支援,大幅降低企業導入生成式 AI 的成本與門檻。
Hugging Face 宣布推出 PEFT(Parameter-Efficient Fine-Tuning)開源庫,旨在解決微調大模型時高昂的算力與儲存成本。PEFT 整合了 LoRA、Prefix Tuning、P-Tuning 等主流技術,僅需微調極少量的額外參數即可達到與全量微調相當的效果。這使得開發者能在消費級硬體(如單張 24GB 顯示卡)上微調數十億甚至百億參數的模型,並大幅縮小模型權重檔案體積。
Hugging Face 詳細介紹了「Model Cards(模型卡)」的概念與實作方法。作為模型倉庫的 README.md,Model Cards 不僅記錄了模型的預期用途、限制、訓練數據與評估結果,還透過 YAML 元數據實現結構化搜尋。這項工具旨在推動開源 AI 社群的透明度與可解釋性,是實踐負責任 AI(Responsible AI)不可或缺的基礎文檔。
本文為 Hugging Face 官方發布的推理(Inference)解決方案指南,系統性介紹了四大核心方案:免費且即開即用的 Serverless Inference API、適合生產環境且安全可控的 Inference Endpoints、用於展示與應用的 Spaces,以及與 AWS/Azure 合作的雲端整合方案。旨在幫助開發者根據預算、延遲與隱私需求,選擇最適合的開源模型部署路徑。
Hugging Face 發表第一期《倫理與社會電子報》,正式介紹其倫理與社會研究團隊的願景。內容涵蓋 BigScience 專案的倫理憲章、推動限制惡意使用的「負責任 AI 授權條款(RAIL)」,以及資料集偏見評估工具。此舉旨在倡導開源社群在追求技術進步的同時,兼顧社會責任與倫理規範。
Hugging Face 介紹了 OpenRAIL(開放負責任 AI 授權)框架,旨在解決傳統開源授權無法約束 AI 濫用的問題。該框架允許用戶自由下載、修改和商業化 AI 模型,但同時在授權條款中加入「使用限制條款」,禁止將 AI 用於惡意用途(如生成深偽造、違法行為等)。這項舉措在促進技術共享與防範 AI 風險之間取得了平衡,成為 Stable Diffusion 等知名模型所採用的授權基礎。
Hugging Face 闡述了其對 TensorFlow (TF) 的核心哲學:將 TF 視為一等公民,確保與 PyTorch 模型的雙向互操作性。透過將 TF 模型設計為 `tf.keras.Model` 的子類別,開發者能直接使用 Keras 的 `fit()` 等 API,並支援 XLA 編譯與 `tf.data`,為 TF 社群提供無縫且直覺的開發體驗。
Hugging Face 針對美國「國家 AI 研究資源(NAIRR)」中期報告提交官方反饋。其核心訴求包括:大力支持開源 AI 與開放科學、推動運算與數據資源的民主化分配以扶植中小型研究機構,以及建立完善的模型與數據集文件規範(如 Model Cards)。此舉旨在確保國家級 AI 資源能真正惠及大眾,而非僅由少數科技巨頭壟斷。
AI 託管平台 Replicate 宣布推出全新模型 README 模板。該模板靈感源自「Model Cards(模型卡)」概念,旨在引導開發者系統化地記錄模型的用途、輸入輸出格式、局限性與偏見。此舉將大幅提升 Replicate 平台上開源模型的透明度與易用性。
本文為 Hugging Face 訪談金融業機器學習主管的專題。內容深入探討金融機構如何導入 Transformer 與 NLP 技術,並分析在高度監管環境中,面臨的資料隱私、模型可解釋性(XAI)與法規合規性等核心挑戰,同時分享開源生態系如何協助金融機構避免供應商鎖定並加速 AI 創新。
Hugging Face 宣布在 Hub 上推出「Pull Requests」與「Discussions」兩大社群協作功能。使用者現在可以像使用 GitHub 一樣,直接針對平台上的 Models、Datasets 和 Spaces 提交修改建議並進行社群討論。這項更新大幅提升了開源 AI 專案的協作效率,標誌著 Hugging Face 朝向「AI 界的 GitHub」邁出關鍵一步。
Hugging Face 發布針對多模態 AI 研究的倫理憲章。該憲章強調「價值敏感設計」,主張在資料治理、模型訓練、評估與釋出的每個階段皆須融入倫理考量。此舉旨在推動更具包容性、透明且負責任的開源 AI 協作生態,為全球研究人員在開發結合文字、影像與語音的多模態模型時,提供具體的道德指引與實踐框架。
Hugging Face 於 2022 年 5 月宣布推出 Fellowship 獎學金計畫,旨在支持全球的學生與研究人員投入開源機器學習項目。該計畫提供入選者導師指導、運算資源(如 GPU)以及資金資助,幫助他們在 Hugging Face 生態系中開發具影響力的 AI 工具與模型,進一步促進 AI 技術的民主化與開源社群發展。
本文為 Hugging Face 訪談系列,聚焦於 SaaS 領域的機器學習主管洞察。內容涵蓋 SaaS 企業如何構建 ML 團隊、如何平衡「自行開發」與「採用現成服務」,以及在處理高併發、低延遲需求時的架構選擇。受訪者強調了開源生態系在加速產品落地與降低研發成本上的關鍵作用。
Hugging Face 宣布完成 1 億美元的 C 輪融資,由 Lux Capital 領投,估值達到 20 億美元。本輪資金將用於擴大團隊,並持續建構開源與協作式的機器學習平台。Hugging Face 致力於讓 AI 技術民主化,挑戰科技巨頭的壟斷,並提供社群更豐富的模型、數據集與 Spaces 應用,鞏固其作為「AI 界 GitHub」的地位。
本報告源自 Hugging Face 針對多位企業機器學習主管(Director of ML)的調查與訪談。內容指出,將模型從實驗室原型轉化為穩定生產服務(Deployment Gap)仍是企業最大痛點。主管們強調了 MLOps 工具鏈整合、開源模型在企業級應用的崛起,以及跨團隊(數據科學與軟體工程)協作與人才招募的持續挑戰。