Hugging Face 聯合 Cubzh 與 Gigax 推出「NPC-Playground」3D 互動沙盒。該平台利用開源的大型語言模型(LLM)賦予 NPC 記憶、感知與決策能力,使其不僅能與玩家對話,還能在 3D 空間中執行撿拾、移動等實體動作。這項開源合作展示了 AI Agent 在遊戲領域的全新應用可能。
阿布達比技術創新研究所(TII)推出全新開源模型 Falcon 2 11B,包含預訓練語言模型與視覺語言模型(VLM)。該模型在超過 5 兆(5000B)Token 的高質量數據上進行訓練,支援 11 種語言。其性能在同量級模型中表現亮眼,並採用 Apache 2.0 授權,對開源社群與開發者極具吸引力。
Meta 正式推出全新一代開源大型語言模型 Llama 3,首波釋出 8B 與 70B 兩種參數版本。此版本採用 128k 詞彙量的新分詞器、支援 8K 上下文長度,並在超過 15 兆 Token 的超大資料集上進行訓練,程式碼與推理能力皆有飛躍性提升。Hugging Face 生態系已在第一時間全面整合,支援 Llama 3 的部署、微調與推論,為開源 AI 社群注入強大動力。
生醫 AI 平台 Ryght 宣布與 Hugging Face 專家支援團隊合作。面對醫療領域嚴格的 HIPAA 合規性、複雜的醫學術語與高昂的模型微調成本,Ryght 透過 Hugging Face 的技術指導,優化了開源模型的微調與推理效率。此合作成功讓 Ryght 快速推出專為臨床研究與數據分析設計的安全 AI 助理,大幅降低運算成本並縮短產品上市時間。
Hugging Face 宣布其公共政策(Public Policy)倡議,旨在橋接 AI 社群與全球政策制定者。他們強調開源 AI 對於安全性、市場競爭與創新至關重要。未來將持續參與歐盟 AI 法案、美國行政命令等政策討論,確保開源開發者的聲音被聽見,避免過度監管扼殺創新。
本指南是 Hugging Face 專為零基礎新手撰寫的 Transformers 入門教學。文章深入淺出地介紹了 Hugging Face Hub 的生態系,並透過最簡單的 pipeline API 示範如何進行情感分析、文本生成等任務。讀者無需深厚的機器學習背景,即可快速學會如何載入並運行開源 AI 模型。
Hugging Face 宣布與開源數據標註平台 Argilla 深度整合。使用者現在可以一鍵在 Hugging Face Spaces 上部署 Argilla,邀請社群成員共同進行數據標註、反饋與篩選(如 RLHF/DPO 數據)。這項合作降低了社群協作建構高品質數據集的門檻,有助於推動開源 AI 模型的對齊與優化。
Google 正式推出全新開源模型家族 Gemma,包含 2B 與 7B 兩種參數大小,並提供預訓練與指令微調版本。 Gemma 採用與 Gemini 相同的技術與架構,在多項基準測試中表現優於同尺寸的 Llama 2 與 Mistral。 Hugging Face 已同步支援 Gemma,開發者可直接透過 Transformers、TGI、PEFT 等工具進行部署與微調。
Hugging Face 與 Google 宣布建立戰略合作夥伴關係,旨在讓開發者更輕鬆地在 Google Cloud 上構建、訓練和部署 AI 模型。 此合作將 Hugging Face 的開源生態系統與 Google Cloud 的基礎設施(如 Vertex AI、GKE 和 TPU)深度整合。 開發者未來能直接在 Google Cloud 上一鍵部署 Hugging Face 上的數十萬個模型,大幅降低 AI 開發與運算門檻。
2023 年是開源大語言模型(LLM)的黃金時代。從 Meta 發布 LLaMA 奠定基礎,到 Mistral 推出高效的 MoE 模型,開源社群在模型架構、量化技術(QLoRA)與對齊方法(DPO)上取得突破。Hugging Face 的 Open LLM Leaderboard 更成為推動這波開源浪潮的核心樞紐,縮短了開源與閉源模型之間的差距。
Mistral AI 發表全新混合專家(MoE)模型 Mixtral 8x7B,總參數 46.7B 但每次 token 僅啟用 12.9B,速度極快。其在多項基準測試中超越 Llama 2 70B 及 GPT-3.5,並支援 32k 脈絡長度。Hugging Face 已於 Transformers、TGI 及推理終端全面整合,並採 Apache 2.0 開源授權。
AI 模型託管平台 Replicate 宣布完成 4,000 萬美元的 B 輪融資,由知名創投 a16z 領投。這筆資金將用於擴展其雲端基礎設施,幫助更多企業與開發者透過簡單的 API 運行、微調及部署開源 AI 模型。此融資反映出企業級市場對於開源 AI(如 Llama、Stable Diffusion)的需求正迎來爆發性成長。
Hugging Face 發布 2023 夏季倫理與社會簡報,重點介紹其團隊前往華盛頓特區向美國國會倡導開源 AI 與開放科學價值的經歷。簡報同時涵蓋了 AI 問責制、歐盟 AI 法案的政策回應,以及在模型卡片(Model Cards)、資料集透明度與環境影響評估等技術倫理工具上的最新研究進展。
隨著歐盟《AI 法案》進入立法關鍵期,Hugging Face 發表政策倡議,探討法案對開源機器學習(Open ML)的潛在衝擊。文章強調開源在提升 AI 安全性與透明度上的關鍵作用,呼籲立法者應區分商業部署與非商業研究,避免對開源開發者與託管平台施加不切實際的合規負擔,以維護歐洲的創新活力。
本指南為開發者與 AI 愛好者提供在各種平台上本地運行 Llama 2 的實用方法。內容涵蓋適合 Mac 用戶的 Ollama、跨平台的 llama.cpp、圖形介面的 LM Studio,以及能在手機上運行 Llama 2 的 MLC LLM。透過這些工具,使用者無需依賴雲端 API 即可保護隱私並降低成本。
Hugging Face 慶祝旗下核心開源庫 Diffusers 推出一週年。在過去一年中,Diffusers 憑藉直覺的 API 設計,成功降低了 Stable Diffusion 等擴散模型的技術門檻。該庫不僅支援了 ControlNet、LoRA 等多種前沿技術,還透過記憶體優化與硬體加速,讓生成式 AI 走入消費級硬體,成為開源 AI 生態系中不可或缺的基石。
Meta 推出新一代開源大語言模型 Llama 2(包含 7B、13B、70B 參數版本)後,在 AI 社群引發連鎖反應。Replicate 在第一時間託管了這些模型並提供 API 服務。本文彙整了發布後 24 小時內,包含雲端部署、API 呼叫及社群生態的最新進展,展現開源 AI 領域的驚人迭代速度。
Meta 正式發布開源大型語言模型 Llama 2,包含 7B、13B 和 70B 三種參數規模,並允許商用。Hugging Face 與 Meta 深度合作,第一時間在 Hub 上架所有 Llama 2 模型,並全面支援 Transformers、TGI、PEFT 等工具。開發者可以直接在 Hugging Face 平台上進行 Llama 2 的推論、微調(Fine-tuning)與部署,並透過 Spaces 體驗 Chat 版本。
Hugging Face 針對美國國家電信和資訊管理局(NTIA)的 AI 問責制徵求意見書提交了官方回應。HF 主張,開放科學與開源生態系對於 AI 的安全與問責至關重要,能促進外部審計與研究。他們建議推廣 Model Cards 等標準化文件,並呼籲建立因地制宜、分擔責任的監管框架,避免對開源創新造成過度限制。
Hugging Face 宣布更新其「內容指南與政策」,旨在為開源 AI 社群建立更安全、透明的環境。新政策明確禁止仇恨言論、惡意軟體、非自願性色情及旨在產生有害內容的模型。此外,官方也優化了社群檢舉流程與侵權(DMCA)處理機制,以確保平台上的模型與數據集符合安全合規標準。
Hugging Face 宣布舉辦「Open Source AI Game Jam」,邀請全球開發者在限定時間內,利用開源 AI 工具與模型(如 Hugging Face 上的各類模型)來創作遊戲。此活動旨在探索 AI 在遊戲開發(如美術生成、NPC 對話、音效等)的實際應用,並促進遊戲與 AI 社群的跨界交流。
Hugging Face 與 IBM 宣布建立合作夥伴關係,將 Hugging Face 的開源 AI 模型與工具整合至 IBM 全新的 watsonx.ai 平台。此合作旨在為企業提供安全、合規且靈活的 AI 開發環境,讓企業開發者能輕鬆運用開源社群的數千個模型,並結合 IBM 的企業級技術進行微調與部署。
Hugging Face 宣布其開發的 Safetensors 格式已成功通過專業安全公司 Trail of Bits 的審計,確認其安全性。相較於傳統具有任意程式碼執行風險的 Pickle 格式,Safetensors 不僅安全,還具備極速載入(Zero-copy)的優勢。Hugging Face 已正式將其設為平台上的預設模型儲存格式,推動開源 AI 社群邁向更安全的生態。
法國資料保護監管機構 CNIL 宣布將 Hugging Face 納入其「加強支援計劃」。該計劃旨在協助具備系統重要性的數位創新企業符合 GDPR 規範。雙方將密切合作,針對開源 AI 模型訓練、數據集隱私及開源社群的合規性,共同探索並建立具體的最佳實踐指南。
本文由 Hugging Face 撰寫,深入剖析文字生成影片(Text-to-Video)模型的底層原理,包含如何將 2D 擴散模型擴展至 3D 時間維度。文章介紹了當時主流的開源模型(如 ModelScope),並提供使用 diffusers 函式庫進行實作的程式碼範例,是理解早期開源 AI 影片生成技術的經典指南。
Hugging Face 官方宣布正式啟用中文部落格,為中文讀者提供第一手的技術文章與社群動態。此舉旨在打破語言壁壘,進一步促進開源 AI 技術在中文開發者與研究者社群中的傳播。未來將透過該平台分享更多關於模型、數據集以及開源生態的中文優質內容。
Replicate 發布了 2023 年 4 月的開源語言模型(LLM)彙整報告。文章介紹了當時快速崛起的開源模型,包括基於 LLaMA 微調的 Vicuna、首款可商用的 Dolly v2,以及 Stability AI 推出的 StableLM。讀者可以透過 Replicate 的雲端 API 輕鬆部署與測試這些模型,大幅降低了開發者使用開源大模型的門檻與硬體成本。
Hugging Face 在第三期《倫理與社會簡報》中深入探討了「倫理開放性(Ethical Openness)」的概念。他們強調開源 AI 不應是毫無限制的釋出,而需在促進科學協作與防範技術濫用之間取得平衡。文章介紹了 Hugging Face 如何透過「閘門式模型(Gated Models)」、負責任 AI 授權條款(RAIL)以及社群檢舉機制,在實踐開放科學的同時降低潛在風險。
本文彙整了 LLaMA 發布第三週時的關鍵進展。當時開源社群展現了驚人的生命力,包括 Georgi Gerganov 推出可在 Mac 本地運行的 llama.cpp,以及史丹佛大學以極低成本微調出指令遵循模型 Alpaca。這些突破降低了大型語言模型的運行門檻,奠定了今日開源 AI 生態系蓬勃發展的基礎。
Hugging Face 針對旗下熱門的 Diffusers 函式庫發布倫理指南,探討開源生成式圖像模型帶來的社會影響。指南重點涵蓋偏見緩解、安全過濾器(如 NSFW 偵測)、隱形浮水印技術,以及推動負責任的授權條款(如 OpenRAIL)。此舉旨在為開源社群提供一個在促進技術創新與防範惡意濫用之間取得平衡的實踐框架。