Google DeepMind 宣布推出一款基於 Gemma 開源模型家族、擁有 270 億參數的全新單細胞分析基礎模型。該模型專為生物醫學研究設計,能深入分析單細胞數據,並已成功協助研究人員發現了一條全新的潛在癌症治療途徑,展現了開源大模型在生醫領域的巨大潛力。
Hugging Face 介紹了 RiskRubric.ai 平台,旨在將 AI 安全評估民主化。該平台提供標準化的風險評估量表(Rubrics),幫助開發者與研究人員量化評估 AI 模型在偏見、毒性及隱私等維度的風險。透過開源與社群驅動的方式,它降低了中小型團隊進行 AI 安全測試與紅隊演練的門檻,並能與 Hugging Face 生態系無縫整合。
Hugging Face 官方宣布迎來 OpenAI 的全新開源模型家族「GPT OSS」。這項合作打破了 OpenAI 長期以來以閉源為主的策略,將其強大的 GPT 技術以開源形式提供給全球開發者。社群現在可以直接在 Hugging Face 上下載、微調並部署這些模型,預計將對開源 AI 生態系產生深遠的影響。
NVIDIA 在 Hugging Face 部落格分享了其開源且可移植的深度研究 Agent 成果。透過在 DeepResearch Bench 基準測試上評估開源的 Llama Nemotron 模型,該系統展現出極佳的研究與推理能力。此研究證明了開源模型在複雜、多步驟的研究任務中,已具備與閉源頂尖模型競爭的實力,為開發者提供了一個強大且可本地部署的 Deep Research 解決方案。
Replicate 宣布上線全新開源影片生成模型 Wan 2.2。該模型被定位為目前平台上速度最快且成本最低的影片生成選擇,標誌著開源影片生成技術(Open Source Video)的重大進展。這項更新將大幅降低開發者與創作者生成高品質影片的門檻與運算成本。
Microsoft 與 Hugging Face 宣布深化合作,將 Hugging Face 的開源模型庫與 Azure AI Foundry(前身為 Azure AI Studio)進行深度整合。開發者現在可以直接在 Azure 安全且具備合規性的企業級環境中,輕鬆搜尋、部署與微調數十萬個 Hugging Face 的開源模型,大幅簡化企業導入開源 AI 的工作流程。
Vercel 官方正式公布了 2025 年春季開源計畫(Open Source Program)的入選名單。該計畫旨在扶持推動 Web 開發、前端生態及 AI 應用的關鍵開源專案。入選專案將獲得 Vercel 提供的免費企業級託管服務、基礎設施支援以及社群推廣資源,幫助開發者專注於技術創新與社群建設。
Hugging Face 發布 2025 年視覺語言模型(VLM)趨勢報告。文章深入探討 VLM 在「更強(推理與 OCR)」、「更快(輕量化與推論優化)」與「更實用(多模態 Agent)」三大維度的演進。推薦了 Qwen2.5-VL、Llama-3.2-Vision 等主流開源模型,並介紹如何利用 Hugging Face 生態系進行高效部署與微調。
Hugging Face 旗下的開源機器人專案 LeRobot 致力於解決機器人領域缺乏標準化、大規模資料集的問題。本文探討如何透過社群協作,建立類似於電腦視覺界「ImageNet」的機器人資料集。文章介紹了 LeRobot 的資料格式標準、社群貢獻機制,以及如何克服硬體多樣性帶來的數據整合挑戰。
OpenAI 正式發表新一代推理模型 o3 與 o4-mini,強調透過 10 倍強化學習(RL)算力提升推理效率。o4-mini 不僅價格更便宜,在多項指標、視覺與工具調用能力上皆有顯著進步。此外,OpenAI 還驚喜推出了完全開源的終端機 AI 工具 Codex CLI,直接對標 Anthropic 的 Claude Code。
Hugging Face 與 AI 安全公司 Protect AI 合作滿六個月,宣布已完成平台上 400 萬個開源模型的安全掃描。此項合作旨在解決開源模型(特別是含有 pickle 反序列化風險的舊格式)中潛在的惡意代碼與安全漏洞。透過自動化安全掃描與漏洞標記,雙方共同為全球開發者建構更安全、更值得信賴的 AI 供應鏈生態。
Sam Altman 宣傳了 ChatGPT 的「記憶(Memory)」功能更新,同時市場傳出 o3、o4-mini 即將推出,以及 GPT-4o 將升級為 GPT-4.1 的洩露消息。 xAI 正式推出 Grok 3 與 Grok 3 mini 的 API,Epoch AI 曾短暫證實其具備 o1 等級的推理能力。 社群方面,Qwen3 宣布延期推出,而 AI Engineer World's Fair 2025 也正展開熱烈徵稿。
Meta 正式於 Hugging Face 平台上架了備受矚目的 Llama 4 家族首批模型:Maverick 與 Scout。這標誌著開源大語言模型正式邁入 Llama 4 時代。雖然詳細技術細節仍待官方完整白皮書披露,但從命名來看,Scout 預期為輕量、高效率的「偵察型」模型,適合邊緣運算與 Agent 任務;而 Maverick 則可能是主打強大推理與複雜任務處理的「王牌」模型。這兩款模型的釋出將為開源社群注入全新動力。
Hugging Face 發表文章慶祝旗下開源機器學習網頁介面庫 Gradio 的使用者正式突破 100 萬人。文章回顧了 Gradio 自創立以來的成長軌跡,如何透過極簡的 Python 程式碼讓開發者快速部署 AI 互動 Demo,並探討其在 Hugging Face 生態系中扮演的關鍵角色與未來展望。
Hugging Face 針對美國白宮的 AI 行動計畫徵求意見稿(RFI)提交了官方回應。其核心訴求圍繞在保護與推廣「開源 AI」與「開放科學」。Hugging Face 強調,開放源碼不僅能加速技術創新、防止科技巨頭壟斷,更能透過社群的集體審查提升 AI 的安全性與透明度,呼籲政府在制定政策時應避免扼殺開源生態。
Cohere For AI 發表全新開源多語言多模態模型「Aya Vision」(提供 8B 與 32B 版本)。該模型旨在解決現有視覺語言模型(VLM)嚴重偏向英語的問題,大幅提升了對全球多種語言(特別是低資源語言)的圖像理解與文字生成能力。在多項多語言多模態基準測試中,Aya Vision 展現出超越同量級開源模型的優異性能,並已於 Hugging Face 平台上開源。
Hugging Face 與軟體供應鏈安全領導廠商 JFrog 展開戰略合作。雙方將整合 Hugging Face 的開源模型生態系與 JFrog 的安全平台,讓企業在引進 AI 模型時能進行自動化漏洞掃描與惡意代碼檢測。此舉旨在解決 AI 供應鏈中的安全隱憂,讓 AI 開發流程更加透明且符合企業合規要求。
Hugging Face 宣布與印度頂尖研究機構印度科學理工學院(IISc)展開合作。雙方將結合 IISc 的學術研究實力與 Hugging Face 的開源生態系,致力於解決印度多元語言(包含多種低資源語言)的 AI 模型開發挑戰。此舉旨在為印度本土語言建立更完善的開源數據集與語言模型,促進在地化的 AI 技術普及。
Hugging Face 發表 Open-R1 專案的第一階段更新,旨在完全開源重現 DeepSeek-R1。團隊目前專注於利用 TRL 庫中的 GRPO 演算法進行強化學習訓練,並已釋出初步的訓練配方、資料集與評估結果。報告中也探討了推理模型訓練中常見的「獎勵作弊(Reward Hacking)」與格式控制等技術挑戰。
Hugging Face 推出全新「AI 藝術工具電子報(Issue 1)」,旨在為藝術家與創意工作者搭起技術橋樑。本期聚焦於 2025 年 1 月最新的開源 AI 藝術工具、互動式 Hugging Face Spaces 以及實用的創意工作流。內容涵蓋影像生成、風格轉移與社群熱門的視覺創作模型,幫助創作者掌握開源 AI 的最新藝術應用。
Hugging Face 宣布推出新功能,現在平台上的「組織(Organizations)」帳號也可以直接撰寫並發布部落格文章。過去此功能主要開放給個人,如今企業、研究機構與開源團隊將能以官方名義直接在平台上分享技術細節、模型發布公告與教學,進一步強化 Hugging Face 作為 AI 社群知識樞紐的地位。
阿布達比技術創新研究所(TII)正式發布 Falcon 3 系列開源模型,提供 1B、3B、7B 及 10B MoE 等多種參數規格。Falcon 3 在多項基準測試中表現優異,其 7B 版本在性能上甚至超越了 Llama 3.1 8B 與 Gemma 2 9B。此系列模型對硬體友善,極適合邊緣運算與本地部署,並已深度整合至 Hugging Face 生態系統。
Replicate 指出,AI 影片生成領域正經歷類似當年 Stable Diffusion 顛覆圖像生成的「開源時刻」。 目前市場上已出現多款效果足以媲美 OpenAI Sora 的開源影片生成模型。 這意味著開發者與創作者不再受限於封閉的 API,能以更低成本、更高自由度在本地或雲端部署高品質影片生成。
歐盟《AI 法案》(EU AI Act)已正式生效,Hugging Face 針對開源社群推出實用指南。文章釐清了開源模型在何種情況下可享有豁免(如釋出權重與架構),並指出當模型運算量超過 10^25 FLOPs 或被用於高風險領域時,開發者仍需承擔合規義務。此指南旨在幫助開源開發者在推動創新的同時,避免觸犯法律紅線。
Hugging Face 宣布與 AI 安全領導廠商 Protect AI 展開合作,旨在提升開源機器學習(ML)社群的模型安全性。雙方將共同應對日益嚴重的開源模型安全威脅,如惡意代碼注入與反序列化漏洞。透過整合先進的安全掃描技術,此合作將幫助開發者在 Hugging Face Hub 上更安全地分享與下載模型,降低供應鏈安全風險。
隨著 Qwen、DeepSeek、Yi 等中國開源模型在 Hugging Face 排行榜上名列前茅,中國 AI 勢力正加速全球擴張。這些模型憑藉強大的多語言能力、數學與程式碼推理性能,以及極高的性價比,成為全球開發者在 Llama 之外的重要選擇。本文總結了中國 AI 透過開源生態系打破地理限制、走向國際的關鍵策略與面臨的挑戰。
Hugging Face 宣布在 HuggingChat 中推出「社群工具 (Community Tools)」功能。這項更新讓 HuggingChat 上的開源模型(如 Llama 3.1、Command R+)能夠調用由社群開發的各種工具,例如圖像生成、網頁抓取、計算機等。開發者可以使用 Python 輕鬆建立並分享工具,使開源 AI 助理具備更強大的 Agent 實用能力。
Meta 正式發布 Llama 3.1 系列,包含 8B、70B 及首款能與頂級閉源模型媲美的 405B 旗艦模型。此版本將上下文視窗大幅提升至 128k,並增強了多語言能力。Hugging Face 同步推出完整生態系支援,涵蓋 Transformers 整合、TGI 推論優化、TRL 微調以及 FP8 量化,降低 405B 的部署門檻。
Hugging Face 發表「Data Is Better Together (DIBT)」計劃的階段性回顧與展望。該計劃旨在透過社群協作,解決高品質開源對齊數據不足的痛點。過去一年中,DIBT 透過 Argilla 等工具成功匯聚全球開發者,共同標註與生成了多個高質量的偏好與提示詞數據集。未來,該計劃將進一步擴展任務類型,推動更具包容性與去中心化的 AI 數據生態。
知名簡報平台 Prezi 為了在產品中導入多模態 AI 功能,與 Hugging Face 展開深度合作。透過利用 Hugging Face Hub 的開源模型生態系,並加入「專家支持計畫(Expert Support Program)」,Prezi 獲得了 HF 頂尖工程師的直接技術指導。這項合作不僅解決了模型微調與推理優化的技術瓶頸,更大幅縮短了其機器學習路線圖的時程,實現高效的多模態功能落地。