Arm 與 Hugging Face 合作宣布「Neural Super Sampling (NSS)」技術正式上線。這項技術旨在利用神經網路,在行動裝置與邊緣設備上實現即時的圖像與遊戲畫面超取樣(類似行動版 DLSS)。透過 Hugging Face 平台,開發者現在可以輕鬆獲取優化後的 NSS 模型與工具鏈,大幅提升手遊與 XR 應用的畫面流暢度並降低能耗。
Hugging Face 發表全新工具「AI Sheets」,旨在降低數據集處理的門檻。使用者無需編寫複雜代碼,即可在類似 Excel 的試算表介面中導入數據,並調用 Hugging Face 上的開源 AI 模型進行批量文本分類、翻譯、情感分析或數據增強。這項工具結合了開源生態系的靈活性與直觀的無程式碼操作,大幅提升了數據準備與標記的效率。
Hugging Face 官方宣布迎來 OpenAI 的全新開源模型家族「GPT OSS」。這項合作打破了 OpenAI 長期以來以閉源為主的策略,將其強大的 GPT 技術以開源形式提供給全球開發者。社群現在可以直接在 Hugging Face 上下載、微調並部署這些模型,預計將對開源 AI 生態系產生深遠的影響。
Replicate 宣布上線全新開源影片生成模型 Wan 2.2。該模型被定位為目前平台上速度最快且成本最低的影片生成選擇,標誌著開源影片生成技術(Open Source Video)的重大進展。這項更新將大幅降低開發者與創作者生成高品質影片的門檻與運算成本。
Vercel 宣布推出「AI Cloud」統一平台,旨在解決 AI 應用開發中基礎設施碎片化的痛點。該平台深度整合了 Vercel AI SDK,提供動態模型路由、智慧快取與無伺服器 GPU 運算能力。開發者現在可以從前端 UI(結合 v0)到後端 AI 邏輯、監控與擴展,在同一個生態系中高效完成,大幅降低構建生產級 AI 應用的門檻與成本。
Replicate 宣布與 Black Forest Labs(BFL)合作舉辦的 FLUX.1 Kontext 黑客松圓滿落幕。本次活動旨在鼓勵開發者利用 FLUX.1 圖像生成模型,在 Replicate 平台上開發創新的上下文相關(Context)圖像生成應用。獲獎作品展示了 FLUX.1 在圖像編輯、控制與創意生成方面的強大潛力。
Black Forest Labs 推出全新圖像編輯模型 FLUX.1 Kontext,現已可在 Replicate 上運行。該模型允許使用者透過簡單的文字指令(如「把背景換成冬天」)直接編輯現有圖片,同時保持原圖的結構與細節。本文介紹了如何調整引導參數(如圖片與文字引導強度)以獲得最佳編輯效果,是設計師與創作者提升工作流效率的利器。
Hugging Face 與 Dell 合作推出 Dell Enterprise Hub,旨在簡化企業在本地端(on-premises)部署 AI 模型的流程。該平台整合了 Dell 的硬體優勢與 Hugging Face 的豐富模型庫,提供經優化的容器與自動化工作流。這讓企業能在確保數據安全與合規的前提下,輕鬆在自家伺服器上運行 Llama、Mistral 等主流開源模型。
阿聯酋技術創新研究所(TII)在 Hugging Face 上發布了全新的 Falcon-H1 系列模型。該系列主打「混合頭(Hybrid-Head)」架構,旨在解決傳統 Transformer 模型在處理長文本時的運算瓶頸。透過結合不同的注意力機制或序列處理技術,Falcon-H1 成功在推論效率、記憶體佔用與模型性能之間取得全新平衡,為開源 AI 社群注入高效能的新選擇。
阿布達比技術創新研究所(TII)在 Hugging Face 上發布了專為阿拉伯語設計的 Falcon-Arabic 模型。該模型旨在解決阿拉伯語在自然語言處理(NLP)中因複雜語法與方言多樣性帶來的挑戰。作為開源 Falcon 家族的新成員,Falcon-Arabic 將為中東及全球開發者提供更精準、高效的阿拉伯語 AI 解決方案。
Google DeepMind 發表全新開放模型 Gemma 3n 預覽版,專為行動裝置與端側(on-device)快速多模態 AI 設計。該模型不僅優化了執行效能,還引入獨特的「二合一(2-in-1)」彈性架構,並擴展了對音訊的理解能力。這將賦能開發者構建即時互動、以語音為核心的全新應用體驗。
Microsoft 與 Hugging Face 宣布深化合作,將 Hugging Face 的開源模型庫與 Azure AI Foundry(前身為 Azure AI Studio)進行深度整合。開發者現在可以直接在 Azure 安全且具備合規性的企業級環境中,輕鬆搜尋、部署與微調數十萬個 Hugging Face 的開源模型,大幅簡化企業導入開源 AI 的工作流程。
Hugging Face 發布 2025 年視覺語言模型(VLM)趨勢報告。文章深入探討 VLM 在「更強(推理與 OCR)」、「更快(輕量化與推論優化)」與「更實用(多模態 Agent)」三大維度的演進。推薦了 Qwen2.5-VL、Llama-3.2-Vision 等主流開源模型,並介紹如何利用 Hugging Face 生態系進行高效部署與微調。
Hugging Face 介紹了由普林斯頓大學等機構提出的 HELMET 基準測試,旨在解決現有長文本評估(如 Needle In A Haystack)過於單一的問題。HELMET 包含 7 大類、11 個真實應用數據集,涵蓋長文本問答、摘要、資訊檢索與程式碼生成等。測試結果顯示,許多宣稱擁有超長上下文的模型,在實際複雜任務中的有效性能會隨著長度增加而顯著衰退。
OpenAI 正式發表全新主力模型 GPT 4.1,定位為兼顧效能與成本的「工作馬(Workhorse)」。本次更新同步推出 MRCR 與 GraphWalks 兩項全新基準測試,並釋出官方 Prompt 指南與 Cookbook。此外,社群(如 Reddit 與 Discord)也熱烈討論 GLM-4 強化學習模型與 DeepSeek 的開源貢獻。
Hugging Face 正式收購法國機器人公司 Pollen Robotics,將其硬體技術與 Hugging Face 的 LeRobot 開源機器人平台深度整合。此舉標誌著 Hugging Face 正式進軍實體機器人硬體領域,未來將致力於降低機器人開發門檻,並直接向開發者與研究人員銷售開源機器人硬體,加速具身智能(Embodied AI)的普及。
Hugging Face 與 AI 安全公司 Protect AI 合作滿六個月,宣布已完成平台上 400 萬個開源模型的安全掃描。此項合作旨在解決開源模型(特別是含有 pickle 反序列化風險的舊格式)中潛在的惡意代碼與安全漏洞。透過自動化安全掃描與漏洞標記,雙方共同為全球開發者建構更安全、更值得信賴的 AI 供應鏈生態。
Sam Altman 宣傳了 ChatGPT 的「記憶(Memory)」功能更新,同時市場傳出 o3、o4-mini 即將推出,以及 GPT-4o 將升級為 GPT-4.1 的洩露消息。 xAI 正式推出 Grok 3 與 Grok 3 mini 的 API,Epoch AI 曾短暫證實其具備 o1 等級的推理能力。 社群方面,Qwen3 宣布延期推出,而 AI Engineer World's Fair 2025 也正展開熱烈徵稿。
Hugging Face 發表文章慶祝旗下開源機器學習網頁介面庫 Gradio 的使用者正式突破 100 萬人。文章回顧了 Gradio 自創立以來的成長軌跡,如何透過極簡的 Python 程式碼讓開發者快速部署 AI 互動 Demo,並探討其在 Hugging Face 生態系中扮演的關鍵角色與未來展望。
Replicate 彙整了社群最新的創意 AI 模型與實驗專案。本次焦點包括:如何利用 AI 生成高品質且具一致性的個人頭像、趣味的光劍視覺特效應用,以及在平台上訓練與融合多個 LoRA 模型的實用技巧。這為設計師與開發者提供了豐富的視覺創作靈感與技術指引。
Hugging Face 針對美國白宮的 AI 行動計畫徵求意見稿(RFI)提交了官方回應。其核心訴求圍繞在保護與推廣「開源 AI」與「開放科學」。Hugging Face 強調,開放源碼不僅能加速技術創新、防止科技巨頭壟斷,更能透過社群的集體審查提升 AI 的安全性與透明度,呼籲政府在制定政策時應避免扼殺開源生態。
NVIDIA 在 GTC 2025 針對實體 AI(Physical AI)領域發表重大更新,與 Hugging Face 合作釋出全新開源模型與資料集。這些資源旨在降低具身智慧與機器人開發門檻,涵蓋世界模型、VLA 模型及高質量訓練資料。開發者可直接在 Hugging Face 平台獲取,加速實體世界 AI 應用的落地。
Google 推出全新一代開源模型 Gemma 3,具備強大的多模態(視覺與語音)理解能力、廣泛的多語言支持以及長文本處理能力。本次發布涵蓋多種參數規格,並與 Hugging Face 生態系統深度整合,開發者可立即透過 Transformers、vLLM 等工具進行部署與微調,為開源社群注入強大動力。
Cohere For AI 發表全新開源多語言多模態模型「Aya Vision」(提供 8B 與 32B 版本)。該模型旨在解決現有視覺語言模型(VLM)嚴重偏向英語的問題,大幅提升了對全球多種語言(特別是低資源語言)的圖像理解與文字生成能力。在多項多語言多模態基準測試中,Aya Vision 展現出超越同量級開源模型的優異性能,並已於 Hugging Face 平台上開源。
Hugging Face 與軟體供應鏈安全領導廠商 JFrog 展開戰略合作。雙方將整合 Hugging Face 的開源模型生態系與 JFrog 的安全平台,讓企業在引進 AI 模型時能進行自動化漏洞掃描與惡意代碼檢測。此舉旨在解決 AI 供應鏈中的安全隱憂,讓 AI 開發流程更加透明且符合企業合規要求。
Hugging Face 宣布與印度頂尖研究機構印度科學理工學院(IISc)展開合作。雙方將結合 IISc 的學術研究實力與 Hugging Face 的開源生態系,致力於解決印度多元語言(包含多種低資源語言)的 AI 模型開發挑戰。此舉旨在為印度本土語言建立更完善的開源數據集與語言模型,促進在地化的 AI 技術普及。
為對抗封閉的商業 Deep Research 服務,Hugging Face 推出開源版 DeepResearch。該專案基於其輕量級 Agent 框架 smolagents,能驅動開源模型(如 Qwen 或 Llama)進行多步驟網頁搜尋、資訊整合並產出詳盡報告。這不僅降低了研究型 Agent 的門檻,也讓開發者能完全掌控資料與搜尋邏輯。
Hugging Face 發表 Open-R1 專案的第一階段更新,旨在完全開源重現 DeepSeek-R1。團隊目前專注於利用 TRL 庫中的 GRPO 演算法進行強化學習訓練,並已釋出初步的訓練配方、資料集與評估結果。報告中也探討了推理模型訓練中常見的「獎勵作弊(Reward Hacking)」與格式控制等技術挑戰。
Hugging Face 推出全新「AI 藝術工具電子報(Issue 1)」,旨在為藝術家與創意工作者搭起技術橋樑。本期聚焦於 2025 年 1 月最新的開源 AI 藝術工具、互動式 Hugging Face Spaces 以及實用的創意工作流。內容涵蓋影像生成、風格轉移與社群熱門的視覺創作模型,幫助創作者掌握開源 AI 的最新藝術應用。
AI 開源模型託管平台 Replicate 宣布在其網頁端 Playground 中加入更便利的短影片生成工作流。使用者現在可以直接在瀏覽器中輸入提示詞、調整參數,並快速預覽與生成 AI 影片。這項更新降低了測試開源影片生成模型的門檻,非常適合開發者與創作者進行快速原型設計與效果測試。