Replicate 宣布推出遠端 MCP(Model Context Protocol)伺服器,將其平台上的數萬個開源模型直接接入開發工作流。使用者現在無需離開編輯器或聊天介面,即可在 Claude Desktop、Cursor 和 VS Code 等工具中,直接搜尋、比較並執行 Replicate 上的模型。這項更新大幅簡化了開發者測試與整合各種開源 AI 模型(如 Llama、Flux 等)的流程,提升開發效率。
Hugging Face 發表全新工具「AI Sheets」,旨在降低數據集處理的門檻。使用者無需編寫複雜代碼,即可在類似 Excel 的試算表介面中導入數據,並調用 Hugging Face 上的開源 AI 模型進行批量文本分類、翻譯、情感分析或數據增強。這項工具結合了開源生態系的靈活性與直觀的無程式碼操作,大幅提升了數據準備與標記的效率。
NVIDIA 在 Hugging Face 部落格分享了其開源且可移植的深度研究 Agent 成果。透過在 DeepResearch Bench 基準測試上評估開源的 Llama Nemotron 模型,該系統展現出極佳的研究與推理能力。此研究證明了開源模型在複雜、多步驟的研究任務中,已具備與閉源頂尖模型競爭的實力,為開發者提供了一個強大且可本地部署的 Deep Research 解決方案。
Vercel 發表 AI SDK 5,此版本專為構建複雜的 AI 應用與 Agentic 工作流而設計。新版本強化了多模態輸入輸出、多代理(Multi-agent)協作架構,並內建更完善的 OpenTelemetry 監控支援。此外,針對 React Server Components (RSC) 與主流前端框架的整合也獲得進一步優化,讓開發者能更輕鬆地打造高效能的 AI 體驗。
Hugging Face 介紹了全新的影片多模態基準測試「TimeScope」,旨在評估 Video LMM 處理長影片的能力。現有基準多侷限於短影片,而 TimeScope 挑戰模型在長時段影片中的時間推理、事件排序與資訊檢索。測試結果顯示,多數現行模型在影片長度增加時,理解與推理能力會顯著下降,揭示了現有技術的瓶頸。
Hugging Face 宣布與 NVIDIA 深度整合,推出支援多種 LLM 的 NVIDIA NIM(推理微服務)。開發者現在可以直接在 Hugging Face 平台上,利用經 TensorRT-LLM 優化的 NIM 容器,輕鬆部署 Llama、Mistral 等熱門開源模型,大幅提升推理吞吐量並降低延遲,簡化企業級 AI 應用的落地流程。
Hugging Face 發表全新基準測試「FutureBench」,旨在評估 AI Agent 在預測未來事件(如地緣政治、金融市場及科技趨勢)上的表現。該測試挑戰了 Agent 的資訊檢索、機率推理與時間推理能力,有效避免了傳統基準測試中常見的資料洩漏問題。評估結果顯示,目前的 AI Agent 在面對未知的未來事件時,預測準確度與人類專家仍有顯著差距。
NVIDIA 宣布將其輕量級視覺語言模型 Llama Nemotron Nano VLM 上架至 Hugging Face Hub。該模型結合了 Llama 架構與 NVIDIA 的 Nemotron 優化技術,專為邊緣運算與本機端部署設計。它能在低資源設備上高效執行圖像理解、視覺問答(VQA)與 OCR 等任務,為開發者提供更便利的開源多模態選擇。
Vercel 宣布其 AI Gateway 服務正式進入 Beta 測試階段。此工具旨在簡化開發者整合多個 LLM 供應商的流程,提供統一的 API 接口。AI Gateway 具備邊緣快取(Edge Caching)、速率限制(Rate Limiting)、即時分析與自動重試等功能,能有效降低 AI 應用的延遲與 API 呼叫成本,並提升系統的穩定性。
Hugging Face 正式將 Groq 納入其「推理提供商(Inference Providers)」生態系。開發者現在可以直接在 Hugging Face Hub 上,選擇由 Groq 的 LPU 晶片驅動的 API 來運行熱門開源模型(如 Llama 3 和 Mistral)。這項整合不僅簡化了高吞吐量、低延遲應用的開發流程,也為開源模型生態注入了更強大的硬體支援。
Hugging Face 與 Dell 合作推出 Dell Enterprise Hub,旨在簡化企業在本地端(on-premises)部署 AI 模型的流程。該平台整合了 Dell 的硬體優勢與 Hugging Face 的豐富模型庫,提供經優化的容器與自動化工作流。這讓企業能在確保數據安全與合規的前提下,輕鬆在自家伺服器上運行 Llama、Mistral 等主流開源模型。
Hugging Face 發布 2025 年視覺語言模型(VLM)趨勢報告。文章深入探討 VLM 在「更強(推理與 OCR)」、「更快(輕量化與推論優化)」與「更實用(多模態 Agent)」三大維度的演進。推薦了 Qwen2.5-VL、Llama-3.2-Vision 等主流開源模型,並介紹如何利用 Hugging Face 生態系進行高效部署與微調。
Meta 推出的最新一代安全防護模型 Llama Guard 4 已正式登陸 Hugging Face Hub。該模型專為 LLM 輸入與輸出審查設計,能有效偵測有害內容、越獄攻擊與敏感資訊。開發者現在可以透過 Hugging Face 輕鬆部署、微調並整合此模型,為 AI 應用構建更安全的防護網。
Hugging Face 介紹了由普林斯頓大學等機構提出的 HELMET 基準測試,旨在解決現有長文本評估(如 Needle In A Haystack)過於單一的問題。HELMET 包含 7 大類、11 個真實應用數據集,涵蓋長文本問答、摘要、資訊檢索與程式碼生成等。測試結果顯示,許多宣稱擁有超長上下文的模型,在實際複雜任務中的有效性能會隨著長度增加而顯著衰退。
Vercel 宣布 Meta 的最新一代開源大語言模型 Llama 4 已正式登陸 Vercel Marketplace。這項更新讓全端與前端開發者能夠更輕鬆地在 Next.js 等專案中,透過 Vercel 生態系統快速接入、配置並部署 Llama 4。藉由 Marketplace 的整合,開發者無需繁瑣的 API 設定即可開始使用最新模型。
Meta 正式於 Hugging Face 平台上架了備受矚目的 Llama 4 家族首批模型:Maverick 與 Scout。這標誌著開源大語言模型正式邁入 Llama 4 時代。雖然詳細技術細節仍待官方完整白皮書披露,但從命名來看,Scout 預期為輕量、高效率的「偵察型」模型,適合邊緣運算與 Agent 任務;而 Maverick 則可能是主打強大推理與複雜任務處理的「王牌」模型。這兩款模型的釋出將為開源社群注入全新動力。
Hugging Face 宣布將其廣受歡迎的經典「NLP 課程(NLP Course)」正式轉型並升級為「LLM 課程(LLM Course)」。這項轉變反映了 AI 領域從傳統 NLP(如 BERT、分類與命名實體識別)向大語言模型(如 Llama、生成式 AI、RAG 與 Agent)的典範轉移。新課程將全面更新,涵蓋現代 LLM 架構、微調(PEFT/LoRA)、對齊(RLHF/DPO)及應用開發,繼續提供免費且高品質的開源學習資源。
Hugging Face 宣布其文字生成推理(TGI)框架現已整合 Intel Gaudi 加速器後端。這項合作讓開發者能直接在 Intel Gaudi 2 和 Gaudi 3 晶片上部署高效能 LLM,並享有連續批處理(Continuous Batching)與張量並行(Tensor Parallelism)等優化技術。此舉為企業在 NVIDIA 之外,提供了一個極具成本效益且易於部署的 AI 推理硬體新選擇。
Hugging Face 釋出 Open R1 專案的第四次技術更新。本階段重點在於提升 TRL 框架中 GRPO(群體相對策略最佳化)的訓練效率與記憶體最佳化,並釋出針對數學與程式碼推理的全新合成資料集。團隊分享了在 Qwen 與 Llama 模型上進行強化學習(RL)訓練的最新評測結果,為開源社群複製 DeepSeek-R1 的推理能力提供更完整的實踐指南。
Vercel 正式推出 AI SDK 4.2,專注於提升 Agentic(代理)開發體驗。此版本優化了多步驟工具調用(`maxSteps`)的控制、增強了 `streamObject` 的結構化數據輸出,並提供更完善的 OpenTelemetry 監控支援。同時,新版本也深化了與 React 19 和 Next.js 的整合,讓前端開發者能更輕鬆地構建高效、可觀測的 AI 應用。
Vercel 宣佈 Groq、fal 和 DeepInfra 正式上架其 Marketplace。開發者現在可以直接在 Vercel 平台中一鍵啟用這些熱門的 AI 推理與生成服務。此整合不僅簡化了 API 金鑰管理與環境變數設定,還提供了統一帳單功能,大幅降低了在 Vercel 專案中部署高效能 AI 應用的門檻。
Hugging Face 發表開源推理模型專案 Open R1 的第三次技術更新。本次更新重點在於釋出基於 Qwen/Llama 的全新推理模型,並詳細公開了使用 TRL 進行 GRPO(群體相對策略優化)的訓練細節。團隊成功解決了訓練中的「獎勵黑客」問題,並開源了完整的訓練數據集與配方,顯著降低了社群重現 DeepSeek-R1 推理能力的門檻。
Hugging Face 推出全新教學,指導開發者如何利用 React Native 在 iOS 與 Android 手機上進行邊緣端(Edge)LLM 本地推理。文章介紹了如何整合輕量化模型(如 Qwen 或 Phi)與移動端推理引擎,幫助開發者打造具備高隱私、低延遲且支援離線使用的行動 App。
Hugging Face 釋出 Open R1 專案的第二份進度報告。團隊分享了使用 TRL 庫中的 GRPO 演算法在 Llama-8B 與 Qwen-32B 上進行強化學習(RL)訓練的實戰經驗,成功重現了「頓悟時刻」與推理鏈。本次更新也詳細探討了格式控制、訓練穩定性及在 MATH、AIME 等基準測試上的最新評估數據。
Hugging Face 發表 Open-R1 專案的第一階段更新,旨在完全開源重現 DeepSeek-R1。團隊目前專注於利用 TRL 庫中的 GRPO 演算法進行強化學習訓練,並已釋出初步的訓練配方、資料集與評估結果。報告中也探討了推理模型訓練中常見的「獎勵作弊(Reward Hacking)」與格式控制等技術挑戰。
Hugging Face 宣佈在 Hub 上整合「Inference Providers」功能。開發者現在可以直接在模型頁面或透過 SDK,自由選擇 Groq、Together AI、Fireworks AI 等第三方推理服務商來運行開源模型。這項更新簡化了 API 調用流程,讓用戶能根據速度、成本與延遲,彈性切換最適合的後端算力,無需自行維護基礎設施。
Hugging Face 宣布啟動 Open-R1 專案,目標是完全重現 DeepSeek-R1 的推理能力。該專案將開源所有訓練配方、資料集與模型權重,並利用 TRL 框架中的 GRPO 演算法進行強化學習。這項計畫將降低開發者構建高效推理模型的門檻,推動開源 AI 社群的推理模型民主化。
Hugging Face 旗下的輕量級 Agent 開源庫 smolagents 迎來重大更新,正式支援視覺語言模型(VLM)。開發者現在可以讓 Agent 接收並處理影像輸入,適用於網頁視覺導航、圖表分析及多模態任務。此更新大幅擴展了程式碼 Agent(Code Agent)的應用場景,使其能「看見」並理解真實世界的視覺資訊。
Hugging Face 發布在 Google Cloud Platform (GCP) 全新 C4 執行個體上運行語言模型的效能評測。C4 搭載第五代 Intel Xeon 可擴充處理器,內建 Intel AMX 加速技術。測試顯示,透過 Optimum Intel 與 IPEX 優化,CPU 在中小型開源模型(如 Llama 3)的推論上展現出極佳的延遲表現與高性價比,為 GPU 短缺或預算有限的企業提供強大的替代方案。
Hugging Face 發表「Synthetic Data Generator」工具,旨在降低 AI 模型訓練資料集的構建門檻。用戶只需用自然語言描述需求,系統便會利用 distilabel 框架與開源大模型(如 Llama 3.1)自動生成高品質的指令微調(SFT)或偏好對齊(DPO)資料集。生成的資料可直接上傳至 Hugging Face Hub,並支援匯出至 Argilla 進行人工標註與微調。