Hugging Face 宣布新增三家無伺服器(Serverless)推論合作夥伴:Hyperbolic、Nebius AI Studio 與 Novita AI。開發者現在能直接在 Hugging Face 生態系中,以更具彈性、低延遲且具成本效益的方式呼叫各類主流開源模型。這項更新不僅擴展了 Hugging Face 的推論 API 選擇,也為去中心化運算與高效能 GPU 雲端服務帶來更多應用場景。
Vercel 宣布支援 Domain Connect 開放標準,大幅簡化了自訂網域的配置流程。 過去開發者需要手動複製 A 或 CNAME 紀錄並貼到網域註冊商,現在只需透過簡單的授權流程即可自動完成 DNS 設定。 此功能支援多個主流註冊商,能有效減少人為設定錯誤並提升部署效率。
Vercel 發布更新,為開發者提供更多將部署(Deployments)分享給外部人員的選項。 這項更新讓團隊在與客戶、外部測試人員或合作夥伴協作時,能更彈性且安全地共享 Preview 連結。 開發者可以更輕鬆地管理外部存取權限,優化跨團隊的產品檢視與回饋流程。
Hugging Face 宣布在 Open LLM Leaderboard 中引入全新開源工具 Math-Verify。過去的數學評測常因模型輸出格式與標準答案不完全一致(如分數與小數)而導致誤判。Math-Verify 透過強大的數學表達式解析與等價性檢查,修正了這些評分偏差,讓開源模型的數學推理能力得到更真實的呈現。
Hugging Face 宣佈與高效能推論平台 Fireworks.ai 展開合作,將其整合至 Hugging Face Hub。開發者現在可以直接在 Hub 上利用 Fireworks.ai 的超低延遲推論引擎,運行 Llama 3、Qwen 等熱門開源模型。這項合作不僅簡化了 API 調用流程,也為尋求高性價比、企業級推論服務的開發者提供了全新選擇。
Vercel 宣布正式支援 React Router v7。此版本將 Remix 的強大功能(如 SSR、資料載入與漸進式增強)直接整合至 React Router 中。現在開發者可以在 Vercel 上實現零設定部署 React Router v7 應用程式,並享有 Edge 網路與 Serverless 函式的最佳化支援。
Hugging Face 發表專文探討大規模文本分類的實踐。在 LLM 時代,許多開發者盲目使用 GPT-4 等生成式大模型進行分類,導致成本高昂且延遲高。文章展示了如何利用 ModernBERT、DeBERTa 等開源編碼器模型,搭配 Rust 編寫的 TEI (Text Embeddings Inference) 引擎,在極低成本下於短時間內完成 10 億次分類。這種方法不僅能將延遲壓低至個位數毫秒,成本更比使用 LLM API 降低高達 90% 以上,為工業級數據處理提供高效示範。
Vercel 發布一項提升開發體驗(DX)的更新,允許開發者在修改專案設定(如環境變數等)後,直接在「專案設定」頁面中觸發重新部署。過去開發者必須切換到部署頁面或透過 CLI 才能重新部署,現在一鍵即可完成。此更新大幅減少了頁面跳轉,讓設定調整與部署流程更加流暢。
Vercel 發表專文探討 AI 網頁生成工具 v0 如何橋接設計與開發。v0 支援將設計截圖或 Figma 概念直接轉化為基於 React、Tailwind CSS 與 shadcn/ui 的前端程式碼。這不僅加速了原型製作,更讓設計師與工程師能用同一套「程式碼即設計」的語言協作,大幅減少傳統設計交付的溝通成本。
Vercel 更新其控制台功能,現在開發者可以直接在 Vercel Dashboard 儀表板中管理多個 Vercel Function 的部署區域(Regions)。這項更新免去了手動修改設定檔的繁瑣步驟,讓全球化部署與降低延遲的設定變得更加直覺與便利,特別適合需要將無伺服器函數部署在靠近用戶或資料庫區域的開發團隊。
Hugging Face 發表全新開源工具包 vid_ds_scripts,解決影片生成模型(如 LTX-Video、HunyuanVideo)訓練資料準備的痛點。該工具包提供一站式解決方案,涵蓋影片下載、PySceneDetect 場景分割、VLM 自動生成詳細描述,以及資料過濾與格式化。這大幅降低了開發者構建高品質「影片-文字對」資料集的門檻,加速開源影片生成技術的微調與研發。
Hugging Face 官方宣布重構其 `huggingface_hub` SDK 的傳輸架構。新架構從傳統的「分塊(Chunks)」改為「區塊(Blocks)」管理,支援並行傳輸、獨立區塊重試與更低的記憶體佔用。這項更新顯著提升了數 GB 甚至數百 GB 級模型(如 Safetensors)與數據集的上傳與下載速度,並增強了網路不穩定時的容錯能力。
Vercel 宣布 CLI 的封存部署(archive deployment)預設行為已改為「Split-tgz」。此機制會將部署檔案分割成多個較小的 .tgz 壓縮檔進行並行上傳,取代以往單一大型檔案的上傳方式。這項更新能顯著降低大專案部署時的失敗率,並加快上傳速度,開發者無需手動調整即可享有更流暢的部署體驗。
Vercel 宣布其資料庫模板(Database Templates)進行實用更新,現在已支援 Vercel Integration Marketplace 中的任何資料庫提供商。過去開發者在使用模板時往往受限於特定的預設資料庫,如今則可自由選擇如 Supabase、Neon、MongoDB Atlas 等市集上的合作夥伴。這項改進大幅提升了專案初始配置的靈活性,讓開發者能更快速地將偏好的資料庫服務與 Vercel 專案進行綁定與部署。
Hugging Face 釋出 Open R1 專案的第二份進度報告。團隊分享了使用 TRL 庫中的 GRPO 演算法在 Llama-8B 與 Qwen-32B 上進行強化學習(RL)訓練的實戰經驗,成功重現了「頓悟時刻」與推理鏈。本次更新也詳細探討了格式控制、訓練穩定性及在 MATH、AIME 等基準測試上的最新評估數據。
Hugging Face 宣布推出「開源阿拉伯語大語言模型排行榜 2.0」。本次更新旨在解決舊版基準過時與數據污染問題,引入了更具挑戰性的評測數據集,涵蓋推理、數學、文化理解等維度。新版本採用 Lighteval 評估工具並加強防作弊機制,為阿拉伯語 AI 研究提供更具公信力的評估標準。
Vercel 宣布在其 Monitoring(監控)功能中整合更強大的防火牆數據。開發者現在可以直接在儀表板中,即時查看被 Vercel 防火牆(WAF)攔截、挑戰(如驗證碼)或限制速率的請求細節。這項更新大幅提升了安全事件的透明度,幫助團隊快速診斷惡意流量、調整安全規則並優化應用程式防護。
Vercel 宣布優化其部署管道,特別針對擁有大量建置產出(如數千個靜態頁面或大型資源檔案)的大型專案。透過改進建置產出的上傳與處理機制,減少建置完成到部署正式上線(Active)之間的延遲。這項更新無需用戶進行任何設定,所有在 Vercel 上的大型專案都將自動享有更快的部署速度。
Vercel 宣布為 Edge Functions 推出全新的執行時間限制(Duration Limit)規範,使其與 Serverless Functions 對齊。現在 Hobby 方案限制為 30 秒,Pro 方案預設 30 秒並可手動配置延長至 5 分鐘(300 秒),Enterprise 方案則最高支援 15 分鐘。這項調整讓開發者在 Edge 端處理長時間運作的任務(如 AI 串流、複雜 API 請求)時,擁有更明確的規範與彈性。
Vercel 宣布對其程式碼搜尋工具「Grep」進行多項升級。本次更新正式引入了開發者期盼已久的深色模式(Dark mode),並擴展了搜尋功能以提供更精準的結果。此外,Grep 現在支援在單次搜尋中涵蓋更多的儲存庫(repositories),大幅提升跨專案程式碼檢索的效率。
Vercel 推出平台更新,現在在「部署(Deployment)」頁面上會直接呈現關鍵的配置設定。這項改進讓開發者無需頻繁切換到專案設定頁面,就能快速確認當前部署的關鍵設定(如 Node.js 版本或建置指令等)。此舉大幅提升了日常開發、版本比對與疑難排解(Troubleshooting)的效率,為前端開發者帶來更流暢的體驗。
Vercel 發表全新「Fluid Compute」運算架構,完美融合了 Serverless 的自動縮放彈性與傳統伺服器的持久連線能力。它解決了冷啟動延遲與執行時間限制,原生支援 WebSockets、串流傳輸及背景非同步任務,為現代 Web 與 AI 應用提供更流暢、無妥協的部署體驗。
Vercel 宣布其無伺服器函式(Vercel Functions)現在可以運行在全新的 Fluid Compute 架構上。這項更新旨在大幅降低冷啟動延遲、提升執行效率,並提供更具彈性的資源調度。開發者無需修改程式碼,即可享受更流暢、接近零延遲的伺服器端渲染與 API 回應體驗。
Hugging Face 推出全新基準測試「DABStep」,旨在評估 AI 數據代理(Data Agent)執行多步驟推理的能力。DABStep 模擬了真實世界的複雜數據分析場景,要求 AI 規劃步驟、撰寫並執行程式碼、處理多種數據格式,並進行錯誤修正。此基準測試為開發更實用、更具規劃能力的數據分析 AI 助手提供了客觀的評估標準。
機器人 AI 新創公司 Physical Intelligence 在 Hugging Face 上開源了其通用機器人基礎模型 π0 及其加速版本 π0-FAST。這款視覺-語言-動作(VLA)模型能透過文字與視覺指令控制多種不同硬體的機器人,執行摺衣服、收拾雜物等複雜任務。π0-FAST 則大幅提升了推理速度,滿足高頻率實時控制的需求,為開源實體 AI 領域帶來重大突破。
為對抗封閉的商業 Deep Research 服務,Hugging Face 推出開源版 DeepResearch。該專案基於其輕量級 Agent 框架 smolagents,能驅動開源模型(如 Qwen 或 Llama)進行多步驟網頁搜尋、資訊整合並產出詳盡報告。這不僅降低了研究型 Agent 的門檻,也讓開發者能完全掌控資料與搜尋邏輯。
Hugging Face 發表 Open-R1 專案的第一階段更新,旨在完全開源重現 DeepSeek-R1。團隊目前專注於利用 TRL 庫中的 GRPO 演算法進行強化學習訓練,並已釋出初步的訓練配方、資料集與評估結果。報告中也探討了推理模型訓練中常見的「獎勵作弊(Reward Hacking)」與格式控制等技術挑戰。
Vercel 宣布企業級團隊現在可以享受「無建置排隊(without build queues)」的體驗。過去在多人協作或頻繁推送程式碼時,常因達到同時建置上限而需要排隊等待。此更新消除了這項瓶頸,讓企業客戶的每一次推送都能立即開始建置與部署,顯著提升開發與交付效率。
Hugging Face 的 open-r1 專案推出全新實作教學,旨在重現 DeepSeek-R1 最著名的「頓悟時刻」(自我糾錯能力)。本教學以經典的「倒數遊戲」(Countdown Game)為任務,引導讀者使用強化學習(RL)訓練小模型。透過設計精準的規則與格式獎勵,開發者能親眼見證模型在思考過程中自動發現錯誤並進行修正,是理解 R1 推理機制與 GRPO 演算法絕佳的低成本實作教材。
Hugging Face 推出全新「AI 藝術工具電子報(Issue 1)」,旨在為藝術家與創意工作者搭起技術橋樑。本期聚焦於 2025 年 1 月最新的開源 AI 藝術工具、互動式 Hugging Face Spaces 以及實用的創意工作流。內容涵蓋影像生成、風格轉移與社群熱門的視覺創作模型,幫助創作者掌握開源 AI 的最新藝術應用。