隨著大語言模型(LLM)處理的上下文長度不斷增加,KV Cache(鍵值快取)已成為記憶體與推理速度的主要瓶頸。NVIDIA 與 Hugging Face 合作推出了開源庫 KVPress,旨在簡化各種 KV Cache 壓縮技術的實現與評估。KVPress 提供統一的 API,支援多種剪枝與壓縮策略,能有效降低長文本推理時的硬體門檻,並與 Hugging Face transformers 生態系無縫整合。
Hugging Face 發表了 SmolVLM 家族的最新成員:256M 和 500M 參數的超小型視覺語言模型(VLM)。這兩款模型體積極小,旨在讓多模態 AI 能在手機、物聯網設備或瀏覽器中流暢運行。儘管尺寸迷你,它們在基礎圖像描述與問答任務上仍展現出實用的性能,為邊緣端多模態應用開闢新路徑。
Vercel 宣布收購專注於數據可視化的開源 React 組件庫 Tremor。Tremor 以基於 Tailwind CSS 構建精美儀表板著稱,此舉顯示 Vercel 致力於提升開發者在構建數據密集型應用時的體驗。未來 Tremor 有望與 Vercel 的 AI 介面生成工具 v0 進行更深度的整合,為前端生態帶來更多可能性。
Hugging Face 宣布與 FriendliAI 建立合作夥伴關係,旨在加速 Hugging Face Hub 上的模型部署。透過整合 FriendliAI 的高效能推理技術,開發者將能以更低的延遲和更低的成本部署大型語言模型(LLM)。此合作簡化了從 Hub 到生產環境的部署流程,為企業提供更具成本效益的 AI 服務方案。
Vercel 宣布推出「自助網域續約與贖回」功能。過去用戶若遇到網域過期或進入贖回期,通常需要聯絡客服手動處理;現在用戶可以直接在 Vercel 儀表板上一鍵完成網域續約,以及救回處於贖回期(Redemption)的網域。這項更新大幅簡化了網域管理流程,降低了因忘記續約而失去網域的風險與時間成本。
Hugging Face 宣布推出新功能,現在平台上的「組織(Organizations)」帳號也可以直接撰寫並發布部落格文章。過去此功能主要開放給個人,如今企業、研究機構與開源團隊將能以官方名義直接在平台上分享技術細節、模型發布公告與教學,進一步強化 Hugging Face 作為 AI 社群知識樞紐的地位。
Vercel 官方宣布推出「Claim Deployments」新功能。此功能旨在簡化部署專案的轉移流程,讓開發者能夠以更快速、安全的方式,將現有的部署專案轉移並綁定至特定的 Vercel 個人帳號或團隊工作區中,大幅提升專案管理與權限轉移的效率。
Vercel 正式發布 AI SDK 4.1。本次更新重點在於簡化 AI Agent 的開發,透過 `maxSteps` 參數即可自動處理多回合的 Tool Calling。同時,`useChat` 新增了更完善的多模態檔案上傳與狀態管理支援,並優化了 OpenTelemetry 遙測功能,讓開發者能更輕鬆地在 Next.js 等框架中建構、監控複雜的 AI 應用。
AI 開源模型託管平台 Replicate 宣布在其網頁端 Playground 中加入更便利的短影片生成工作流。使用者現在可以直接在瀏覽器中輸入提示詞、調整參數,並快速預覽與生成 AI 影片。這項更新降低了測試開源影片生成模型的門檻,非常適合開發者與創作者進行快速原型設計與效果測試。
Vercel 宣布其「稽核日誌(Audit Logs)與 SIEM 整合」功能正式開放(GA)。此功能專為企業級用戶設計,允許團隊將 Vercel 平台上的所有操作與安全日誌,即時串流至 Splunk、Datadog、AWS S3 等主流安全資訊與事件管理(SIEM)系統。這有助於企業加強安全監控、簡化合規性審查,並能更快速地偵測與回應潛在的安全威脅。
Vercel 官方宣佈,將於 2025 年 9 月 1 日起正式棄用 Node.js 18 執行階段。此調整符合 Node.js 官方的生命週期規劃(Node.js 18 將於 2025 年 4 月底 EOL)。開發者需在期限前將專案的 Node.js 版本升級至 Node.js 20 或 22,以確保後續部署與維護順暢。
Vercel 宣布其 CLI 部署功能獲得效能提升。透過全新引入的 `split-tgz` 封存選項,系統能將部署檔案分割並進行優化壓縮與上傳,進而使 CLI 封存部署(archive deployments)的速度提高達 30%。這項更新將顯著減少開發者在終端機等待部署的時間,提升日常開發與 CI/CD 工作流的效率。
知名視訊基礎設施服務商 Mux 正式加入 Vercel Marketplace。現在,開發者可以直接在 Vercel 控制台中為專案啟用 Mux,自動配置環境變數,並透過 Vercel 統一帳單計費。這項整合大幅簡化了在 Next.js 等前端框架中加入高品質視訊串流、錄製與分析功能的開發流程。
Vercel 正式支援 Bun 的全新文字鎖定檔案(bun.lock),且無需任何額外配置。過去 Bun 使用二進位鎖定檔(bun.lockb),而新版引入了更易於 Git 追蹤的文字格式。現在,當開發者將包含 bun.lock 的專案推送到 Vercel 時,系統會自動識別並正確安裝依賴,大幅提升 Bun 生態系在 Vercel 上的部署體驗。
Vercel 正式推出 Flags SDK 3.0,旨在簡化 Web 應用的功能旗標(Feature Flags)管理。此版本帶來更直覺的 API 設計與強大的型別安全,並深度整合 Next.js App Router。開發者現在可以透過 Vercel Toolbar 在預覽環境中即時覆寫旗標,並與 LaunchDarkly 等第三方服務無縫協作。
Hugging Face 的 Text Generation Inference (TGI) 宣布支援多後端架構,正式整合 NVIDIA TensorRT-LLM 與 vLLM。這項更新讓開發者無需在 TGI 的生產級功能(如 Tokenizer、工具調用、安全防護)與其他引擎的極致效能之間做抉擇。現在,用戶可以透過簡單的設定,直接在 TGI 中調用 TRT-LLM 的硬體優化或 vLLM 的高吞吐量優勢。
Hugging Face 宣布將著名的 PyTorch 圖像模型庫 `timm` 與 `transformers` 進行深度整合。現在開發者可以直接使用 `AutoModel` 和 `AutoImageProcessor` 等標準 API,輕鬆載入並使用 `timm` 中的數千個電腦視覺模型。這項更新不僅簡化了工作流程,還讓 `timm` 模型能完美融入 Hugging Face 的生態系,包括 Trainer、Pipelines 以及各類部署工具。
Vercel 宣布其 Web Analytics 服務正式支援「跳出率 (Bounce Rate)」指標。這項更新讓開發者與團隊能直接在 Vercel 控制面板中,查看僅瀏覽單一頁面即離開的訪客比例。藉由這項數據,用戶無需依賴第三方複雜的分析工具,即可快速評估網頁內容吸引力並優化使用者體驗。
Vercel 官方發布更新,其基礎設施的安全合規標準已成功從 PCI DSS 3.2.1 升級至最新的 4.0 版本。這項升級代表 Vercel 在處理信用卡與支付相關數據時,符合更嚴格的國際安全規範。對於在 Vercel 上建構電商平台、SaaS 服務或任何涉及金流處理的開發者而言,這能顯著降低自身的合規成本並提升應用的安全性。
Hugging Face 宣布 Sentence Transformers 支援訓練「靜態嵌入(Static Embeddings)」模型。相較於傳統 Transformer 模型,靜態嵌入不需逐層計算,訓練速度快上 400 倍,且推理速度極快、記憶體佔用極小。這項技術非常適合用於資源受限的設備(如手機、邊緣裝置)或作為大規模檢索(RAG)的第一階段粗篩。
Vercel 宣布其「函式內併發(In-Function Concurrency)」Beta 版新增對 Python 的支援。 此功能允許單個 Serverless 函式實例同時處理多個並行請求,打破過去單一實例僅能處理單一請求的限制。 這對於使用 FastAPI 等非同步框架開發 AI API 或 Python 後端的開發者而言,能顯著降低冷啟動延遲並優化資源成本。
Vercel 宣布對其預覽工具列(Vercel Toolbar)進行重大更新。新版本採用更緊湊(compact)的視覺設計,減少對網頁內容的遮擋,並具備更強的動態適應能力。開發者與團隊成員在進行頁面評論、草稿模式切換或無障礙檢測時,將享有更流暢且不干擾的協作體驗。
Vercel 宣布改進其日誌系統,提升了 Serverless 函式(Functions)執行時間與記憶體使用量的可見性。 開發者現在可以更輕鬆地在日誌中監控與分析每筆請求的資源消耗,有助於快速排查效能瓶頸。 此更新能有效協助團隊進行效能調優,並精準控制 Vercel 的算力與記憶體計費成本。
Vercel 宣布對其控制台儀表板(Dashboard)中的日期顯示方式進行優化。此更新旨在提升開發者在查看部署時間、專案歷史等時間戳記時的清晰度與可讀性。雖然官方未透露具體技術細節,但這類 UI/UX 的微調通常有助於減少跨時區協作時的混淆,提供更直觀的時間呈現。
本文為 Hugging Face 倫理與社會小組的專題探討,指出 AI Agent(智慧代理)已從理論走向實用。文章深入分析了 Agent 在自主決策、工具調用中所帶來的安全隱患、責任歸屬及社會衝擊,並強調開源社群在建立安全評估與「人類協同(Human-in-the-loop)」機制中的關鍵角色。
Vercel 宣布其 AI 輔助 UI 開發工具 v0 迎來全新變革。本次更新將 v0 從原本的「單一元件生成器」升級為支援多檔案、具備路由與狀態管理的「完整專案(Projects)」開發平台。此外,新加入的「自訂指令(Custom Instructions)」與團隊協作功能,讓開發者與團隊能更無縫地將 AI 融入現有的工作流與設計規範中。
Hugging Face 發表全新的 VDR-2B-multilingual 模型,專為視覺文件檢索(VDR)設計。傳統檢索依賴繁瑣的 OCR 步驟,而該模型能直接將文件頁面視為圖像進行向量化,保留排版、圖表與插圖資訊。本次更新重點在於擴展至多語言支持(包含中英日韓等),大幅提升跨國企業與多語系文檔的檢索效率與準確度。
Vercel 宣布在其 Serverless Functions 中,開發者現在可以直接獲取請求來源 IP 的「郵遞區號(Postal Code)」。這項更新擴展了 Vercel 原有的地理位置偵測功能,讓開發者無需整合第三方 IP 定位服務,即可實現更精準的在地化內容呈現、天氣預報、稅務估算或區域性行銷。
Vercel 針對 Vercel Functions 的日誌限制進行了更新。Pro 與 Enterprise 團隊的單行日誌最大容量從原本的 4 KB 大幅提升至 64 KB,而 Hobby(免費)方案則維持 4 KB。此更新能有效防止大型 JSON 數據、API 回應或詳細的錯誤堆疊追蹤(Stack Traces)在寫入日誌時被截斷,進而提升開發者的除錯與監控效率。
Hugging Face 發表 Open LLM Leaderboard 的碳排放分析報告,探討模型評估過程中的能源消耗與 CO₂ 排放。研究指出,雖然大型模型性能優異,但其碳足跡也呈指數增長;相反地,透過模型量化與參數優化,能在大幅降低能耗的同時保持高水準性能。此報告呼籲社群在追求高分之餘,也應重視「綠色 AI」與運算效率。