Hugging Face 宣布升級其阿拉伯語大語言模型(LLM)評估體系。本次更新重點引入了「阿拉伯語指令遵循(Arabic IFEval)」評估,用以測試模型執行特定格式與約束指令的能力;同時更新了阿拉伯語生成基準「AraGen」。這些舉措旨在解決非英語系評估資源不足的問題,為全球開源社群提供更精準的阿拉伯語模型評估工具。
Vercel 推出名為「Protectd」的全新常駐型阻斷服務(DoS)防禦系統。該系統部署於 Vercel 的全球邊緣網路,能自動且即時地識別並過濾惡意流量(如 L7 應用層攻擊),無需用戶手動干預。此升級旨在保護開發者的 Serverless 應用免受惡意攻擊,同時避免因攻擊流量導致的異常帳單費用,並確保合法用戶的連線延遲不受影響。
Vercel 推出全新整合功能,允許開發者在 Vercel 部署時自動觸發 GitHub Actions。此功能會傳遞「豐富的部署數據」(如部署 URL、Commit 資訊、環境類型等),讓開發者能輕鬆進行部署後的端對端(E2E)測試、效能分析或自動化通知,大幅提升 CI/CD 工作流的靈活性與自動化程度。
Vercel 宣布 Meta 的最新一代開源大語言模型 Llama 4 已正式登陸 Vercel Marketplace。這項更新讓全端與前端開發者能夠更輕鬆地在 Next.js 等專案中,透過 Vercel 生態系統快速接入、配置並部署 Llama 4。藉由 Marketplace 的整合,開發者無需繁瑣的 API 設定即可開始使用最新模型。
Meta 正式於 Hugging Face 平台上架了備受矚目的 Llama 4 家族首批模型:Maverick 與 Scout。這標誌著開源大語言模型正式邁入 Llama 4 時代。雖然詳細技術細節仍待官方完整白皮書披露,但從命名來看,Scout 預期為輕量、高效率的「偵察型」模型,適合邊緣運算與 Agent 任務;而 Maverick 則可能是主打強大推理與複雜任務處理的「王牌」模型。這兩款模型的釋出將為開源社群注入全新動力。
Vercel 宣布為其 Observability Plus 監控工具推出新功能,開發者現在可以針對應用程式的日誌與指標執行自訂查詢。此外,這些查詢還可以輕鬆分享給團隊成員,大幅提升了除錯、效能分析與團隊協作的效率。
Hugging Face 發表文章慶祝旗下開源機器學習網頁介面庫 Gradio 的使用者正式突破 100 萬人。文章回顧了 Gradio 自創立以來的成長軌跡,如何透過極簡的 Python 程式碼讓開發者快速部署 AI 互動 Demo,並探討其在 Hugging Face 生態系中扮演的關鍵角色與未來展望。
知名時尚品牌 PAIGE 宣布透過將網站遷移至無頭電商(Headless Commerce)架構,成功讓營收成長 22%。該方案結合了 Shopify 的後端、Next.js 的前端框架以及 Vercel 的全球部署平台。此舉大幅提升了網頁載入速度與使用者體驗,進而優化轉換率,為現代電商技術轉型提供了極佳的成功範例。
Vercel 宣布其安全運算服務 Secure Compute 正式支援多個環境(如 Production、Preview 和 Development)。這項更新允許開發團隊在不同的部署階段,都能透過專屬的固定 IP 安全地連接到私有資料庫或內部 VPC,大幅提升了開發流程的安全防護與配置彈性。
Vercel 官方 Changelog 宣布正式推出雙重驗證 (2FA) 功能。開發者與團隊管理員現在可以在帳戶設定中啟用此功能,透過驗證器應用程式進行二次確認。這項安全更新將有效防止未授權的帳戶存取,保護敏感的部署專案、環境變數與網域設定,為開發流程提供更強大的安全保障。
Hugging Face 宣布將其廣受歡迎的經典「NLP 課程(NLP Course)」正式轉型並升級為「LLM 課程(LLM Course)」。這項轉變反映了 AI 領域從傳統 NLP(如 BERT、分類與命名實體識別)向大語言模型(如 Llama、生成式 AI、RAG 與 Agent)的典範轉移。新課程將全面更新,涵蓋現代 LLM 架構、微調(PEFT/LoRA)、對齊(RLHF/DPO)及應用開發,繼續提供免費且高品質的開源學習資源。
隨著大語言模型(LLM)應用的普及,如何在高併發流量下維持低延遲與高吞吐量成為關鍵挑戰。本文深入分析了 LLM 推論的記憶體瓶頸(特別是 KV Cache),並探討如何結合「連續批處理(Continuous Batching)」與「請求佇列(Request Queueing)」機制。透過在推論引擎層與網關層實施合理的佇列策略,能有效防止 GPU 記憶體溢位(OOM),並在維持高吞吐量的同時,優化首字延遲(TTFT)與字元間延遲(ITL)。
Vercel 於 Changelog 中發布了編號為 CVE-2025-30218 的安全漏洞公告。雖然目前具體漏洞細節與影響範圍尚未完全公開,但此類公告通常涉及 Vercel 平台、Next.js 或其相關 CLI 工具的安全修復。建議使用 Vercel 服務與 Next.js 的開發者密切關注官方更新,並將專案依賴升級至最新版本以確保系統安全。
Vercel 宣布其安全防護功能「Attack Challenge Mode(攻擊挑戰模式)」進行升級。過去開啟此模式防禦惡意流量時,可能會誤傷正常的自動化流量。現在,該模式已支援自動放行「已驗證的機器人」(如搜尋引擎爬蟲)以及「Vercel Cron Jobs」,確保網站在抵禦攻擊的同時,SEO 排名與後台定時任務不受影響。
Vercel 針對「可組合商務(Composable Commerce)」提供實戰指南,跳過行銷術語,深入探討如何將前端(Next.js)與多個獨立服務(CMS、支付、搜尋)整合。適合評估從單體架構轉型至現代解耦架構的開發團隊與決策者。
本文介紹如何利用開源影片生成模型 Wan2.1 搭配 LoRA 進行風格化影片生成。讀者可以透過 Replicate 平台,輕鬆將特定的藝術風格(如動漫、3D、特定畫風)應用於影片中。這項技術不僅降低了影片風格轉換的門檻,也為創作者提供了更豐富的視覺實驗空間。
Vercel 平台迎來重要更新,現在已正式支援 Yarn 2 及以上版本(Yarn Berry)的依賴項目快取。過去使用現代 Yarn 版本的專案在部署時可能無法完全享受快取優勢,此更新將自動快取相關依賴,顯著減少重複安裝的時間,進而加速整體 CI/CD 構建流程。
Vercel 發表 Flags SDK 3.2 更新。此 SDK 旨在幫助開發者在 Next.js 等前端應用中更安全、高效地管理 Feature Flags(功能旗標)。本次 3.2 版本著重於提升開發者體驗、優化 Edge Config 的讀取效能,並加強與 Vercel Toolbar 的整合,讓團隊能在瀏覽器中直接進行 Flag 的測試與覆寫。
本文深入探討 Hugging Face 如何解決大規模 AI 基礎設施中的金鑰(Secrets)管理挑戰。隨著 Spaces 與模型託管規模爆炸性成長,傳統存取面臨效能瓶頸。Hugging Face 透過架構升級、引入快取機制、信封加密以及與 Kubernetes 深度整合,實現了高併發、低延遲且符合高安全標準的金鑰分發系統。
Replicate 彙整了社群最新的創意 AI 模型與實驗專案。本次焦點包括:如何利用 AI 生成高品質且具一致性的個人頭像、趣味的光劍視覺特效應用,以及在平台上訓練與融合多個 LoRA 模型的實用技巧。這為設計師與開發者提供了豐富的視覺創作靈感與技術指引。
Hugging Face 宣布其文字生成推理(TGI)框架現已整合 Intel Gaudi 加速器後端。這項合作讓開發者能直接在 Intel Gaudi 2 和 Gaudi 3 晶片上部署高效能 LLM,並享有連續批處理(Continuous Batching)與張量並行(Tensor Parallelism)等優化技術。此舉為企業在 NVIDIA 之外,提供了一個極具成本效益且易於部署的 AI 推理硬體新選擇。
Hugging Face 釋出 Open R1 專案的第四次技術更新。本階段重點在於提升 TRL 框架中 GRPO(群體相對策略最佳化)的訓練效率與記憶體最佳化,並釋出針對數學與程式碼推理的全新合成資料集。團隊分享了在 Qwen 與 Llama 模型上進行強化學習(RL)訓練的最新評測結果,為開源社群複製 DeepSeek-R1 的推理能力提供更完整的實踐指南。
Hugging Face 釋出全新教學,詳細介紹如何利用 Sentence Transformers 庫訓練與微調 Reranker(重排)模型。Reranker 在 RAG 系統中扮演關鍵角色,能對初步檢索的文檔進行二次精準排序。本文涵蓋資料準備、損失函數選擇、訓練流程及評估方法,幫助開發者針對特定領域優化檢索效果。
Vercel 針對近期發現的 Next.js Middleware 繞過漏洞發布詳細事後分析(Postmortem)。該漏洞可能允許特定異常請求繞過中間件的安全檢查(如身分驗證與權限控管)。Vercel 已於平台端部署主動防護,並強烈呼籲所有 Next.js 開發者(特別是自託管用戶)儘速升級至最新安全版本。
Vercel 宣布在其 AI Gateway 服務中推出「自定義報告」功能。開發者現在可以針對 AI 應用的各項指標(如 Token 使用量、API 呼叫成本、延遲與錯誤率)建立專屬的數據圖表。這項更新大幅提升了 AI 應用的可觀測性與成本控管能力,特別適合需要精細化營運的多模型應用團隊。
Hugging Face 旗下的 Gradio 宣布推出全新設計的 Dataframe 元件。本次升級徹底解決了過去處理大數據時的卡頓問題,引入虛擬滾動技術,並新增了類似 Excel 的複製貼上、欄位排序、篩選與搜尋功能。此外,新版 Dataframe 還支援單元格內嵌富文本(如 Markdown 與圖片),為 AI 應用的數據展示與標註帶來極大便利。
Vercel 宣布其 Vercel Firewall 已針對 Next.js 的安全漏洞 CVE-2025-29927 部署了主動防禦措施。該防護透過 Middleware 機制實現,能自動保護託管於 Vercel 平台上的 Next.js 應用程式。這項更新讓開發者在尚未手動升級 Next.js 版本前,即可獲得即時的安全防護,降低被漏洞攻擊的風險。
Vercel 宣布其 Flags SDK 已支援 CNCF 旗下的 OpenFeature 開源標準。這項更新讓開發者能以標準化方式,在 Vercel 平台上整合各種功能旗標服務(如 LaunchDarkly、Split 等),有效避免供應商鎖定。透過統一的 API,前端與全端開發者能更彈性地管理功能發布與 A/B 測試。
Vercel 正式推出 AI SDK 4.2,專注於提升 Agentic(代理)開發體驗。此版本優化了多步驟工具調用(`maxSteps`)的控制、增強了 `streamObject` 的結構化數據輸出,並提供更完善的 OpenTelemetry 監控支援。同時,新版本也深化了與 React 19 和 Next.js 的整合,讓前端開發者能更輕鬆地構建高效、可觀測的 AI 應用。
Hugging Face 宣布為其託管式部署服務 Inference Endpoints 推出全新的分析(Analytics)儀表板。此更新帶來了更直觀且即時的數據視覺化,讓開發者能輕鬆監控請求量、延遲、Token 消耗與錯誤率。這項改進大幅提升了生產環境中 AI 模型的觀測性,有助於開發者進行效能調優與成本控制。