Vercel 近期進行了核心資料庫的容錯移轉(Failover)演練,旨在測試極端故障發生時系統的韌性。本次測試模擬了主資料庫失效的情境,驗證自動切換至備份資料庫的流暢度。文章詳細記錄了準備工作、執行過程中的連線池調整、應用程式重試機制,以及最終達成的低中斷時間,為現代雲端架構提供了寶貴的災難復原實踐經驗。對於依賴 Vercel 託管服務的開發者而言,這展現了其基礎設施的穩定性。
Vercel 推出全新基礎設施技術「Fluid」,旨在解決傳統 Serverless 架構的冷啟動與執行時間限制。Fluid 透過創新的微型虛擬化與動態資源調配技術,讓開發者能以 Serverless 的方式部署應用,卻能享有如傳統常駐伺服器(Server)般的持續連線、極低延遲與狀態保持能力,重新定義了現代雲端網頁應用的部署標準。
Hugging Face 宣布將其平台(Hub)的底層大檔案版本控制系統從 Git LFS 遷移至 Xet 技術。Git LFS 在面對數百 GB 的模型與超大數據集時常遇到效能瓶頸,而 Xet 透過「內容定義分塊(CDC)」技術實現區塊級去重,能顯著減少儲存空間並加速上傳與下載。此遷移將為開發者帶來更流暢的超大型 AI 資產管理體驗。
Vercel 宣布其物件儲存服務 Vercel Blob 已在所有 Vercel 區域正式啟用。開發者現在可以將 Blob 儲存庫部署在與其 Serverless 函數相同的區域,從而大幅降低資料讀寫延遲。此更新也讓團隊能更輕鬆地滿足特定地區的資料合規性與隱私要求。
Hugging Face 分享了其生產環境基礎設施賴以維持高可用性的三大核心警報機制。面對託管數百萬個模型與數據集的挑戰,Hugging Face 的運維團隊詳細解析了他們如何針對「模型緩存磁碟空間」、「Kubernetes GPU 資源調度瓶頸」以及「基於 SLO 的錯誤預算消耗」進行監控與預警。這些實務經驗對於運行大規模 AI 服務與雲端基礎設施的 MLOps 與 SRE 工程師極具參考價值。
Vercel 針對採用 Fluid compute 的 Vercel Functions 推出升級,調高了預設的資源配置與上限額度。這項更新讓開發者在部署無伺服器(Serverless)應用時,能獲得更高的記憶體、執行時間等運算資源,特別有利於需要高運算能力的 AI 應用或複雜的後端邏輯,且無需繁瑣的手動配置。
Vercel 官方宣布推出全新的杜拜區域(代號 dxb1)。這項更新讓開發者可以將 Serverless Functions 部署在更靠近中東用戶的地理位置,顯著降低該地區的網路延遲並提升應用程式效能。對於在中東市場有業務佈局的企業與開發者而言,這是一個重要的基礎設施升級。
Hugging Face 全新推出 Kernel Hub(hf-kernels),旨在解決深度學習自訂算子碎片化的問題。開發者現在可以像分享模型一樣,在平台上發布、版本控制與下載優化過的 CUDA 或 Triton 算子。這項工具能透過簡單的 API 實現動態編譯與載入,大幅簡化模型推理與訓練的硬體加速流程,是 AI 系統優化工程師的全新利器。
Hugging Face 宣布與 NVIDIA 合作推出「訓練集群即服務」(Training Cluster as a Service)。這項新服務旨在簡化大規模 AI 模型的訓練流程,讓企業與開發者無需處理繁雜的基礎設施設定,即可直接在 Hugging Face 平台上租用由 NVIDIA 技術支援的高效能 GPU 運算集群,快速進行模型微調與訓練。
Vercel 宣布優化其 Edge Network 的代理機制。當開發者使用 Vercel CDN 將請求重定向或代理(Proxy)至外部源伺服器(如 AWS、自建伺服器)時,新機制能顯著降低延遲並提高傳輸速度。此更新無需手動設定,將自動套用於所有 Vercel 專案,有效改善混合雲或漸進式遷移架構的效能。
AI 雲端託管平台 Replicate 宣布正式支援 NVIDIA H100 GPU。這項硬體升級將為平台用戶帶來顯著的效能提升,並透過縮短運算時間來降低實際使用成本。對於需要在雲端高效運行或微調開源模型的開發者與研究人員而言,這是一個高性價比的新選擇。
Vercel 宣布將其 CDN 來源伺服器逾時(Origin Timeout)限制提高至 2 分鐘(120 秒)。此調整能有效減少因後端處理時間較長而導致的 504 Gateway Timeout 錯誤,特別利於需要長時間運算的 AI 模型推論、影像生成及複雜數據處理等應用場景,提升開發者部署長任務應用的彈性。
Vercel 宣布其新一代「Fluid Compute」架構現已成為所有新建立專案的預設選項。Fluid Compute 旨在解決傳統 Serverless 的冷啟動延遲與資源配置僵化問題,透過動態資源調度提升執行效率。這項更新讓開發者無需手動設定,即可自動享有更流暢、高效且具成本效益的雲端運算與串流體驗。
Vercel 深入解析一個 HTTP 請求在其平台上的生命週期,重點介紹「應用程式感知路由(Application-aware routing)」技術。該技術讓邊緣路由層能理解應用程式的框架特性(如 Next.js 的 ISR 與 Server Actions),並提供部署傾斜保護(Skew Protection),確保新舊版本交替時用戶體驗不中斷。這項架構升級大幅提升了現代 Web 應用的效能與穩定性。
本期 AINews 指出這幾天 AI 領域相對平靜,並無重大新聞發布。編輯特別推薦讀者收聽 Latent.Space 最新釋出的節目,內容聚焦於 SF Compute 以及 GPU 新興雲端服務(Neocloud)的發展與討論。這對於關注 AI 算力基礎設施、GPU 租賃市場與雲端運算趨勢的開發者與創業者來說,是相當值得參考的產業情報。
本文深入探討 Hugging Face 如何解決大規模 AI 基礎設施中的金鑰(Secrets)管理挑戰。隨著 Spaces 與模型託管規模爆炸性成長,傳統存取面臨效能瓶頸。Hugging Face 透過架構升級、引入快取機制、信封加密以及與 Kubernetes 深度整合,實現了高併發、低延遲且符合高安全標準的金鑰分發系統。
Hugging Face 宣布將先前收購的 XetHub 技術(Xet)正式整合至 Hugging Face Hub。此整合旨在解決傳統 Git LFS 在處理超大型檔案與數百萬小檔案時的效能瓶頸。透過 Xet 的區塊級去重與隨選載入技術,開發者能以極快速度進行大檔案的 Git 版本控制、複製與推送,大幅提升機器學習工作流效率。
Vercel 發表「Fluid Compute」技術細節,這是一種新型的無伺服器(Serverless)運算架構。它解決了傳統 Serverless 的冷啟動、固定記憶體配置與執行時間限制等痛點。透過動態且彈性的資源調配,Fluid Compute 能在毫秒內根據請求負載自動調整 CPU 與記憶體,特別適合需要長連接、串流輸出及高運算需求的 AI Agent 和 LLM 應用。
Vercel 宣布其無伺服器函式(Vercel Functions)現在可以運行在全新的 Fluid Compute 架構上。這項更新旨在大幅降低冷啟動延遲、提升執行效率,並提供更具彈性的資源調度。開發者無需修改程式碼,即可享受更流暢、接近零延遲的伺服器端渲染與 API 回應體驗。
Vercel 發表全新「Fluid Compute」運算架構,完美融合了 Serverless 的自動縮放彈性與傳統伺服器的持久連線能力。它解決了冷啟動延遲與執行時間限制,原生支援 WebSockets、串流傳輸及背景非同步任務,為現代 Web 與 AI 應用提供更流暢、無妥協的部署體驗。
隨著託管的模型與數據集規模暴增,Hugging Face 傳統的 Git-LFS 架構面臨元數據處理緩慢和鎖定等瓶頸。為此,他們重構了上傳與下載架構,將文件存儲與 Git 解耦,改用自研的 HTTP 傳輸機制、Rust 編寫的 `hf-transfer` 工具,並優化 S3 直連與 CDN 緩存。這項變革大幅提升了數百 GB 級大模型與數百萬文件數據集的傳輸速度與穩定性。
Hugging Face 發表全新的儲存優化方案,將傳統的檔案級儲存(如 Git LFS)轉型為「分塊儲存(Chunk-based Storage)」。透過內容定義分塊(CDC)與內容定址儲存(CAS)技術,Hub 能跨儲存庫進行資料去重。這對於微調(Fine-tune)與合併(Merge)模型的儲存能節省極大空間,並顯著加快上傳與下載速度。
本文深入探討 Vercel 的請求生命週期。當使用者按下 Enter,請求首先透過 Anycast DNS 路由至最近的邊緣節點(PoP)進行安全驗證與路由決策。接著,根據規則,請求可能直接命中邊緣快取,或觸發運行於 V8 的 Edge Functions,亦或喚醒 AWS Lambda 上的 Serverless Functions。最後,結合 ISR 靜態再生與串流技術,將最快的響應回傳給使用者。這是一篇前端與維運工程師必讀的底層架構解析。
隨著 2024 年美國大選臨近,頂尖新聞機構正積極升級其網路基礎設施。Vercel 分享了主流媒體如何利用其邊緣網路(Edge Network)與 Next.js 的 ISR 技術,在面對大選開票夜的極端流量暴增時,依然能提供即時、穩定的開票數據與新聞報導,確保網站不會因過載而癱瘓,實現高可用性的現代 Web 架構。
Vercel 發表了其下一代建置基礎架構「Hive」的技術細節。Hive 解決了每日數百萬次建置面臨的隔離性、速度與資源利用率挑戰。透過採用基於 Firecracker 的微型虛擬機器(microVMs)技術,Hive 實現了毫秒級的啟動速度與強大的安全隔離,並結合智慧調度演算法,顯著優化了快取命中率與建置效率,為現代 Web 與 AI 應用提供更穩健的部署支援。
Upstash 正式上架 Vercel Marketplace,讓開發者能直接在 Vercel 平台中啟用並管理 Serverless Redis、Kafka 和 QStash 服務。此整合支援免設定(Zero-config)自動帶入環境變數,並將費用合併至 Vercel 帳單。這對於需要快取、速率限制(Rate Limiting)或異步任務處理的 Vercel 與 Next.js 開發者來說是一大便利。
Vercel 針對 2024 年 8 月 7 日發生的嚴重服務中斷發表官方說明。該事件導致全球許多託管於 Vercel 的網站出現 502 錯誤,儀表板與部署功能也受到波及。調查指出,起因是邊緣網路在進行例行配置更新時發生異常。Vercel 已完成回滾並承諾將加強網路配置的漸進式部署與監控機制。
Hugging Face 宣布收購專注於大規模資料版本控制的新創公司 XetHub。XetHub 的技術能讓 Git 輕鬆擴展並管理數 PB 級的資料集與機器學習模型,解決傳統 Git LFS 的效能瓶頸。此收購將幫助 Hugging Face 升級其基礎設施,為全球開發者提供更流暢、高效的大型 AI 資產協作與版本控制體驗。
Mintlify 作為領先的 docs-as-code 平台,需要為數千家客戶託管高流量且具備自訂網域的技術文件。 透過 Vercel 的 Edge 網路、增量靜態生成(ISR)以及強大的自訂網域 API,Mintlify 實現了極致的載入速度與無縫的部署體驗。 本案例研究展示了 Vercel 如何協助新創團隊專注於產品核心功能,同時輕鬆應對大規模擴展與全球分發的基礎設施挑戰。
Vercel 宣布為動態前端提供無縫的高可用性(HA)支援。當底層基礎設施(如 AWS 區域)發生故障時,Vercel 的路由層會自動將動態請求(如 Serverless Functions)重導向至其他健康區域。這項升級讓開發者無需編寫複雜的容災代碼或配置多區域負載平衡,即可享有企業級的彈性與穩定性。