Vercel 宣布推出官方 TypeScript SDK,旨在簡化開發者與 Vercel REST API 的互動。該 SDK 提供完整的型別安全與 IDE 自動補全支援,讓開發者能輕鬆透過程式碼管理 Vercel 上的專案、部署、網域及環境變數。此外,SDK 還內建了自動重試與速率限制處理,大幅提升整合效率與穩定性。
Vercel 宣布與 AWS 達成合作,旨在為前端開發者提供更流暢的 AI 開發體驗。 雙方將 Amazon Bedrock 的模型庫與 Vercel AI SDK 進行深度整合,支援 Claude、Llama 等多款熱門模型。 此合作讓開發者能結合 AWS 的企業級安全基礎設施與 Vercel 的極致開發體驗,快速構建並擴展 AI 網頁應用。
Hugging Face 宣布推出由社群共同協作完成的文字生成圖像(Text-to-Image)開源偏好資料集。該資料集透過社群成員對不同 AI 生成圖像進行投票與評分,收集了大量人類真實偏好數據。這項開源資源將大幅降低開發者進行圖像生成模型 RLHF(人類回饋強化學習)或 DPO(直接偏好優化)的門檻,推動更具美感與對齊能力的開源圖像模型發展。
Hugging Face 宣布與 AWS 達成新合作,將其平台上的熱門開源模型整合至 Amazon Bedrock。開發者無需自行管理複雜的底層基礎設施,即可透過 Bedrock 的託管服務與 API 快速呼叫、部署並擴展 Hugging Face 上的模型。此舉大幅降低了企業在 AWS 生態系中使用開源 AI 模型的門檻,並簡化了計費與安全合規流程。
本文深入剖析 Vercel 處理用戶請求的完整生命週期。從 Anycast 路由、Layer 3/4/7 DDoS 防禦,到 WAF 防火牆規則與速率限制(Rate Limiting),Vercel 在 Edge 端即完成多重安全過濾。開發者無需複雜設定,即可享有企業級的安全防護與極致的載入效能。
Vercel 官方發布更新,調降了在其平台上購買與託管網域的價格。此舉旨在降低開發者與企業部署專案時的網域維護成本。用戶現在可以直接在 Vercel 儀表板中,以更具競爭力的價格進行網域的註冊、轉移與續約,進一步簡化了從開發到上線的完整工作流。
Google 發表全新一代輕量級視覺語言模型 PaliGemma 2,基於 SigLIP 視覺編碼器與 Gemma 2 文本解碼器。本次釋出包含 3B、10B 與 28B 三種參數規模,並提供多種輸入解析度(最高達 896x896)。PaliGemma 2 在圖像描述、視覺問答、目標檢測與文件理解等任務上表現優異,且已全面整合至 Hugging Face 生態系,支援快速微調與部署。
本文介紹了 Hugging Face、Keras 與 Google TPU 團隊合作的最新實驗,旨在評估大語言模型(LLM)在被指出錯誤後的「自我糾錯」能力。實驗採用類似 Chatbot Arena 的雙盲測試,利用 Keras 的多後端優勢與 TPU 的強大算力,測試多款開源模型。結果顯示,多數模型在沒有外部具體反饋的情況下,自我糾錯能力仍有極大提升空間。
Hugging Face 宣布推出針對阿拉伯語大語言模型(LLM)的全新評估基準「AraGen」及其排行榜。該基準採用創新的「3C3H」評估框架,從文化(Culture)、語境(Context)、能力(Capability)以及實用(Helpfulness)、誠實(Honesty)、無害(Harmlessness)六大維度進行評估。此舉旨在解決過去阿拉伯語評估過度依賴英文翻譯數據集、忽略在地文化與語言特性的問題,為多語言 AI 評估樹立新標竿。
Vercel 發布 2024 年黑色星期五與網路星期一(BFCM)的平台數據報告。在今年全球電商流量高峰期,Vercel 基礎設施成功處理了數十億次 HTTP 請求,並支撐了高達數十億美元的線上交易額。報告強調了其邊緣網路(Edge Network)的極致效能、Next.js 框架在現代電商的領導地位,以及 AI 技術在今年購物季中如何被更廣泛地應用於提升消費者體驗。
量化資產管理公司 CFM 與 Hugging Face 合作,探索如何在金融領域高效應用 AI。他們並未直接在生產環境部署昂貴的大型 LLM,而是利用大模型生成高質量的標註數據與洞察,進而微調專門的小型模型(SLM)。這種「知識蒸餾」策略不僅大幅降低了推理成本與延遲,還在特定金融 NLP 任務上保持了極高的準確度。
歐盟《AI 法案》(EU AI Act)已正式生效,Hugging Face 針對開源社群推出實用指南。文章釐清了開源模型在何種情況下可享有豁免(如釋出權重與架構),並指出當模型運算量超過 10^25 FLOPs 或被用於高風險領域時,開發者仍需承擔合規義務。此指南旨在幫助開源開發者在推動創新的同時,避免觸犯法律紅線。
Vercel 分享了一項電子商務的成功案例,指出某大型零售商在將網站遷移至 Vercel 平台後,帶來了高達 1,000 萬美元的銷售額增長。該案例強調了網頁載入速度、Core Web Vitals(網站核心指標)的改善,以及現代前端架構對電商轉換率與使用者體驗的直接巨大影響。這對於尋求提升業績的電商開發者與企業決策者具有高度參考價值。
網路基礎設施公司 Meter 透過 Vercel 和 Next.js 重構其前端架構。藉由 Vercel 的全球邊緣網路與 Next.js 的先進渲染與快取技術,他們成功將網站部署與頁面載入時間從原本的數分鐘縮短至僅需數秒。這項技術轉變不僅大幅提升了內部開發團隊的迭代效率與協作體驗,也為終端客戶帶來了極致流暢且快速的數位體驗,完美契合其網路基礎設施品牌的專業形象。
Hugging Face 發表全新輕量級視覺語言模型 SmolVLM(約 2.2B 參數),專為本機與邊緣設備設計。該模型結合了 SigLIP 視覺編碼器與 SmolLM2 語言模型,不僅支援多圖輸入與影片分析,在多項基準測試中更展現出媲美更大尺寸模型的性能。SmolVLM 採 Apache 2.0 開源授權,極低記憶體佔用使其成為開發者在終端裝置部署 VLM 的理想選擇。
AI 雲端託管平台 Replicate 宣布大幅提升 FLUX.1 圖像生成模型的微調(Fine-tuning)速度。透過底層優化,用戶現在能以極快的速度訓練出專屬的 FLUX LoRA 模型。最重要的是,Replicate 將這些優化技術與訓練程式碼完全開源,讓開發者不僅能在其平台上快速部署,也能在自己的硬體上實現高效訓練。
隨著託管的模型與數據集規模暴增,Hugging Face 傳統的 Git-LFS 架構面臨元數據處理緩慢和鎖定等瓶頸。為此,他們重構了上傳與下載架構,將文件存儲與 Git 解耦,改用自研的 HTTP 傳輸機制、Rust 編寫的 `hf-transfer` 工具,並優化 S3 直連與 CDN 緩存。這項變革大幅提升了數百 GB 級大模型與數百萬文件數據集的傳輸速度與穩定性。
本文剖析 Notion 如何利用 Vercel 的邊緣運算技術(Edge Middleware)重構其 A/B 測試與實驗系統。傳統用戶端測試易導致畫面閃爍(CLS)與載入延遲,而 Notion 將實驗分流邏輯移至邊緣端,實現極速的變體渲染,確保優異的 Core Web Vitals 效能,為大規模產品實驗提供強大支撐。
Hugging Face 釋出深度科普文章,帶領讀者從零開始設計 Transformer 的位置編碼。文章從傳統絕對位置編碼(APE)的缺陷出發,指出其無法應對長文本外推的痛點,進而引入相對位置編碼(RPE)的概念。最終,透過簡單的複數與 2D 旋轉矩陣,一步步推導出當前主流大模型(如 Llama、Mistral)標配的 RoPE(旋轉位置編碼),證明這項最先進技術其實符合直覺且人人都能推導出來。
Vercel 宣布正式支援 Node.js 22 LTS 版本。開發者現在可以在專案的構建過程以及 Serverless 函數(Functions)中採用此最新長期支援版本。這帶來了 V8 引擎升級、更好的 ESM 支援與效能提升,開發者只需在 package.json 中設定即可輕鬆升級。
Vercel 官方發布技術深度解析,揭秘一個 HTTP 請求如何穿過其全球邊緣網路(Edge Network)。內容涵蓋 Anycast DNS 路由、邊緣安全防護(WAF/DDoS)、Edge Middleware 的即時處理,以及如何高效調度靜態快取與區域性 Serverless 函數。這篇架構拆解能幫助開發者深入理解 Vercel 的底層運作,進而優化前端與 API 的載入效能。
Replicate 宣布為開源影像生成模型 FLUX.1 推出全新工具集「FLUX.1 Tools」。此更新引入了 Inpainting(局部重繪)、Outpainting(影像外繪)、Canny 邊緣檢測以及 Depth(深度圖)等控制功能。開發者與創作者現在可以透過 API 更精準地引導與修改 FLUX 生成的影像,解決了過去 FLUX 在精細控制與編輯上的痛點。
Vercel 宣布收購程式碼搜尋技術公司 Grep。此舉旨在將 Grep 的高速搜尋與程式碼理解技術整合至 Vercel 平台中,以提升開發者的工作流程效率。未來這項技術預期將加強 Vercel 在 AI 輔助開發(如 v0 等工具)上的程式碼檢索與分析能力。
Hugging Face 介紹了 Meta 的 LayerSkip 技術,該技術透過「自投機解碼(Self-Speculative Decoding)」來加速 LLM 推理。傳統投機解碼需要額外的草稿模型,而 LayerSkip 讓單一模型在推理時自我預測與驗證。透過在訓練時加入層丟棄與早期退出損失,模型能用前幾層快速生成草稿,再由完整模型驗證,顯著降低記憶體佔用並提升速度。
本文介紹了首屆多語言大型語言模型(LLM)辯論賽。傳統的靜態評估方法(如多選題)已難以衡量模型的深層推理與說服力,因此研究人員設計了讓模型針對特定議題進行多輪多語言辯論的機制。透過這種動態對抗,不僅能更精準地評估模型在非英語環境下的邏輯一致性,也為 LLM 的安全性和對齊(Alignment)提供了全新的評估維度。
Hugging Face 發表全新的儲存優化方案,將傳統的檔案級儲存(如 Git LFS)轉型為「分塊儲存(Chunk-based Storage)」。透過內容定義分塊(CDC)與內容定址儲存(CAS)技術,Hub 能跨儲存庫進行資料去重。這對於微調(Fine-tune)與合併(Merge)模型的儲存能節省極大空間,並顯著加快上傳與下載速度。
Hugging Face 宣布推出專為日語設計的「開放式日語 LLM 排行榜」。該排行榜旨在解決現有英文基準無法準確評估日語能力的問題,採用了多個日語標準評測數據集。這將為開發者與研究人員提供一個公開、透明且可重複驗證的平台,用以評估與比較各類開源日語大語言模型的表現。
Hugging Face 與 AI 評估新創公司 Atla 合作推出「Judge Arena」基準測試。該項目旨在解決「LLM 作為裁判(LLM-as-a-judge)」時常見的偏見與失真問題,透過與人類專家評分進行對齊,系統化評估各家大模型在擔任裁判時的表現,為 AI 評估自動化提供更具公信力的參考標準。
Vercel 推出 AI SDK 4.0,帶來重大架構變革。本次更新宣布將舊有的 React Server Components (RSC) 方案列為棄用,改為推薦使用更簡單、穩定的 AI SDK Core(如 streamText)與 AI SDK UI(如 useChat)組合。此外,新版本全面整合了 OpenTelemetry 監控,並優化了多模態與工具調用(Tool Calling)的開發體驗。
Vercel 宣布更新其合作夥伴計畫(Partner Program),旨在為代理商、系統整合商及技術合作夥伴提供更強大的支持。本次更新重點在於加速合作夥伴的成功,提供包括更豐富的技術培訓、共同行銷機會以及專屬的技術支援。這將有助於合作夥伴更高效地為客戶構建現代化 Web 應用,並藉由 Vercel 的生態系統拓展業務藍圖。