Vercel 宣布其 Remote Cache(遠端快取)功能現已完全免費開放。此功能可讓團隊成員與 CI/CD 共享構建快取,避免重複編譯。過去此功能有額度限制或需付費,現在 Hobby 與 Pro 方案皆可免費使用,特別適合使用 Turborepo 的開發團隊降低成本並提升效率。
Hugging Face 發表了「Big Bench Audio」基準測試,旨在評估多模態模型在音訊領域的推理能力。傳統評估多著重於語音辨識(ASR),而此基準則涵蓋語音、音樂、環境音等多元任務,考驗模型進行邏輯推理與情境理解的深度。這項開源工具將協助開發者與研究人員更精準地衡量語音大模型的實際應用實力。
Hugging Face 與 LightOn 等團隊聯合推出 ModernBERT,旨在取代已問世 6 年但仍被廣泛使用的 BERT 模型。ModernBERT 採用現代化架構,將上下文長度從 512 提升至 8192 標記,並原生支援 FlashAttention-2 與 RoPE。在保持極高推理速度與低記憶體佔用的同時,其在檢索、分類與嵌入等任務上的表現全面超越 DeBERTa-v3,為 RAG 與搜尋系統注入全新動力。
Vercel 宣布優化其安全建置基礎架構。透過結合 Secure Compute,企業用戶現在可以在 Vercel 建置階段中,安全地存取位於私有網路(如 VPC)中的資源,例如私有套件庫或內部 API。這項更新大幅提升了企業級專案在 CI/CD 過程中的安全防護與連線效率。
Hugging Face 聯合普林斯頓大學、Together AI 等機構,正式開源了「Bamba-9B」模型。該模型採用 Mamba-2 狀態空間模型(SSM)與 Transformer 注意力機制的混合架構(1:7 比例)。在保有與同量級純 Transformer 模型(如 Llama 3)相當性能的同時,顯著降低了長文本推論時的記憶體佔用與延遲,並以 Apache 2.0 協議開源,為長文本應用提供高效的新選擇。
隨著 AI 搜尋與 LLM 的普及,AI 爬蟲(如 GPTBot、ClaudeBot)的流量在 2024 年呈現爆發式成長。這不僅帶來了伺服器成本上升與資料被無償抓取的隱憂,也改變了傳統的 SEO 遊戲規則。Vercel 在本文中深入分析了這股趨勢,並分享開發者如何透過 robots.txt、Vercel 防火牆與 Edge Middleware 來有效監控、限制或阻擋這些 AI 爬蟲,在保護網站資產與獲取 AI 搜尋曝光之間取得平衡。
Hugging Face 發布在 Google Cloud Platform (GCP) 全新 C4 執行個體上運行語言模型的效能評測。C4 搭載第五代 Intel Xeon 可擴充處理器,內建 Intel AMX 加速技術。測試顯示,透過 Optimum Intel 與 IPEX 優化,CPU 在中小型開源模型(如 Llama 3)的推論上展現出極佳的延遲表現與高性價比,為 GPU 短缺或預算有限的企業提供強大的替代方案。
阿布達比技術創新研究所(TII)正式發布 Falcon 3 系列開源模型,提供 1B、3B、7B 及 10B MoE 等多種參數規格。Falcon 3 在多項基準測試中表現優異,其 7B 版本在性能上甚至超越了 Llama 3.1 8B 與 Gemma 2 9B。此系列模型對硬體友善,極適合邊緣運算與本地部署,並已深度整合至 Hugging Face 生態系統。
Hugging Face 發表「Synthetic Data Generator」工具,旨在降低 AI 模型訓練資料集的構建門檻。用戶只需用自然語言描述需求,系統便會利用 distilabel 框架與開源大模型(如 Llama 3.1)自動生成高品質的指令微調(SFT)或偏好對齊(DPO)資料集。生成的資料可直接上傳至 Hugging Face Hub,並支援匯出至 Argilla 進行人工標註與微調。
Replicate 指出,AI 影片生成領域正經歷類似當年 Stable Diffusion 顛覆圖像生成的「開源時刻」。 目前市場上已出現多款效果足以媲美 OpenAI Sora 的開源影片生成模型。 這意味著開發者與創作者不再受限於封閉的 API,能以更低成本、更高自由度在本地或雲端部署高品質影片生成。
Vercel 宣布其觀測性(Observability)功能正式全面開放(GA)。此版本帶來了原生的 OpenTelemetry 支援,讓開發者能輕鬆將追蹤與指標導出至第三方工具。同時,升級後的運行時日誌(Runtime Logs)、日誌流(Log Drains)以及速度洞察(Speed Insights),為 Next.js 及其他前端框架應用提供了全方位的即時監控能力。
Vercel 於官方更新中宣布,將大幅調降其 Monitoring(監控)服務的定價,最高降幅達 87%。這項調整旨在降低 Web 應用的可觀測性(Observability)成本,讓開發者與企業能以更實惠的價格,即時掌握應用的效能、錯誤與流量狀況,進而優化使用者體驗。
Vercel 釋出技術審計(Technical Audits)指南,針對企業級 Web 應用提供系統化的優化框架。內容深入探討如何透過快取策略與資源管理降低 Vercel 帳單成本、利用 Core Web Vitals 指標與 Edge 技術提升網頁載入效能,以及優化 CI/CD 建置流程以釋放開發團隊生產力,是前端架構師與維運人員的實用參考。
美國知名自助倉儲業者 Extra Space Storage 擁有數千個據點網頁。在遷移至 Vercel 平台後,其網站建置時間大幅縮短了 17 倍。這項轉變不僅解決了過去因靜態頁面過多導致建置緩慢的痛點,更透過 Vercel 的優化基礎設施與快取機制,實現了近乎即時的內容更新,顯著提升了開發團隊的部署效率與企業的市場競爭力。
Vercel 宣布推出「自訂環境 (Custom Environments)」功能,打破以往僅限 Production、Preview 和 Development 三種環境的限制。現在開發團隊可以自由建立如 Staging、UAT 或 QA 等自訂環境,並為其配置專屬的環境變數、網域與 Git 分支,大幅提升中大型專案的部署與測試工作流彈性。
Vercel 宣布對其防火牆(Vercel Firewall)進行重大升級,現在阻擋 DDoS 攻擊的速度比以往快上 40 倍。此更新旨在更即時地識別並攔截惡意流量,保護部署在 Vercel 上的應用程式免受服務中斷影響。這不僅提升了網站的安全性與可用性,也能有效避免開發者因突發惡意流量而面臨高昂的帳單衝擊。
Hugging Face 宣布推出「LeMaterial」開源倡議,旨在降低材料科學領域的 AI 應用門檻。該項目整合了大規模材料數據集、先進的機器學習模型(如圖神經網路 GNN)以及標準化的評估基準。透過將這些資源託管於 Hugging Face 平台,LeMaterial 將促進全球研究人員協作,大幅縮短新材料的研發週期。
Vercel 宣布推出官方 TypeScript SDK,旨在簡化開發者與 Vercel REST API 的互動。該 SDK 提供完整的型別安全與 IDE 自動補全支援,讓開發者能輕鬆透過程式碼管理 Vercel 上的專案、部署、網域及環境變數。此外,SDK 還內建了自動重試與速率限制處理,大幅提升整合效率與穩定性。
Vercel 宣布 Nile 與 MotherDuck 正式上架其 Marketplace。Nile 是專為 SaaS 設計的無伺服器多租戶 Postgres 資料庫,而 MotherDuck 則是基於 DuckDB 的雲端協作分析平台。這項整合讓 Vercel 開發者能更輕鬆地在專案中配置、連接並管理這兩款現代資料庫服務,加速 SaaS 與數據分析應用的開發流程。
Vercel 宣布與 AWS 達成合作,旨在為前端開發者提供更流暢的 AI 開發體驗。 雙方將 Amazon Bedrock 的模型庫與 Vercel AI SDK 進行深度整合,支援 Claude、Llama 等多款熱門模型。 此合作讓開發者能結合 AWS 的企業級安全基礎設施與 Vercel 的極致開發體驗,快速構建並擴展 AI 網頁應用。
Hugging Face 宣布與 AWS 達成新合作,將其平台上的熱門開源模型整合至 Amazon Bedrock。開發者無需自行管理複雜的底層基礎設施,即可透過 Bedrock 的託管服務與 API 快速呼叫、部署並擴展 Hugging Face 上的模型。此舉大幅降低了企業在 AWS 生態系中使用開源 AI 模型的門檻,並簡化了計費與安全合規流程。
Hugging Face 宣布推出由社群共同協作完成的文字生成圖像(Text-to-Image)開源偏好資料集。該資料集透過社群成員對不同 AI 生成圖像進行投票與評分,收集了大量人類真實偏好數據。這項開源資源將大幅降低開發者進行圖像生成模型 RLHF(人類回饋強化學習)或 DPO(直接偏好優化)的門檻,推動更具美感與對齊能力的開源圖像模型發展。
本文深入剖析 Vercel 處理用戶請求的完整生命週期。從 Anycast 路由、Layer 3/4/7 DDoS 防禦,到 WAF 防火牆規則與速率限制(Rate Limiting),Vercel 在 Edge 端即完成多重安全過濾。開發者無需複雜設定,即可享有企業級的安全防護與極致的載入效能。
Vercel 官方發布更新,調降了在其平台上購買與託管網域的價格。此舉旨在降低開發者與企業部署專案時的網域維護成本。用戶現在可以直接在 Vercel 儀表板中,以更具競爭力的價格進行網域的註冊、轉移與續約,進一步簡化了從開發到上線的完整工作流。
本文介紹了 Hugging Face、Keras 與 Google TPU 團隊合作的最新實驗,旨在評估大語言模型(LLM)在被指出錯誤後的「自我糾錯」能力。實驗採用類似 Chatbot Arena 的雙盲測試,利用 Keras 的多後端優勢與 TPU 的強大算力,測試多款開源模型。結果顯示,多數模型在沒有外部具體反饋的情況下,自我糾錯能力仍有極大提升空間。
Google 發表全新一代輕量級視覺語言模型 PaliGemma 2,基於 SigLIP 視覺編碼器與 Gemma 2 文本解碼器。本次釋出包含 3B、10B 與 28B 三種參數規模,並提供多種輸入解析度(最高達 896x896)。PaliGemma 2 在圖像描述、視覺問答、目標檢測與文件理解等任務上表現優異,且已全面整合至 Hugging Face 生態系,支援快速微調與部署。
Hugging Face 宣布推出針對阿拉伯語大語言模型(LLM)的全新評估基準「AraGen」及其排行榜。該基準採用創新的「3C3H」評估框架,從文化(Culture)、語境(Context)、能力(Capability)以及實用(Helpfulness)、誠實(Honesty)、無害(Harmlessness)六大維度進行評估。此舉旨在解決過去阿拉伯語評估過度依賴英文翻譯數據集、忽略在地文化與語言特性的問題,為多語言 AI 評估樹立新標竿。
Vercel 發布 2024 年黑色星期五與網路星期一(BFCM)的平台數據報告。在今年全球電商流量高峰期,Vercel 基礎設施成功處理了數十億次 HTTP 請求,並支撐了高達數十億美元的線上交易額。報告強調了其邊緣網路(Edge Network)的極致效能、Next.js 框架在現代電商的領導地位,以及 AI 技術在今年購物季中如何被更廣泛地應用於提升消費者體驗。
量化資產管理公司 CFM 與 Hugging Face 合作,探索如何在金融領域高效應用 AI。他們並未直接在生產環境部署昂貴的大型 LLM,而是利用大模型生成高質量的標註數據與洞察,進而微調專門的小型模型(SLM)。這種「知識蒸餾」策略不僅大幅降低了推理成本與延遲,還在特定金融 NLP 任務上保持了極高的準確度。
歐盟《AI 法案》(EU AI Act)已正式生效,Hugging Face 針對開源社群推出實用指南。文章釐清了開源模型在何種情況下可享有豁免(如釋出權重與架構),並指出當模型運算量超過 10^25 FLOPs 或被用於高風險領域時,開發者仍需承擔合規義務。此指南旨在幫助開源開發者在推動創新的同時,避免觸犯法律紅線。