Latest in AI

← Home

🔥 Trending today

ai-infrastructure6 apple4 ai-safety4 data-centers3 anthropic3 enterprise-ai3 supply-chain3 taiwan3 ipo2 compute2

Topic

Release New Tool Tutorial Business Paper Benchmark Opinion Regulation

For

General Developers Designers Product Founders Marketing Researchers Students

Investing in Performance: Fine-tune small models with LLM insights - a CFM case study★ 75
Hugging Face Blog549d agoBusiness
量化資產管理公司 CFM 與 Hugging Face 合作，探索如何在金融領域高效應用 AI。他們並未直接在生產環境部署昂貴的大型 LLM，而是利用大模型生成高質量的標註數據與洞察，進而微調專門的小型模型（SLM）。這種「知識蒸餾」策略不僅大幅降低了推理成本與延遲，還在特定金融 NLP 任務上保持了極高的準確度。
Open Source Developers Guide to the EU AI Act★ 75
Hugging Face Blog550d agoTutorial
歐盟《AI 法案》（EU AI Act）已正式生效，Hugging Face 針對開源社群推出實用指南。文章釐清了開源模型在何種情況下可享有豁免（如釋出權重與架構），並指出當模型運算量超過 10^25 FLOPs 或被用於高風險領域時，開發者仍需承擔合規義務。此指南旨在幫助開源開發者在推動創新的同時，避免觸犯法律紅線。
Retailer sees $10M increase in sales on Vercel
Vercel Changelog555d agoBusiness
Vercel 分享了一項電子商務的成功案例，指出某大型零售商在將網站遷移至 Vercel 平台後，帶來了高達 1,000 萬美元的銷售額增長。該案例強調了網頁載入速度、Core Web Vitals（網站核心指標）的改善，以及現代前端架構對電商轉換率與使用者體驗的直接巨大影響。這對於尋求提升業績的電商開發者與企業決策者具有高度參考價值。
From minutes to seconds: How Meter accelerates delivery with Vercel and Next.js
Vercel Changelog556d agoBusiness
網路基礎設施公司 Meter 透過 Vercel 和 Next.js 重構其前端架構。藉由 Vercel 的全球邊緣網路與 Next.js 的先進渲染與快取技術，他們成功將網站部署與頁面載入時間從原本的數分鐘縮短至僅需數秒。這項技術轉變不僅大幅提升了內部開發團隊的迭代效率與協作體驗，也為終端客戶帶來了極致流暢且快速的數位體驗，完美契合其網路基礎設施品牌的專業形象。
FLUX fine-tunes are now fast★ 75
Replicate Blog556d agoRelease
AI 雲端託管平台 Replicate 宣布大幅提升 FLUX.1 圖像生成模型的微調（Fine-tuning）速度。透過底層優化，用戶現在能以極快的速度訓練出專屬的 FLUX LoRA 模型。最重要的是，Replicate 將這些優化技術與訓練程式碼完全開源，讓開發者不僅能在其平台上快速部署，也能在自己的硬體上實現高效訓練。
Rearchitecting Hugging Face Uploads and Downloads★ 75
Hugging Face Blog556d agoRelease
隨著託管的模型與數據集規模暴增，Hugging Face 傳統的 Git-LFS 架構面臨元數據處理緩慢和鎖定等瓶頸。為此，他們重構了上傳與下載架構，將文件存儲與 Git 解耦，改用自研的 HTTP 傳輸機制、Rust 編寫的 `hf-transfer` 工具，並優化 S3 直連與 CDN 緩存。這項變革大幅提升了數百 GB 級大模型與數百萬文件數據集的傳輸速度與穩定性。
SmolVLM - small yet mighty Vision Language Model★ 80
Hugging Face Blog556d agoRelease
Hugging Face 發表全新輕量級視覺語言模型 SmolVLM（約 2.2B 參數），專為本機與邊緣設備設計。該模型結合了 SigLIP 視覺編碼器與 SmolLM2 語言模型，不僅支援多圖輸入與影片分析，在多項基準測試中更展現出媲美更大尺寸模型的性能。SmolVLM 採 Apache 2.0 開源授權，極低記憶體佔用使其成為開發者在終端裝置部署 VLM 的理想選擇。
How Notion powers rapid and performant experimentation
Vercel Changelog557d agoCommentary
本文剖析 Notion 如何利用 Vercel 的邊緣運算技術（Edge Middleware）重構其 A/B 測試與實驗系統。傳統用戶端測試易導致畫面閃爍（CLS）與載入延遲，而 Notion 將實驗分流邏輯移至邊緣端，實現極速的變體渲染，確保優異的 Core Web Vitals 效能，為大規模產品實驗提供強大支撐。
You could have designed state of the art positional encoding★ 75
Hugging Face Blog557d agoTutorial
Hugging Face 釋出深度科普文章，帶領讀者從零開始設計 Transformer 的位置編碼。文章從傳統絕對位置編碼（APE）的缺陷出發，指出其無法應對長文本外推的痛點，進而引入相對位置編碼（RPE）的概念。最終，透過簡單的複數與 2D 旋轉矩陣，一步步推導出當前主流大模型（如 Llama、Mistral）標配的 RoPE（旋轉位置編碼），證明這項最先進技術其實符合直覺且人人都能推導出來。
Node.js 22 LTS is now generally available for builds and functions
Vercel Changelog560d agoRelease
Vercel 宣布正式支援 Node.js 22 LTS 版本。開發者現在可以在專案的構建過程以及 Serverless 函數（Functions）中採用此最新長期支援版本。這帶來了 V8 引擎升級、更好的 ESM 支援與效能提升，開發者只需在 package.json 中設定即可輕鬆升級。
Life of a Vercel request: Navigating the Edge Network
Vercel Changelog561d agoTutorial
Vercel 官方發布技術深度解析，揭秘一個 HTTP 請求如何穿過其全球邊緣網路（Edge Network）。內容涵蓋 Anycast DNS 路由、邊緣安全防護（WAF/DDoS）、Edge Middleware 的即時處理，以及如何高效調度靜態快取與區域性 Serverless 函數。這篇架構拆解能幫助開發者深入理解 Vercel 的底層運作，進而優化前端與 API 的載入效能。
FLUX.1 Tools – Control and steerability for FLUX★ 75
Replicate Blog561d agoRelease
Replicate 宣布為開源影像生成模型 FLUX.1 推出全新工具集「FLUX.1 Tools」。此更新引入了 Inpainting（局部重繪）、Outpainting（影像外繪）、Canny 邊緣檢測以及 Depth（深度圖）等控制功能。開發者與創作者現在可以透過 API 更精準地引導與修改 FLUX 生成的影像，解決了過去 FLUX 在精細控制與編輯上的痛點。
Vercel acquires Grep to accelerate code search★ 75
Vercel Changelog562d agoBusiness
Vercel 宣布收購程式碼搜尋技術公司 Grep。此舉旨在將 Grep 的高速搜尋與程式碼理解技術整合至 Vercel 平台中，以提升開發者的工作流程效率。未來這項技術預期將加強 Vercel 在 AI 輔助開發（如 v0 等工具）上的程式碼檢索與分析能力。
Letting Large Models Debate: The First Multilingual LLM Debate Competition★ 75
Hugging Face Blog562d agoRelease
本文介紹了首屆多語言大型語言模型（LLM）辯論賽。傳統的靜態評估方法（如多選題）已難以衡量模型的深層推理與說服力，因此研究人員設計了讓模型針對特定議題進行多輪多語言辯論的機制。透過這種動態對抗，不僅能更精準地評估模型在非英語環境下的邏輯一致性，也為 LLM 的安全性和對齊（Alignment）提供了全新的評估維度。
Introducing the Open Leaderboard for Japanese LLMs!★ 75
Hugging Face Blog562d agoNew Tool
Hugging Face 宣布推出專為日語設計的「開放式日語 LLM 排行榜」。該排行榜旨在解決現有英文基準無法準確評估日語能力的問題，採用了多個日語標準評測數據集。這將為開發者與研究人員提供一個公開、透明且可重複驗證的平台，用以評估與比較各類開源日語大語言模型的表現。
Faster Text Generation with Self-Speculative Decoding★ 78
Hugging Face Blog562d agoRelease
Hugging Face 介紹了 Meta 的 LayerSkip 技術，該技術透過「自投機解碼（Self-Speculative Decoding）」來加速 LLM 推理。傳統投機解碼需要額外的草稿模型，而 LayerSkip 讓單一模型在推理時自我預測與驗證。透過在訓練時加入層丟棄與早期退出損失，模型能用前幾層快速生成草稿，再由完整模型驗證，顯著降低記憶體佔用並提升速度。
From Files to Chunks: Improving HF Storage Efficiency★ 75
Hugging Face Blog562d agoRelease
Hugging Face 發表全新的儲存優化方案，將傳統的檔案級儲存（如 Git LFS）轉型為「分塊儲存（Chunk-based Storage）」。透過內容定義分塊（CDC）與內容定址儲存（CAS）技術，Hub 能跨儲存庫進行資料去重。這對於微調（Fine-tune）與合併（Merge）模型的儲存能節省極大空間，並顯著加快上傳與下載速度。
Judge Arena: Benchmarking LLMs as Evaluators★ 80
Hugging Face Blog563d agoRelease
Hugging Face 與 AI 評估新創公司 Atla 合作推出「Judge Arena」基準測試。該項目旨在解決「LLM 作為裁判（LLM-as-a-judge）」時常見的偏見與失真問題，透過與人類專家評分進行對齊，系統化評估各家大模型在擔任裁判時的表現，為 AI 評估自動化提供更具公信力的參考標準。
AI SDK 4.0★ 85
Vercel Changelog564d agoRelease
Vercel 推出 AI SDK 4.0，帶來重大架構變革。本次更新宣布將舊有的 React Server Components (RSC) 方案列為棄用，改為推薦使用更簡單、穩定的 AI SDK Core（如 streamText）與 AI SDK UI（如 useChat）組合。此外，新版本全面整合了 OpenTelemetry 監控，並優化了多模態與工具調用（Tool Calling）的開發體驗。
Accelerating partner success: Vercel’s new Partner Program benefits
Vercel Changelog567d agoBusiness
Vercel 宣布更新其合作夥伴計畫（Partner Program），旨在為代理商、系統整合商及技術合作夥伴提供更強大的支持。本次更新重點在於加速合作夥伴的成功，提供包括更豐富的技術培訓、共同行銷機會以及專屬的技術支援。這將有助於合作夥伴更高效地為客戶構建現代化 Web 應用，並藉由 Vercel 的生態系統拓展業務藍圖。
NVIDIA L40S GPUs are here
Replicate Blog567d agoNew Tool
AI 部署平台 Replicate 正式推出 NVIDIA L40S GPU 算力選項。與傳統的 A100 或 A10G 相比，L40S 在圖像生成（如 Stable Diffusion）和中小型語言模型推理上，提供了更優異的性能與更低的運算成本，是開發者優化 AI 部署成本的新選擇。
Life of a Vercel request: What happens when a user presses enter★ 75
Vercel Changelog569d agoTutorial
本文深入探討 Vercel 的請求生命週期。當使用者按下 Enter，請求首先透過 Anycast DNS 路由至最近的邊緣節點（PoP）進行安全驗證與路由決策。接著，根據規則，請求可能直接命中邊緣快取，或觸發運行於 V8 的 Edge Functions，亦或喚醒 AWS Lambda 上的 Serverless Functions。最後，結合 ISR 靜態再生與串流技術，將最快的響應回傳給使用者。這是一篇前端與維運工程師必讀的底層架構解析。
Share your open ML datasets on Hugging Face Hub!
Hugging Face Blog570d agoRelease
Hugging Face 官方發文鼓勵機器學習研究人員將其開源數據集託管至 Hugging Face Hub。透過 Hub 提供的強大工具（如數據集瀏覽器、版本控制與 metadata 標記），研究人員能更輕鬆地推廣其研究成果。此舉旨在降低數據集獲取門檻，進一步推動全球開源 AI 社群的協作與創新。
Vercel named a Visionary in 2024 Gartner® Magic Quadrant™ for Cloud Application Platforms
Vercel Changelog574d agoBusiness
Vercel 宣布在 2024 年 Gartner® 雲端應用程式平台魔力象限中被評為「有遠見者」（Visionary）。這項認可肯定了 Vercel 在提升開發者體驗（DX）、推動無伺服器與邊緣運算技術上的創新。對於前端開發者與企業而言，這證明了 Vercel 已從單純的託管平台成長為具備企業級實力的雲端應用程式架構。
MotorTrend: Shifting into overdrive with Vercel
Vercel Changelog575d agoBusiness
知名汽車媒體 MotorTrend 宣布將其網站架構遷移至 Vercel。透過採用 Next.js 與 Vercel 的前端雲端平台，MotorTrend 成功優化了核心網頁指標（Core Web Vitals），顯著提升網頁載入速度與 SEO 表現。此舉不僅改善了讀者的閱讀體驗，更讓開發團隊的部署時間大幅縮短，實現更高效的產品迭代。
Track build metrics and resource consumption with Observability
Vercel Changelog575d agoRelease
Vercel 宣布在其觀測（Observability）工具中新增構建指標與資源消耗追蹤功能。開發者現在可以即時監控每次構建的 CPU、記憶體使用量以及構建時間等關鍵數據。這項更新有助於團隊找出構建瓶頸、優化部署流程，並更精準地管理 Vercel 平台上的資源使用成本。
Hugging Face + PyCharm★ 75
Hugging Face Blog577d agoNew Tool
JetBrains PyCharm 與 Hugging Face 展開合作，在最新版本中提供原生整合。開發者現在無需離開編輯器，即可直接瀏覽 Hugging Face Hub 上的數十萬個開源模型與資料集。此整合還支援程式碼自動補全、模型卡片預覽以及快速生成載入程式碼，大幅提升 AI 與機器學習的開發效率。
Argilla 2.4: Easily Build Fine-Tuning and Evaluation Datasets on the Hub — No Code Required★ 75
Hugging Face Blog578d agoRelease
開源數據標註平台 Argilla 發布 2.4 版本，主打與 Hugging Face Hub 的深度無程式碼整合。用戶現在可以直接在 Hugging Face Spaces 上部署 Argilla，並透過直觀的 UI 介面進行數據導入、協作標註與導出。這大幅降低了為大語言模型（LLM）準備指令微調（SFT）和偏好對齊（DPO）數據集的門檻，讓非技術背景的領域專家也能輕鬆參與數據策劃。
Break the news, not the site: Leading news organizations upgrade their infrastructure ahead of the election
Vercel Changelog582d agoBusiness
隨著 2024 年美國大選臨近，頂尖新聞機構正積極升級其網路基礎設施。Vercel 分享了主流媒體如何利用其邊緣網路（Edge Network）與 Next.js 的 ISR 技術，在面對大選開票夜的極端流量暴增時，依然能提供即時、穩定的開票數據與新聞報導，確保網站不會因過載而癱瘓，實現高可用性的現代 Web 架構。
View advanced function metrics with Observability
Vercel Changelog583d agoRelease
Vercel 宣布在其 Observability（可觀測性）功能中推出「進階函數指標（Advanced Function Metrics）」。開發者現在可以直接在 Vercel 控制台中，針對 Serverless Functions 進行更細緻的效能監控，包含即時的延遲分佈（如 p99 延遲）、錯誤率分析以及冷啟動影響。這項更新旨在幫助開發團隊更快速地定位效能瓶頸，優化無伺服器應用的執行效率。

← PreviousPage 62Next →

Latest in AI

Investing in Performance: Fine-tune small models with LLM insights - a CFM case study★ 75

Open Source Developers Guide to the EU AI Act★ 75

Retailer sees $10M increase in sales on Vercel

From minutes to seconds: How Meter accelerates delivery with Vercel and Next.js

FLUX fine-tunes are now fast★ 75

Rearchitecting Hugging Face Uploads and Downloads★ 75

SmolVLM - small yet mighty Vision Language Model★ 80

How Notion powers rapid and performant experimentation

You could have designed state of the art positional encoding★ 75

Node.js 22 LTS is now generally available for builds and functions

Life of a Vercel request: Navigating the Edge Network

FLUX.1 Tools – Control and steerability for FLUX★ 75

Vercel acquires Grep to accelerate code search★ 75

Letting Large Models Debate: The First Multilingual LLM Debate Competition★ 75

Introducing the Open Leaderboard for Japanese LLMs!★ 75

Faster Text Generation with Self-Speculative Decoding★ 78

From Files to Chunks: Improving HF Storage Efficiency★ 75

Judge Arena: Benchmarking LLMs as Evaluators★ 80

AI SDK 4.0★ 85

Accelerating partner success: Vercel’s new Partner Program benefits

NVIDIA L40S GPUs are here

Life of a Vercel request: What happens when a user presses enter★ 75

Share your open ML datasets on Hugging Face Hub!

Vercel named a Visionary in 2024 Gartner® Magic Quadrant™ for Cloud Application Platforms

MotorTrend: Shifting into overdrive with Vercel

Track build metrics and resource consumption with Observability

Hugging Face + PyCharm★ 75

Argilla 2.4: Easily Build Fine-Tuning and Evaluation Datasets on the Hub — No Code Required★ 75

Break the news, not the site: Leading news organizations upgrade their infrastructure ahead of the election

View advanced function metrics with Observability