本文介紹如何將 Hugging Face 的 Transformers.js 整合至 Chrome 擴充功能(Manifest V3)中。內容涵蓋在 Service Worker 與 Offscreen Document 中執行模型的架構設計,並說明如何利用 WebGPU 加速運算。這讓開發者能在不依賴外部 API 的情況下,於瀏覽器本地端實現文本分類、翻譯與圖像識別等 AI 功能。
Hugging Face 正式在 NPM 發布 Transformers.js v4。此版本帶來大幅度的 WebGPU 效能提升,支援更多最新的輕量化開源模型(如 Llama 3.2、Qwen 2.5 等),並優化了與 Vite、Next.js 等現代前端工具鏈的整合,讓開發者能輕鬆打造隱私安全、低延遲且完全在用戶端運行的 AI 應用。
Hugging Face 正式發布 Transformers.js v3,最大亮點為引進 WebGPU 支援,使瀏覽器端模型推論速度較以往的 CPU/WASM 提升達 100 倍。此版本也將 npm 套件重新命名為 @huggingface/transformers,並新增支援 Llama 3、Gemma、Phi-3 等熱門模型。此外,新版本擴展了語音合成(TTS)與多模態任務,為網頁開發者提供更強大的無伺服器端(Serverless)AI 解決方案。
Replicate 發表最新技術週報,重點包括:1. 介紹如何透過稀疏自編碼器(SAE)在 GPT 模型中定位與提取特定概念;2. 展示利用瀏覽器進行低延遲、隱私安全的即時語音轉文字技術;3. 宣布 Replicate 平台即將迎來 NVIDIA H100 GPU,大幅提升開源模型推理與微調的速度。
Vercel 探討了網頁端影片編輯的技術變革。過去影片剪輯高度依賴桌面端軟體,如今藉由 Next.js、WebAssembly (Wasm) 和 WebGPU,開發者能在瀏覽器中打造流暢的編輯體驗。配合 Vercel 的 Serverless 基礎設施與邊緣網路,更解決了影片渲染與大檔案傳輸的效能瓶頸,開啟 Web 影片處理的新時代。
本文探討如何使用 Hugging Face 的 Transformers.js 庫,直接在瀏覽器中運行機器學習模型來開發網頁遊戲。透過 ONNX Runtime Web 與 WebGPU 加速,開發者能實現語音控制、智慧 NPC 對話及視覺辨識等功能。這種客戶端運算模式不僅能實現零伺服器成本,還能保障玩家隱私並降低網路延遲。