Microsoft has revealed the Surface RTX Spark Dev Box, a miniature Surface PC aimed at developers. It uses Nvidia's new Arm-based RTX Spark chips, the same platform found in the recently announced Surface Laptop Ultra. The device is optimized for sustained workloads and local AI tasks, although the provided excerpt does not disclose detailed specifications, pricing, or availability.
Hugging Face Blog published a post titled “Holo3.1: Fast & Local Computer Use Agents.” From the title alone, Holo3.1 focuses on computer-use agents with speed and local execution as its stated themes. The source text was not provided, so architecture, supported platforms, benchmarks, licensing, hardware requirements, and availability cannot be confirmed.
本文介紹如何將 Hugging Face 的 Transformers.js 整合至 Chrome 擴充功能(Manifest V3)中。內容涵蓋在 Service Worker 與 Offscreen Document 中執行模型的架構設計,並說明如何利用 WebGPU 加速運算。這讓開發者能在不依賴外部 API 的情況下,於瀏覽器本地端實現文本分類、翻譯與圖像識別等 AI 功能。
開源 AI 領域迎來震撼消息,主導本地端 LLM 推理的開源專案 GGML 與 llama.cpp 正式宣布加入 Hugging Face。此舉旨在為本地端與邊緣端 AI 技術提供長期且穩定的資源支持。雙方將深化 GGUF 格式與 Hugging Face 平台的整合,確保開源社群能更輕鬆地在消費級硬體上運行高效能模型,持續推動去中心化與隱私優先的 AI 發展。
Hugging Face 發表 Smol2Operator,這是一套針對「電腦操作(Computer Use)」設計的後訓練 GUI 代理方案。基於輕量級視覺語言模型(如 SmolVLM),透過特定的監督微調(SFT)與強化學習,使其能精準識別螢幕元素並執行點擊、輸入等操作。此項目開源了模型權重與訓練方法,讓開發者能在消費級硬體上部署隱私安全、低延遲的本地 GUI 代理。
Hugging Face 正式發布 Transformers.js v3,最大亮點為引進 WebGPU 支援,使瀏覽器端模型推論速度較以往的 CPU/WASM 提升達 100 倍。此版本也將 npm 套件重新命名為 @huggingface/transformers,並新增支援 Llama 3、Gemma、Phi-3 等熱門模型。此外,新版本擴展了語音合成(TTS)與多模態任務,為網頁開發者提供更強大的無伺服器端(Serverless)AI 解決方案。
Hugging Face 發表全新小語言模型家族 SmolLM,提供 135M、360M 和 1.7B 三種參數規格,專為本地端與行動裝置部署設計。該系列模型在高品質的教育與程式數據集(如 Cosmopedia v2 和 FineWeb-Edu)上進行訓練,效能超越同量級的 MobileLLM 和 Qwen2-0.5B。SmolLM 採 Apache 2.0 開源授權,並同步開源其訓練數據與配方,為邊緣運算與隱私優先的 AI 應用提供極佳選擇。
本教學指導搭載 Apple Silicon(M 系列晶片)Mac 的使用者,如何利用 PyTorch 的 MPS(Metal Performance Shaders)硬體加速技術,在本地端部署並運行 Stable Diffusion 3 圖像生成模型。這讓開發者與創作者無需依賴雲端 API,即可在個人電腦上進行高效、隱私且免費的本地 AI 繪圖。
本文為 Replicate 釋出的技術教學,指導讀者如何在 Apple Silicon (M1/M2) Mac 上本地運行 Latent Consistency Model (LCM)。LCM 透過大幅減少去噪步數(僅需 1-4 步),將原本需要數十秒的 Stable Diffusion 圖片生成時間縮短至一秒以內,非常適合需要即時反饋的創作者與開發者。
本教學指導開發者如何在 M1 Mac 上利用 PyTorch 的 MPS (Metal Performance Shaders) 後端,本地端調用 GPU 運行 Stable Diffusion。內容涵蓋 Python 環境設定、安裝支援 MPS 的 PyTorch 與 Hugging Face diffusers 庫,並提供完整的程式碼範例,讓開發者能完全免費、私密地在 local 端進行 AI 圖像生成與二次開發。