Google DeepMind 於官方部落格公開「Nano Banana Pro」。雖然詳細技術細節尚未完整釋出,但從命名來看,「Nano」代表其定位於裝置端(On-device)運算,而「Banana Pro」則可能暗示針對開源硬體或物聯網設備的優化。這顯示 Google 持續深耕邊緣運算與高效能小模型的決心。
本文探討 IBM 最新推出的超輕量級模型 Granite 4.0 Nano。作為 Granite 家族中體積最小的成員,Nano 專為端側(On-device)與邊緣運算設計,能在資源極度受限的設備(如手機、瀏覽器)上流暢運行。文章詳細分析了其架構優化、效能表現,以及如何透過 Hugging Face 工具鏈輕鬆部署,為隱私敏感與低延遲應用提供全新選擇。
Hugging Face 介紹 Arm 與 PyTorch 團隊在 ExecuTorch 0.7 的最新合作成果。此版本專為 Arm 架構(如手機、AI PC)優化生成式 AI 效能,透過先進的量化技術與核心優化(如 Arm KleidiAI),讓開發者能更輕鬆地在邊緣裝置上部署低延遲、低功耗的輕量化大語言模型。
Hugging Face 正式發表 SmolLM3 輕量級模型系列。延續前代小巧好部署的特色,SmolLM3 這次特別強化了「多語言支援」、「長上下文處理」以及「推理能力(Reasoner)」。這使得開發者能在資源受限的設備或本地端,運行具備複雜邏輯推理與長文本理解的多語言 AI 應用。
阿聯酋技術創新研究所(TII)發表 Falcon-Edge 系列模型,採用 1.58-bit(三進制)權重技術。該系列模型不僅體積小、運算速度快且功耗極低,非常適合在手機與筆電等邊緣設備上運行,同時還支援高效的微調,打破了以往極低位元模型難以微調的限制,為本地端 AI 應用帶來全新可能。
Hugging Face 發表全新輕量級視覺語言模型 SmolVLM(約 2.2B 參數),專為本機與邊緣設備設計。該模型結合了 SigLIP 視覺編碼器與 SmolLM2 語言模型,不僅支援多圖輸入與影片分析,在多項基準測試中更展現出媲美更大尺寸模型的性能。SmolVLM 採 Apache 2.0 開源授權,極低記憶體佔用使其成為開發者在終端裝置部署 VLM 的理想選擇。
Apple 與 Hugging Face 合作推出 Core ML 版的 Stable Diffusion,讓 Mac、iPad 和 iPhone 能直接利用 Apple 類神經引擎(ANE)進行硬體加速。開發者可以使用 Hugging Face 的 diffusers 庫與 Apple 的轉換工具,將 PyTorch 模型轉換為 .mlpackage 格式。此舉大幅降低了在 Apple 裝置上部署生成式 AI 模型的門檻,並顯著提升了圖像生成速度與能源效率。