The article argues that many companies use AI mainly to improve efficiency, without creating meaningful revenue or strategic advantage. It proposes distributed AI, placing intelligence closer to where data is generated to reduce latency and support faster decisions. The key message is that firms should balance centralized and distributed architectures to strengthen competitiveness while preserving greater control over data and digital sovereignty.
本期 Latent Space 訪談了烏克蘭無人機新創 The Fourth Law 創辦人 Yaroslav Azhnyuk 與客座主持人 Noah Smith。他們深入探討了從寵物攝影機轉向 AI 導引武器的技術歷程,解析了現代自主無人機的技術棧與低成本製造經濟學。Azhnyuk 警告,西方國家在面對這場由 AI 驅動的無人機軍備競賽中顯得過於遲鈍,亟需正視其對未來國防的衝擊。
IBM 於 Hugging Face 發布全新 Granite 4.0 3B Vision 模型。這款僅有 30 億參數的輕量級多模態模型,專為企業級文件理解、圖表分析與 OCR 數據提取而設計。其小巧的體積不僅大幅降低了部署門檻與運算成本,更在處理複雜商業報表與 PDF 文件時展現出極高的實用性,是企業本地化部署的理想選擇。
本期 Import AI 聚焦三大前沿:首先是 ByteDance 開發出能自動編寫與優化 CUDA 程式碼的 Agent,大幅降低 GPU 效能調校門檻;其次是探討在衛星上直接運行 AI 模型(邊緣運算)的技術進展;最後,作者藉由烏克蘭無人機戰事,深刻反思未來首場真正的「AI 戰爭」將於何時、以何種形式爆發。
開源 AI 領域迎來震撼消息,主導本地端 LLM 推理的開源專案 GGML 與 llama.cpp 正式宣布加入 Hugging Face。此舉旨在為本地端與邊緣端 AI 技術提供長期且穩定的資源支持。雙方將深化 GGUF 格式與 Hugging Face 平台的整合,確保開源社群能更輕鬆地在消費級硬體上運行高效能模型,持續推動去中心化與隱私優先的 AI 發展。
本文深入探討全球 AI 算力基礎設施的劇烈變革。隨著地緣政治與市場需求的變化,算力正從少數雲端巨頭壟斷,走向「主權算力」與區域化部署。同時,AMD、Intel 及邊緣裝置晶片的崛起打破了單一硬體壟斷,而開源社群與 Hugging Face 的優化工具(如 Optimum)正成為連接多元硬體與模型的關鍵橋樑,推動 AI 走向去中心化與普及化。
Enterprise AI 公司 Writer 在 Hugging Face 上推出了全新的「Palmyra-mini」模型系列。該系列主打輕量化與強大效能,並特別強調具備「推理(reasoning)」能力。這使得開發者能在資源受限的環境中,部署具備複雜邏輯思考與問題解決能力的 AI 模型,為邊緣運算與企業應用提供新選擇。
知名 AI 學者 Ethan Mollick 撰文探討「大眾智能(Mass Intelligence)」的降臨。他指出,AI 正在朝兩極化普及:一方面是如 GPT-5 等具備頂尖推理能力的前沿模型,另一方面是能在個人裝置運行的超輕量本地模型(如 nano banana 等)。這意味著強大的 AI 算力將如同電力般無所不在且廉價,徹底民主化智能的獲取管道。
Arm 與 Hugging Face 合作宣布「Neural Super Sampling (NSS)」技術正式上線。這項技術旨在利用神經網路,在行動裝置與邊緣設備上實現即時的圖像與遊戲畫面超取樣(類似行動版 DLSS)。透過 Hugging Face 平台,開發者現在可以輕鬆獲取優化後的 NSS 模型與工具鏈,大幅提升手遊與 XR 應用的畫面流暢度並降低能耗。
Google DeepMind 宣布推出「Gemini Robotics On-Device」模型。這是一款專為本地(裝置端)運作設計的高效機器人 AI 模型,旨在賦予機器人通用的靈巧操作能力(general-purpose dexterity),並能針對新任務進行快速適應(fast task adaptation),大幅提升邊緣端機器人的自主與反應能力。
阿布達比技術創新研究所(TII)正式發布 Falcon 3 系列開源模型,提供 1B、3B、7B 及 10B MoE 等多種參數規格。Falcon 3 在多項基準測試中表現優異,其 7B 版本在性能上甚至超越了 Llama 3.1 8B 與 Gemma 2 9B。此系列模型對硬體友善,極適合邊緣運算與本地部署,並已深度整合至 Hugging Face 生態系統。
本指南為開發者與 AI 愛好者提供在各種平台上本地運行 Llama 2 的實用方法。內容涵蓋適合 Mac 用戶的 Ollama、跨平台的 llama.cpp、圖形介面的 LM Studio,以及能在手機上運行 Llama 2 的 MLC LLM。透過這些工具,使用者無需依賴雲端 API 即可保護隱私並降低成本。