Google DeepMind 於官方部落格公開「Nano Banana Pro」。雖然詳細技術細節尚未完整釋出,但從命名來看,「Nano」代表其定位於裝置端(On-device)運算,而「Banana Pro」則可能暗示針對開源硬體或物聯網設備的優化。這顯示 Google 持續深耕邊緣運算與高效能小模型的決心。
知名開源 AI 模型託管平台 Replicate 宣布加入網路基礎設施與安全巨頭 Cloudflare。此一併購案將結合 Replicate 極致簡便的 AI 模型部署體驗,與 Cloudflare 龐大的全球邊緣網路及 Workers AI 基礎設施。未來開發者將能以更低的延遲、更低的成本,在全球邊緣節點無縫運行與擴展各類開源 AI 模型(如 Llama、Stable Diffusion 等),預期將對 AI 應用開發生態帶來深遠影響。
知名開源 AI 研究團隊 Nous Research 在託管其模型展示與 API 時,面臨嚴重的自動化機器人(Bot)濫用問題。 透過導入 Vercel 的 BotID 安全防護功能,他們得以在邊緣端(Edge)精準識別並攔截惡意流量。 這項解決方案不僅保護了昂貴的 GPU 運算資源免於被榨乾,也確保了真實用戶能享有流暢且無感(免驗證碼)的 AI 體驗。
Hugging Face 發表全新小語言模型家族 SmolLM,提供 135M、360M 和 1.7B 三種參數規格,專為本地端與行動裝置部署設計。該系列模型在高品質的教育與程式數據集(如 Cosmopedia v2 和 FineWeb-Edu)上進行訓練,效能超越同量級的 MobileLLM 和 Qwen2-0.5B。SmolLM 採 Apache 2.0 開源授權,並同步開源其訓練數據與配方,為邊緣運算與隱私優先的 AI 應用提供極佳選擇。
Hugging Face 宣布與 Cloudflare 深度整合,推出無伺服器 GPU 推理服務。開發者現在可以直接在 Hugging Face Hub 上,一鍵將熱門的開源模型(如 Llama 和 Mistral)部署至 Cloudflare Workers AI。這項合作免除了管理 GPU 基礎設施的繁瑣工作,並利用 Cloudflare 的全球邊緣網路提供低延遲、高彈性的 AI 推理能力。