NVIDIA 推出全新輕量級多模態模型 Nemotron 3 Nano Omni,主打「長文本」與「多模態」處理能力。該模型專為文件分析、語音與影片理解的 AI Agent 所設計,能在資源受限的設備上運行。這標誌著邊緣端(On-device)多模態 Agent 應用的重大突破。
影片處理與 AI 分析(如語音轉文字、自動摘要)通常耗時且容易在 Serverless 環境中因超時而中斷。Mux 透過其全新的 @mux/ai SDK,展示了如何結合 Vercel 的基礎設施,構建出「持久性(Durable)」的影片工作流。這套方案解決了長影片處理的狀態保存與自動重試難題,讓開發者能以極低的維護成本,在 Serverless 架構下穩定運行複雜的影片 AI 任務。