Google DeepMind 推出新一代 AI 代理 SIMA 2,全面導入 Gemini 模型的能力。SIMA 2 不僅能在多個 3D 虛擬與遊戲世界中執行任務,還具備更強的推理、語言理解與即時決策能力。這項技術展示了 AI 如何從單純的指令接收者,演變為能在複雜互動環境中與人類協同合作的智慧夥伴。
Google DeepMind 發表全新世界模型 Genie 3,為生成式 AI 領域帶來重大突破。該模型能以每秒 24 幀(fps)的即時速度,生成可供用戶自由導航與互動的動態虛擬世界。Genie 3 不僅支援 720p 的高解析度,更能在長達數分鐘的互動過程中,保持場景與物理邏輯的高度一致性,這將為未來的遊戲開發、虛擬實境以及 AI 代理(Agents)的模擬訓練開闢全新途徑。
Arm 與 Hugging Face 合作宣布「Neural Super Sampling (NSS)」技術正式上線。這項技術旨在利用神經網路,在行動裝置與邊緣設備上實現即時的圖像與遊戲畫面超取樣(類似行動版 DLSS)。透過 Hugging Face 平台,開發者現在可以輕鬆獲取優化後的 NSS 模型與工具鏈,大幅提升手遊與 XR 應用的畫面流暢度並降低能耗。
Replicate 發布第 11 期技術週報,重點介紹開源影像生成模型 FLUX.1 的微調方法,讓開發者能以低成本訓練專屬風格。同時探討了「生成式電子遊戲」的最新進展,展示 AI 如何即時生成遊戲畫面與互動內容。最後,文章展望了生成式 AI 結合 3D 技術,為未來元宇宙與虛擬空間帶來的全新創作範式。
Hugging Face 聯合 Cubzh 與 Gigax 推出「NPC-Playground」3D 互動沙盒。該平台利用開源的大型語言模型(LLM)賦予 NPC 記憶、感知與決策能力,使其不僅能與玩家對話,還能在 3D 空間中執行撿拾、移動等實體動作。這項開源合作展示了 AI Agent 在遊戲領域的全新應用可能。