Trip planning has become a recurring showcase for AI agents: name a destination, and the system promises to search options and research local activities. The article frames Gemini Spark as the author’s most impressive and unsettling AI experience so far. The provided excerpt does not include enough detail to assess its workflow, accuracy, limitations, or the specific reason for that concern.
Google's new 24/7 AI agent, Gemini Spark, can take on tasks for users and continue working on them. After receiving access last week, The Verge's reviewer found that Spark can perform surprisingly well, roughly matching Google's demo. The remaining question is whether that capability justifies the financial cost and potential privacy tradeoffs.
TechCrunch tested Google’s 24/7 AI assistant Gemini Spark and found it genuinely useful for everyday automation. The article highlights tasks such as inbox summaries and local event planning, suggesting Google is pushing Gemini toward a more persistent assistant experience. Still, the author questions why Google chose to make Gemini Spark a separate product instead of folding it into existing Gemini or Google services.
The Verge found TikTok, Instagram, and Facebook accounts using AI-generated Black women and other marginalized personas to sell dropshipped products. The videos frame mass-produced goods as handmade small-business items and use tears, racial identity, and hardship narratives to drive engagement. Researchers describe the pattern as digital blackface and empathy bait, enabled by short-form platforms, weak labeling, and widely available generative AI ad workflows.
Ars Technica reports that Apple is working to compress Google’s massive Gemini model so it can run on iPhone and power a new Siri experience. The short summary emphasizes a key constraint: even with on-device ambitions, a cloud component is probably inevitable. Details remain limited, so the report is best read as a signal about Apple’s AI direction rather than a confirmed product launch.
Hugging Face published a tutorial for running Reachy Mini conversations without cloud audio processing or API keys. The setup uses its speech-to-speech library as a cascaded VAD, STT, LLM, and TTS pipeline exposed through a Realtime API-compatible WebSocket. Recommended defaults include llama.cpp with Gemma 4, Silero VAD, Parakeet-TDT, and Qwen3-TTS, while allowing swaps to vLLM, MLX, Transformers, or hosted Responses API providers.
Ethan Mollick warns that frictionless AI use can produce hollow writing, weaken learning, and encourage cognitive surrender. He contrasts poor uses of ChatGPT that shortcut effort with tutor-like AI systems that improve learning by pushing students to think. The core argument is not to reject AI, but to intentionally decide which tasks to offload and which human capabilities to preserve.
Google AI Studio's newly launched native Android app development feature has enabled the creation of over 250,000 apps within its first week. According to product lead Logan Kilpatrick, over 99% of these creators had zero prior Android development experience. This milestone highlights the rapid democratization of software development through AI-driven, no-code tools.
As AI chatbots adopt increasingly sophisticated personas, hackers are shifting from basic prompt injections to social engineering attacks targeting these "personalities." Researchers warn that manipulating a chatbot's defined role (e.g., customer service or empathetic companion) makes it easier to bypass safety guardrails. This evolution poses a significant threat to agentic AI workflows that rely on consistent role-playing and external data integration.
Google 發表了全新的「任意對任意(anything-to-anything)」AI 模型 Gemini Omni。外媒記者實測將其用於將小孩的毛絨鹿玩具「Buddy」合成到各種度假場景中,發現其生成效果極其逼真且操作簡單。這款模型不僅展現了強大的多模態影片生成與編輯能力,同時也再度引發了關於深偽(Deepfake)技術門檻降低與倫理界線的討論。
本期 Latent Space 探討了 AI 產業的重大範式轉移:各大頂尖模型實驗室已不再單純追求基礎 LLM 的參數規模,而是全面轉向「Agent(智慧代理)」的開發。隨著純模型微調的邊際效應遞減,透過讓 AI 具備操作電腦、自主規劃與執行多步驟任務的能力,已成為當前競逐的新戰場。
Google 的 AI Overviews 搜尋功能近日被發現一項有趣的漏洞。當用戶在 Google 搜尋輸入「disregard」(忽略)時,AI 搜尋並非提供該單字的定義,而是將其誤判為「忽略先前指令」的系統提示詞(Prompt Injection)。這導致 AI 輸出類似傳統聊天機器人重設後的罐頭回覆,暴露出 Google 在區分「用戶查詢內容」與「系統控制指令」上仍有架構上的缺陷。
Google 搜尋在進行 AI 相關更新後,被發現存在一個嚴重的介面錯誤:只要使用者輸入「disregard」(意為忽略)這個單字進行搜尋,整個搜尋介面就會直接崩潰。這項問題疑似與 Google 為了防止 AI 遭遇「提示詞注入」(Prompt Injection)攻擊而設定的過度防禦機制有關。目前該單字已無法正常進行 Google 搜尋。
Google 近日展示了其最新的 Android XR 智慧眼鏡原型。這款眼鏡能將由 Gemini 驅動的即時翻譯、地圖導航等資訊直接疊加在用戶的視野中。雖然目前仍是原型階段,但外媒實測後認為其整合度與實用性已相當高,距離正式商用僅一步之遙。
Simon Willison announced the first release of Datasette Agent, merging his 'llm' Python library with Datasette. The tool provides a conversational interface to query SQLite databases, with plugin support for generating charts and running code in sandboxes. It runs efficiently on lightweight models like Gemini 3.1 Flash-Lite and supports local open-weight models via LM Studio.
Google 在 I/O 開發者大會上,將「AI Agent(智慧代理)」視為未來消費者與網路互動的核心。然而,這套雄心勃勃的生態系不僅概念複雜、令人困惑,更面臨消費者是否願意買單的嚴峻挑戰。TechCrunch 分析指出,要讓大眾接受這種新型態的網路使用方式,Google 還有一段很長的路要走。
本文整理 Google 最新 AI 訂閱方案指南。除了常見的個人版外,重點解析每月 100 美元與 200 美元的高階/企業級方案差異。兩者主要在於專屬算力優先權、脈絡長度(Context Window)限制、企業級隱私安全防護,以及自動化 AI Agent 的部署權限,幫助企業與專業開發者選擇最合適的方案。
Google 在 I/O 2026 大會上展示了搜尋技術的重大變革,預計於 2026 年全面導入「Agentic AI(代理型 AI)」。搜尋將不再只是呈現網頁連結或 AI 摘要,而是能主動替用戶規劃並執行任務的 AI 代理。這一轉變將深刻影響全球網站流量、SEO 策略以及用戶與網路互動的方式。
Google 於 I/O 2026 發表對標 OpenClaw 的個人 AI 代理「Gemini Spark」,能原生串接 Gmail、雲端硬碟等服務。該代理運行於 Gemini 3.5 Flash 與全新「Antigravity」架構上。然而,Google 同時宣布將開源的 Gemini CLI 轉向閉源的 Antigravity CLI,且代理在處理敏感數據時的安全防護(如提示詞注入風險)仍面臨考驗。
Latent Space 報導 Google I/O 2026 最新進展。本次大會亮點包括新一代輕量快速模型 Gemini 3.5 Flash、專注於影片處理的 Omni (NanoBanana)、主打背景運作的 Agent 框架 Spark,以及技術升級的 Antigravity 2.0。這些發布顯示 Google 持續在多模態影片、自主 Agent 及模型效能上發力。
Google 在 I/O 大會上正式推出 Gemini 3.5 Flash,跳過預覽版直接進入一般可用階段,並將全面導入 Google 搜尋、Gemini App 及開發者平台。然而,新模型的 API 價格大幅上漲,輸入與輸出費用分別為每百萬代幣 1.5 美元與 9 美元,是前代 Flash 預覽版的 3 倍,顯示出各大 AI 廠商正開始測試市場對高定價的接受度。
Google 開發的 AI 水印技術 SynthID 迎來重大突破,宣布獲得 OpenAI、NVIDIA 等多家科技巨頭採用。隨著 AI 生成的文字、影像與影音擬真度大幅提升,如何辨識真偽成為關鍵挑戰。此舉標誌著各大 AI 領導廠商在內容溯源與安全防護上達成罕見共識,有望建立統一的 AI 生成內容識別標準。
Google 發表全新 Gemini 3.5 Flash 與名為「Omni」的全能型模型。Gemini 3.5 Flash 針對 Agent(AI 代理)進行深度優化,大幅提升運作效率與速度,被視為推動實用級 Agent 應用的關鍵;而 Omni 則定位為能處理多元任務的萬能模型。兩者結合將顯著降低延遲,讓生成式 AI 在實際工作流中更具實用價值。
Simon Willison 在 PyCon US 2026 的 5 分鐘閃電演講中,回顧了自 2025 年 11 月以來的 LLM 關鍵進展。他指出這半年間「最強模型」在三大巨頭間易手五次(包含 GPT-5.1、Gemini 3 與 Claude Opus 4.5)。最重要的是,得益於可驗證獎勵的強化學習(RLVR),程式碼生成 Agent(如 Claude Code)已跨越實用門檻,成為開發者的日常主力工具。
Google DeepMind 宣布生物學家成功利用其 AI 系統「Co-Scientist」加速基因篩選流程。該系統協助研究人員在龐大的基因數據中,精準辨識出能有效逆轉人類細胞衰老(細胞年輕化)的全新關鍵遺傳因子。這項突破不僅展示了 AI 在生醫領域的強大預測與實驗設計能力,也為抗衰老療法與再生醫學開闢了全新路徑。
Google DeepMind 發表新一代「Gemini Omni」模型,採用原生端到端全模態架構,能同時處理並輸出文字、音訊與視覺資訊。該模型顯著降低了互動延遲,實現如同真人般的流暢對話與即時視訊引導,未來將深度整合至 Android 系統與 Google 生態系,並透過 API 開放給開發者。
Google DeepMind 宣布推出「Gemini for Science」計畫,整合了一系列專為科學研究設計的 AI 工具與實驗。該計畫旨在利用 Gemini 的多模態與推理能力,協助科學家擴大研究規模並提升探索的精準度。這標誌著 AI 從通用助手邁向深度的科學發現夥伴,為材料科學、生物醫學等領域帶來新的可能性。
本期《Open Artifacts》電子報彙整了近期極為熱鬧的開放模型生態。多款重量級旗艦模型接連登場,包含 Google 的 Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5 以及 GLM-5.1 等。文章除了盤點這些模型的發布外,也深入探討了 CAISI 針對最新模型所進行的 V4 安全與能力評估,呈現開源與開放權重模型在技術與安全合規上的最新進展。
Google DeepMind 宣布與新加坡政府建立全新的國家級合作夥伴關係。雙方將攜手導入前沿 AI 技術,共同解決醫療保健、教育系統優化以及環境永續發展等複雜的社會與國家級挑戰。這項合作不僅強化了新加坡在亞太地區的 AI 領先地位,也展示了公私部門如何協同推動負責任的 AI 應用。
劍橋大學教授 Clare Bryant 正在使用 Google DeepMind 的 AI 系統「Co-Scientist」進行前沿醫學研究。該研究旨在識別新興傳染病中的「分子開關」(基因觸發因素),以了解病原體如何引發體內免疫反應。透過 AI 的協作,科學家能夠更快速地篩選複雜的基因數據,為未來應對大流行病和開發新療法提供關鍵線索。