Google 正式發表 Gemini 2.5 Flash,在 LMArena 的性價比曲線(Pareto Frontier)上展現極強的主導地位。此版本定價精準填補了 2.0 Flash 與 2.5 Pro 之間的空白。最受矚目的新功能是「思考預算(Thinking Budget)」,允許開發者精確設定思考 Token 的上限,相較於 OpenAI 與 Anthropic 僅提供粗略的強弱設定,給予開發者更細緻的控制權。社群普遍認為 Google 近期的執行力與產品發布節奏已完全甦醒。
影片生成競技場(Video Arena)排名前兩名的 SOTA 模型 Google Veo 2 與 Kling 2 正式向開發者全面開放(GA)。Google Veo 2 已整合至 Gemini API,主打每秒生成僅需 0.35 美元的超低價格;而來自中國的 Kling 2 則以約 10 秒 2 美元的價格推出,但設有每月 700 美元(需簽 3 個月)的最低消費門檻。兩大模型的開放象徵著高品質 AI 影片生成正式進入開發者應用的實用化階段。
Google 在 Cloud Next 大會上宣布雙重重磅消息:全面支援 Anthropic 的 MCP 協定,並推出全新的 Agent2Agent (A2A) 協定。A2A 旨在與 MCP 互補,解決跨遠端 Agent 溝通的痛點。該規範包含 Agent Card、Task 機制、企業級認證與推播支援,並同步開源了草案規範與 Agent 開發套件(ADK)。
Vercel 發布企業 AI 整合指南,指引企業如何從 AI 概念驗證走向生產環境。指南強調不應綁定單一模型,而應利用 Vercel AI SDK 建立多模型架構。此外,優秀的 AI 體驗需超越傳統聊天對話框,導入 Generative UI 與即時串流技術,並透過 Serverless 基礎設施與邊緣運算解決延遲與逾時問題,最後搭配完善的安全評估機制,確保企業級應用的穩定與安全。
Google 正式推出全新開源模型家族 Gemma,包含 2B 與 7B 兩種參數大小,並提供預訓練與指令微調版本。 Gemma 採用與 Gemini 相同的技術與架構,在多項基準測試中表現優於同尺寸的 Llama 2 與 Mistral。 Hugging Face 已同步支援 Gemma,開發者可直接透過 Transformers、TGI、PEFT 等工具進行部署與微調。