AI风向

【AI风向】Google I/O 2026倒计时8天:史上最重AI一届,创业者该盯哪些发布?

Google I/O 2026 落幕,三大信号:Gemini 3.5 正式发布、AI Agent 成为所有产品的默认层、Android XR 眼镜年底发售。AI 创业者需要看懂的五个关键变化。

事件回顾

5 月 19 日至 20 日,Google I/O 2026 在加州山景城 Shoreline Amphitheatre 举行。这是 2026 年上半年最重要的 AI 行业事件之一,Google 官方博客用「100 things we announced」来总结这场开发者大会的发布密度。Pichai 在会前简报中将公司当前状态描述为「hyper progress」(超速进展),但同时也承认,现在正是「人们想看到产品实际价值」的阶段。

此次 I/O 的核心叙事非常清晰:AI Agent 不再是附加功能,而是 Google 所有产品的默认交互层。 从搜索到 Gmail,从 YouTube 到 Docs,从 Chrome 到即将到来的 Android XR 眼镜,Agent 被嵌入每一个入口。

据 WIRED 和 Google 官方博客报道,Gemini 助手目前拥有 9 亿用户,人们已经用 Gemini 生成了超过 500 亿张图片。在这个用户基数之上,Google 开始全面推进 Agent 化战略。

五大关键发布

一、Gemini 3.5 系列模型:Pro + Flash 双版本

Google 正式发布了 Gemini 3.5 Pro 和 Gemini 3.5 Flash。Flash 版本是 Pro 的精简版,价格更低,专为高吞吐量场景设计。两个模型即日起在 Google Search 和 Gemini App 中可用,开发者可通过 Google AI Studio 和 Gemini API 调用。

值得注意的是,此前业界广泛预测的 Gemini 4.0 并未出现。Google 选择了一个更务实的版本号——3.5,而非跨越式大版本。这反映出 Google 在产品节奏上越来越成熟:与其承诺一个未达标的「4.0」,不如交付一个确实可用的「3.5」。

二、AI Agent 嵌入搜索:智能搜索框

Google 将 AI Agent 直接嵌入了搜索框,称之为「intelligent search box」(智能搜索框)。用户提出复杂问题后,Agent 不仅返回文字答案,还能自动生成解释性图片或短视频,直接展示在搜索结果中。

配套的「Generative UI」功能则根据回答内容类型动态生成不同的信息布局——视频类回答用视频卡片、新闻类回答用新闻列表、数据类回答用图表——全部由 AI 在浏览器端实时生成。这项功能将在今年夏天全面推送。

三、Antigravity 平台 + Managed Agents

Antigravity 是 Google 的 Agent 优先开发平台,此次获得重大升级。开发者现在可以用 Antigravity 编排和构建 Agent 工作流。新增的 Managed Agents 功能允许通过 Gemini API 创建和管理托管 Agent——这意味着企业可以直接在 Google 基础设施上运行 Agent 服务,不需要自建调度系统。

对于 AI 创业者来说,这降低了 Agent 部署的门槛。以前需要自己搭基础设施来运行 Agent 服务,现在可以通过 Gemini API 的 Managed Agents 直接上线。

四、Gemini Spark:24/7 个人 AI Agent

Gemini Spark 被定位为全天候个人 AI Agent。它能在用户指导下接管数字生活中的各种任务:自动整理日历、处理邮件、规划日程。配合 Daily Brief 功能,每天早上自动生成个性化的当日摘要,基于用户的目标和日历数据主动推荐下一步行动。

这标志着 Google 的 AI 策略从「被动问答」转向「主动代理」。Agent 不再等待用户提问,而是主动预测需求并采取行动。

五、Android XR 眼镜 + Omni 视频生成

Android XR 智能眼镜在会上做了预览展示,预计今年秋季上市。眼镜内置 Gemini 驱动的 AI 助手,支持实时翻译、导航叠加和场景识别。

Gemini Omni 是新发布的多模态生成模型,能从任何输入(文字、图片、音频)生成任何输出,首发能力是视频生成。用户可以用自然语言描述想要的视频效果——比如「给这段视频加上电影级变焦」或「把背景换成海滩」——Omni 直接在 Gemini App 中处理。

Google Flow Music 则让用户与 Agent 对话式协作,生成可分享的音乐视频。

Google I/O 2026五大关键发布
▲ Google I/O 2026 五大关键发布:Gemini 3.5、智能搜索框、Antigravity、Gemini Spark、Android XR

对 AI 创业者的三大影响

1. Agent 成为基础设施,差异化窗口收窄

Google 将 Agent 嵌入搜索、Gmail、YouTube 等日活数十亿的产品中,意味着基础 Agent 能力正在被平台化。过去创业公司靠「做一个 AI Agent 应用」就能获得关注的阶段正在结束。差异化的方向正在从「有没有 Agent」转向「Agent 在特定垂直场景做得有多深」。

2. Managed Agents 降低部署门槛

对于一人公司和小团队来说,Managed Agents 让 Agent 服务的部署变得接近「开箱即用」。以前需要配服务器、搭调度系统、处理并发和容错——这些基础设施工作消耗了大量精力。现在可以直接调用 Gemini API 创建托管 Agent,把精力集中在业务逻辑上。

3. 视频生成成为新战场

Gemini Omni 的视频生成能力将对整个内容创作行业产生深远影响。对于做内容创业的 AI 创业者,视频生成工具将成为一个新的生产力倍增器——从公众号配图进化到短视频配画面。但同时也意味着视频内容供给将迎来新一轮爆发,竞争加剧。

AI Agent创业平台对比
▲ 2026年5月 AI Agent 创业选型参考:Google Managed Agents vs Claude Cowork vs Hermes Agent

同时值得关注的其他动态

DeepSeek-V4-Pro 75% 折扣永久化:据 Hacker News 讨论,DeepSeek 已将 V4-Pro 的 75% 折扣从临时促销转为永久定价。在标准定价下,DeepSeek-V4-Pro 的百万 token 成本约为 GPT-5.5 的七分之一、Claude Opus 4.7 的六分之一。对于高频调用 API 的 AI Agent 应用,这直接意味着成本结构的根本改变。

Hermes Agent v0.14.0 发布:5 月 16 日,Hermes Agent 发布 v2026.5.16 版本。本次更新包含 808 个 commits、633 个合并 PR,新增了 xAI Grok OAuth 支持(grok-4.3 上下文窗口扩展到 100 万 token)、OpenAI 兼容本地代理、X(Twitter)搜索工具、Microsoft Teams 端到端集成、LINE 和 SimpleX Chat 适配器等。安装流程大幅优化,冷启动速度提升约 19 秒。对于使用 Hermes 做 Agent 开发的创业者,这是今年以来最大的功能更新。

Anthropic 9000 亿美元融资即将关闭:据 Bloomberg 报道,Anthropic 由 Sequoia、Dragoneer 等联合领投的 300 亿美元融资轮预计 5 月底关闭,估值超过 9000 亿美元。如果达成,Anthropic 将首次在估值上超越 OpenAI。

行动建议

  1. 注册 Google AI Studio 体验 Gemini 3.5:了解新版模型在代码生成、推理等方面的实际表现,评估是否适合替换或补充当前的模型方案。
  2. 研究 Managed Agents 的能力边界:如果你的产品涉及 Agent 服务,评估是否可以用 Managed Agents 替代自建基础设施,降低运维成本。
  3. 关注 Android XR 眼镜的开发者生态:年底上市前,提前了解 SDK 和适配要求。AR/AI 结合可能成为 2027 年的重要创业赛道。
  4. 重新算一笔 API 成本账:DeepSeek-V4-Pro 永久降价后,如果你的应用对推理深度要求不是极高(不需要顶级数学或代码能力),切换到 DeepSeek 可以显著降低运营成本。Hermes Agent v0.14.0 新增的 OpenAI 兼容本地代理功能让这个切换更容易——任何支持 OpenAI 格式的工具现在都可以通过 Hermes 代理连接到不同后端。
  5. 关注视频生成工具的进展:Gemini Omni 的视频生成能力将在未来几个月内逐步开放。如果你做内容创业,现在可以开始规划视频内容产品线。

本文由AI辅助创作,经人工审核编辑发布