AI风向

【AI风向】Google Gemini 3.5 Pro 定档6月:250美元月费、200万Token上下文,AI编程工具进入"超高端"时代

Google 把 Gemini 3.5 Pro 定价在 $250/月 Ultra 订阅专属,比自家 Flash 贵 10 倍。这不是简单的模型升级——它标志着 AI 编程工具的定价体系正在从"普惠"走向"分层",AI 创业者需要重新算账了。

▲ Gemini 3.5 Pro 定价体系:Ultra订阅专属Deep Think,API定价10倍▲ ▲ Gemini 3.5 Pro 定价体系:Ultra订阅专属Deep Think,API定价10倍于Flash

事件回顾

2026 年 5 月 19 日的 Google I/O 大会上,Google DeepMind 发布了 Gemini 3.5 系列的首款模型——Gemini 3.5 Flash,并预告了旗舰型号 Gemini 3.5 Pro 将于 6 月正式上线。如今 6 月过半,Gemini 3.5 Pro 的更多细节通过开发者社区和 Google 官方文档逐渐浮出水面。

核心参数:Gemini 3.5 Pro 搭载 200 万 Token 上下文窗口,这一数字是当前主流旗舰模型(如 Claude Opus 4.8 的 200K、GPT-5.5 的 256K)的 8-10 倍。配合 Deep Think 深度推理模式,Google 将其定位为"编程、智能体、推理和记忆"领域的全新旗舰。

定价策略:Deep Think 模式被锁定在每月 250 美元的 Google AI Ultra 订阅中,不对 20 美元/月的 Pro 用户开放。API 定价方面,输入 Token 每百万 15 美元,输出 Token 每百万 60 美元——约为 Gemini 3.5 Flash 的 10 倍。参考来源:AI Weekly 报道及 Google AI 开发者文档。

市场定位:根据 Reddit 社区讨论和早期测试者反馈,Gemini 3.5 Pro 并非 Anthropic Mythos 级别的"超级模型",而是与 GPT-5.5、Claude Opus 4.7 处于同一竞争层。但 200 万 Token 的上下文窗口确实是一个差异化优势——这意味着你可以一次性扔进整本技术书籍、完整代码仓库或数小时的会议记录,模型都能完整理解。

值得关注的时间线:Google 在 5 月 19 日 I/O 大会宣布后,截至 6 月初模型仍未实际交付。如果在 6 月 30 日前如期上线,Gemini 3.5 Pro 将成为 2026 年 6 月继 Claude Fable 5(6 月 9 日发布,6 月 12 日被美国政府叫停)之后,又一款引发行业震动的旗舰模型。

为什么重要:AI 工具定价"分层时代"正式到来

本次 Gemini 3.5 Pro 的定价策略,并非孤立事件。把它放进 2026 年 6 月的 AI 行业全景图里看,一个清晰的趋势正在形成:AI 工具不再"一个订阅通吃",而是按能力、按场景、按用户身份严格分层定价。

三条定价线同时收紧

第一条线:Anthropic 的 Agent SDK 额度剥离。 6 月 15 日(今天)正式生效的新政,将 Claude -p、Agent SDK、第三方工具(OpenClaw、Hermes 等)的程序化调用从订阅额度中剥离,改为按 API 零售价计费的固定月度 Credit。Pro 用户拿 20 美元,Max 20x 用户拿 200 美元——而之前这些用户实际可消耗的 Token 折算 API 零售价在 2000-5000 美元之间。实际缩水近 10 倍。

第二条线:Google 的 Ultra 订阅墙。 最强大的 Deep Think 推理能力被锁在 250 美元/月的 Ultra 订阅中,Pro(20 美元/月)用户无法使用。API 定价 10 倍于 Flash,直接将 Gemini 3.5 Pro 定位为"企业级/专业开发者专属"。

第三条线:OpenAI 的逆向操作。 Codex 不区分交互式和程序化调用,订阅用户所有场景通用,还推出从 Claude Code 一键迁移的工具和 2 个月免费试用。这是在 Anthropic 制造痛点后精准切入的竞争策略。

对 AI 创业者的三重影响

影响一:工具成本需要重新核算。 以前 AI 创业者可以靠一个 20 美元的 Claude Pro 订阅,同时满足日常编程交互和 Agent 自动化工作流。现在 Agent 自动化的成本被独立出来按 API 零售价计算,一个重度 Agent 用户每月的实际花费可能从 200 美元跃升至 1000-2000 美元。参考来源:36氪报道中引用的开发者社区测算。

影响二:工具选择变成战略决策。 当每个平台都在重新定义"什么功能收多少钱"时,在 Claude Code、Codex、Gemini 之间切换不再只是"哪个模型更强"的问题,而是"哪个平台的定价模型匹配我的使用模式"。一个以 Agent 自动化为主的团队可能更适合 OpenAI Codex(统一计费),一个以交互式编程为主的开发者可能更适合 Claude Code(交互式额度在提升)。

影响三:本地模型的价值被重新发现。 Fable 5 被政府叫停后,AI 创始人 Alex Finn 呼吁开发者"在本地 GPU 上运行本地模型以隔离监管波动"的帖子在开发者社区被广泛转发。VentureBeat 将其描述为向"硬件主权"的转变——企业需要拥有和控制自己的 AI 基础设施,而非完全依赖可能被政府指令召回或定价突变的云托管模型。

▲ AI工具定价分层时代:Anthropic、Google、OpenAI三大平台2026年6月定价策▲ ▲ AI工具定价分层时代:Anthropic、Google、OpenAI三大平台2026年6月定价策略对比

我们能学到什么

1. 多平台策略不是可选项,是必选项

当一个平台的定价突变时,如果你的整个工作流都绑定在它上面,你只能接受。但如果你的 Skill 配置、MCP 工具、工作流脚本可以在 Claude Code、Codex、Gemini 之间迁移,定价变化就是一次"切换成本"而非"被困成本"。

OpenAI 的 Codex 一键迁移工具已经证明了这种可移植性的价值——能迁移的用户可以立刻抓住竞争对手提供的免费迁移窗口。

2. 区分"交互式使用"和"程序化调用"的预算

Anthropic 的定价改革揭示了一个关键洞察:程序化调用几乎没有训练数据价值,所以平台不愿意补贴。 作为 AI 创业者,你应该:

  • 把预算分成两个池子:交互式开发(值钱的人类反馈数据,平台愿意补贴)和自动化 Agent(纯机器调用,按市场价付费)
  • 自动化任务优先使用性价比更高的模型(如 Gemini 3.5 Flash 或本地部署的开源模型)
  • 只在需要最强推理能力的环节调用旗舰模型

3. 关注本地/离线 AI 能力建设

虽然今天跑一个 3.5T 参数的模型到本地还不现实,但趋势在向"本地优先"转变:

  • Google 的 Gemini 3.5 Flash 已经可以在部分设备端运行
  • 开源社区正在推进模型量化和分布式推理
  • 至少要对"关键工作流不依赖单一云平台"有预案

行动建议

即日可做:

  1. 审计你的 AI 工具账单。 列出所有订阅和 API 调用,区分交互式使用和程序化调用,估算 Anthropic 新政下的实际成本变化。
  2. 测试替代方案。 如果你的 Agent 工作流重度依赖 Claude API,在 OpenAI Codex 免费迁移窗口(30 天内申请,2 个月免费)关闭前至少做一次迁移测试。
  3. 关注 Gemini 3.5 Pro 上线时间。 200 万 Token 上下文是真实的生产力差异——如果你有大型代码库分析、长文档处理需求,这可能是值得升级的场景。

本周可做:

  1. 评估本地模型方案。 调研 Ollama、LM Studio 等本地推理工具能否覆盖你的部分自动化场景,哪怕只是作为云服务的降级备份。
  2. 重新谈判工具预算。 如果 AI 工具是你的核心生产资料,向客户或投资人说明成本结构变化,争取预算调整。

本文由AI辅助创作,经人工审核编辑发布