【AI风向】Gemini 3.5 Flash成为数十亿用户默认模型：Google的「全民Agent化」赌注

5月19日Google I/O大会上，Gemini 3.5 Flash被设为Gemini App和AI搜索的默认模型，直接覆盖数十亿用户。这不是一次普通的模型升级——这是一次对AI分发渠道的重新定义。

事件回顾

5月19日，Google在年度I/O大会上发布Gemini 3.5 Flash，跳过了预览阶段直接上线正式版。这不是一个渐进式迭代——Google将其定位为"agentic模型"，并在发布会上明确宣布：3.5 Flash即日起成为Gemini App和AI Mode搜索的默认模型，面向全球数十亿用户提供服务。

同一天，Google还同步发布了Google Antigravity——一个支持多Agent协作的开发框架——以及Gemini Omni多模态模型，但3.5 Flash才是这次大会的真正主角。

具体来说，3.5 Flash的覆盖范围包括：面向普通用户的Gemini App和AI搜索模式；面向开发者的Google AI Studio、Gemini API和Android Studio；面向企业的Gemini Enterprise Agent Platform。这是Google有史以来最大规模的一次模型推送。

从技术指标看，3.5 Flash确实配得上"默认模型"的地位。它支持104万token的超大上下文窗口和6.5万token的单次输出上限；在Terminal-Bench 2.1上得分76.2%，MCP Atlas得分83.6%，均超过了此前的旗舰模型Gemini 3.1 Pro；输出token速度号称是同类前沿模型的4倍。DataCamp的评价直白："以前的规则是'快、便宜、强，三选二'，3.5 Flash把这个规则打破了。"

▲ Gemini 3.5 Flash核心基准数据：Terminal-Bench 76.2%、MCP Atlas 83.6%、4倍输出速度。来源：Google I/O 2026 / DataCamp

不过最耐人寻味的是价格。3.5 Flash的API定价为输入1.50美元/百万token、输出9美元/百万token——这是前代3 Flash Preview的3倍，3.1 Flash-Lite的6倍。知名开发者Simon Willison在第一时间点评道："更贵了，但Google还是把它推给了自己的所有免费用户。"

为什么这对AI创业者如此重要

第一，分发渠道的「默认效应」正在被巨头垄断。 当一个AI模型成为数十亿人打开App或搜索框时的默认选项，创业公司想在终端用户层面与它竞争，等于用自行车去追高铁。这不是能力差距，是渠道碾压。Google拥有搜索、Android、Gmail、YouTube，当所有入口都默认接入同一个模型时，"AI分发"本身就成了巨头的护城河。

第二，Agent能力下沉到消费级。 3.5 Flash的核心卖点不是写诗或聊天，而是"agentic performance"——执行多步骤任务、调用工具、长时间规划。Google把它推给普通用户意味着：全世界最主流的人群即将第一次大规模使用Agent。这不是开发者的内部实验，是全民级别的产品教育。

第三，API价格上涨对创业者构成直接成本压力。 3倍到6倍的涨价看起来只差几美元，但对调用量大的AI产品来说，这意味着成本结构的根本性改变。一个每月消耗1亿token的AI应用，从3.1 Flash-Lite切换到3.5 Flash，月度API成本将从约930美元飙升至约9000美元——增长近10倍。

API定价暴涨
▲ Gemini Flash系列API定价三年对比：从3.1 Flash-Lite的$0.25/$1.5到3.5 Flash的$1.50/$9，最高涨幅600%。来源：Simon Willison / Artificial Analysis

第四，竞争格局正在从"模型军备竞赛"转向"生态军备竞赛"。 Google用Antigravity框架捆绑3.5 Flash，等于在告诉开发者：别只用我的模型，把我的整个Agent生态一起用。这和OpenAI的Responses API策略如出一辙——厂商要的不再是API调用量，而是把开发者锁在自己的工具链里。

有一个值得注意的对比数据：根据Artificial Analysis的基准测试成本统计，运行同一套评测，Gemini 3.5 Flash花费1551美元，而Gemini 3.1 Pro只花了892美元，前代3 Flash Preview仅278美元。一个Flash级别的模型，评测成本竟然超过了上一代Pro模型。 这个趋势如果持续，明年AI创业的启动成本将完全不同。

我们能从中学到什么

渠道比模型更重要。 如果你的AI产品依赖终端用户直接使用，你正在和"免费+默认"的Google竞争。出路只有两条：要么在产品体验上做到10倍差异，要么完全避开巨头的核心路径——做垂直场景、做企业工具、做巨头不想做的"脏活累活"。

Agent能力不再是差异化卖点。 当Google把Agent功能做成默认体验时，单纯宣传"我们的AI能自动完成X"已经没有说服力。你需要回答的是：你的Agent在什么场景下比Google的默认Agent更懂用户？答案往往藏在数据壁垒和行业know-how里。

定价策略要准备Plan B。 如果你的核心模型供应商涨价3倍，你的产品利润率还剩多少？现在就开始做模型切换测试——在多个供应商之间建立热备方案，不要让任何一个模型厂商成为你商业模式的单点故障。

关注Google Antigravity的开放程度。 如果Antigravity是一个开放的框架，可以在任何模型上运行，那它就是AI创业者的基础设施级机会。如果它只服务于Google自己的模型生态，那它就是又一个围墙花园。现在离判断还太早，但值得持续跟踪。

行动建议

立刻测试3.5 Flash在你产品中的表现。 到Google AI Studio免费试用，重点测试它在多步骤任务（如数据检索+分析+输出）和工具调用上的表现，对比你当前使用的模型质量。
做一次成本压力测试。 假设你的API成本翻3倍，哪些功能的调用量可以优化？哪些场景可以用更便宜的模型？做一个"成本翻倍也能盈利"的产品架构预案。
观察Gemini App的Agent功能上线节奏。 关注Google如何向普通用户介绍和引导使用Agent能力——这是免费的"用户教育"素材，也是你判断市场成熟度的信号灯。
重新审视你的分发策略。 如果你的产品入口是网页搜索或App内AI对话，考虑是否要做一个"Google默认AI做不到"的功能清单，并以此为核心卖点。

Gemini 3.5 Flash虽然性能亮眼，但目前缺少Computer Use能力（无法控制用户电脑执行操作），知识截止于2025年1月。如果你需要实时信息或桌面操作，仍需额外处理。各模型更新频繁，API定价可能随时调整，建议定期检查Google AI官方定价页面。

#AI创业 #Gemini #GoogleIO #Agent #AI风向

本文由AI辅助创作，经人工审核编辑发布