5月19日Google I/O大会上,Gemini 3.5 Flash被设为Gemini App和AI搜索的默认模型,直接覆盖数十亿用户。这不是一次普通的模型升级——这是一次对AI分发渠道的重新定义。
事件回顾
5月19日,Google在年度I/O大会上发布Gemini 3.5 Flash,跳过了预览阶段直接上线正式版。这不是一个渐进式迭代——Google将其定位为"agentic模型",并在发布会上明确宣布:3.5 Flash即日起成为Gemini App和AI Mode搜索的默认模型,面向全球数十亿用户提供服务。
同一天,Google还同步发布了Google Antigravity——一个支持多Agent协作的开发框架——以及Gemini Omni多模态模型,但3.5 Flash才是这次大会的真正主角。
具体来说,3.5 Flash的覆盖范围包括:面向普通用户的Gemini App和AI搜索模式;面向开发者的Google AI Studio、Gemini API和Android Studio;面向企业的Gemini Enterprise Agent Platform。这是Google有史以来最大规模的一次模型推送。
从技术指标看,3.5 Flash确实配得上"默认模型"的地位。它支持104万token的超大上下文窗口和6.5万token的单次输出上限;在Terminal-Bench 2.1上得分76.2%,MCP Atlas得分83.6%,均超过了此前的旗舰模型Gemini 3.1 Pro;输出token速度号称是同类前沿模型的4倍。DataCamp的评价直白:"以前的规则是'快、便宜、强,三选二',3.5 Flash把这个规则打破了。"

▲ Gemini 3.5 Flash核心基准数据:Terminal-Bench 76.2%、MCP Atlas 83.6%、4倍输出速度。来源:Google I/O 2026 / DataCamp
不过最耐人寻味的是价格。3.5 Flash的API定价为输入1.50美元/百万token、输出9美元/百万token——这是前代3 Flash Preview的3倍,3.1 Flash-Lite的6倍。知名开发者Simon Willison在第一时间点评道:"更贵了,但Google还是把它推给了自己的所有免费用户。"
为什么这对AI创业者如此重要
第一,分发渠道的「默认效应」正在被巨头垄断。 当一个AI模型成为数十亿人打开App或搜索框时的默认选项,创业公司想在终端用户层面与它竞争,等于用自行车去追高铁。这不是能力差距,是渠道碾压。Google拥有搜索、Android、Gmail、YouTube,当所有入口都默认接入同一个模型时,"AI分发"本身就成了巨头的护城河。
第二,Agent能力下沉到消费级。 3.5 Flash的核心卖点不是写诗或聊天,而是"agentic performance"——执行多步骤任务、调用工具、长时间规划。Google把它推给普通用户意味着:全世界最主流的人群即将第一次大规模使用Agent。这不是开发者的内部实验,是全民级别的产品教育。
第三,API价格上涨对创业者构成直接成本压力。 3倍到6倍的涨价看起来只差几美元,但对调用量大的AI产品来说,这意味着成本结构的根本性改变。一个每月消耗1亿token的AI应用,从3.1 Flash-Lite切换到3.5 Flash,月度API成本将从约930美元飙升至约9000美元——增长近10倍。

▲ Gemini Flash系列API定价三年对比:从3.1 Flash-Lite的$0.25/$1.5到3.5 Flash的$1.50/$9,最高涨幅600%。来源:Simon Willison / Artificial Analysis
第四,竞争格局正在从"模型军备竞赛"转向"生态军备竞赛"。 Google用Antigravity框架捆绑3.5 Flash,等于在告诉开发者:别只用我的模型,把我的整个Agent生态一起用。这和OpenAI的Responses API策略如出一辙——厂商要的不再是API调用量,而是把开发者锁在自己的工具链里。
有一个值得注意的对比数据:根据Artificial Analysis的基准测试成本统计,运行同一套评测,Gemini 3.5 Flash花费1551美元,而Gemini 3.1 Pro只花了892美元,前代3 Flash Preview仅278美元。一个Flash级别的模型,评测成本竟然超过了上一代Pro模型。 这个趋势如果持续,明年AI创业的启动成本将完全不同。
我们能从中学到什么
渠道比模型更重要。 如果你的AI产品依赖终端用户直接使用,你正在和"免费+默认"的Google竞争。出路只有两条:要么在产品体验上做到10倍差异,要么完全避开巨头的核心路径——做垂直场景、做企业工具、做巨头不想做的"脏活累活"。
Agent能力不再是差异化卖点。 当Google把Agent功能做成默认体验时,单纯宣传"我们的AI能自动完成X"已经没有说服力。你需要回答的是:你的Agent在什么场景下比Google的默认Agent更懂用户?答案往往藏在数据壁垒和行业know-how里。
定价策略要准备Plan B。 如果你的核心模型供应商涨价3倍,你的产品利润率还剩多少?现在就开始做模型切换测试——在多个供应商之间建立热备方案,不要让任何一个模型厂商成为你商业模式的单点故障。
关注Google Antigravity的开放程度。 如果Antigravity是一个开放的框架,可以在任何模型上运行,那它就是AI创业者的基础设施级机会。如果它只服务于Google自己的模型生态,那它就是又一个围墙花园。现在离判断还太早,但值得持续跟踪。
行动建议
- 立刻测试3.5 Flash在你产品中的表现。 到Google AI Studio免费试用,重点测试它在多步骤任务(如数据检索+分析+输出)和工具调用上的表现,对比你当前使用的模型质量。
- 做一次成本压力测试。 假设你的API成本翻3倍,哪些功能的调用量可以优化?哪些场景可以用更便宜的模型?做一个"成本翻倍也能盈利"的产品架构预案。
- 观察Gemini App的Agent功能上线节奏。 关注Google如何向普通用户介绍和引导使用Agent能力——这是免费的"用户教育"素材,也是你判断市场成熟度的信号灯。
- 重新审视你的分发策略。 如果你的产品入口是网页搜索或App内AI对话,考虑是否要做一个"Google默认AI做不到"的功能清单,并以此为核心卖点。
Gemini 3.5 Flash虽然性能亮眼,但目前缺少Computer Use能力(无法控制用户电脑执行操作),知识截止于2025年1月。如果你需要实时信息或桌面操作,仍需额外处理。各模型更新频繁,API定价可能随时调整,建议定期检查Google AI官方定价页面。
#AI创业 #Gemini #GoogleIO #Agent #AI风向
本文由AI辅助创作,经人工审核编辑发布
