【AI风向】GPT-5.5比旗舰模型贵了6倍，Google三年涨价300%：AI模型正在集体涨价

知名VC Tomasz Tunguz最新分析：三大AI厂商定价策略分道扬镳，但方向出奇一致——都在涨价。对AI创业者来说，这意味着成本结构正在发生根本性变化。

事件回顾

5月20日，Theory Ventures合伙人、前Google PM Tomasz Tunguz发布了一篇名为《The Unsustainable Subsidy》的博客文章，用三张图表揭示了当下AI行业最敏感的神经：模型定价。

Tunguz追踪了Google、OpenAI、Anthropic三家公司的旗舰模型定价历史，发现了一个令人不安的趋势。

Google Gemini的定价在三年内涨了三倍。从最初的低价策略一路爬升，Gemini 3.1 Pro当前定价为输入2美元/百万token、输出12美元/百万token。虽然仍是三家中的"价格屠夫"，但涨势明确。

OpenAI走了一条更复杂的曲线。旗舰模型价格先降后升——补贴期结束后开始回涨。GPT-5.5目前定价输入5美元/百万token、输出30美元/百万token——这个输出价格是Google的2.5倍。

Anthropic是唯一保持定价相对稳定的玩家。Claude Opus 4.7定价输入5美元/百万token、输出25美元/百万token，与去年持平甚至略有下降。

但无论曲线形状如何，终点都在同一个方向：涨。

涨价背后的三个底层逻辑

第一，烧钱竞赛不可持续。 三大厂商的资本支出（capex）都在创纪录。JP Morgan估算，AI基建要获得10%回报率，整个行业需要6500亿美元年营收——而当前只有约250亿美元。26倍的差距让补贴变得不可能。

第二，战略切换：从抢份额到保利润。 Tunguz提出了一个简明的框架：资金充裕时降价抢市场，资金紧张时涨价保利润。"现在三者都处于后一种状态。"

第三，模型能力的"边际效应递减"。 新一代模型的性能提升幅度不如前代，但训练和推理成本却大幅增加。如果GPT-5.5的推理成本是GPT-4o的3-5倍但效果提升只有30%，涨价就成了必然。

以下是当前三大厂商旗舰模型的定价对比：

厂商	模型	输入($/1M token)	输出($/1M token)
Google	Gemini 3.1 Pro	$2.00	$12.00
Anthropic	Claude Opus 4.7	$5.00	$25.00
OpenAI	GPT-5.5	$5.00	$30.00

来源：Tom Tunguz博客（2026年5月20日）

三大AI模型定价对比
▲ 2026年5月三大AI厂商旗舰模型定价对比（来源：Tom Tunguz）

对AI创业者的三层影响

第一层：API调用成本直接上升。 如果你的产品重度依赖某个特定模型，涨价直接侵蚀利润。一个日均100万token输出的AI应用，用GPT-5.5月成本约900美元——一年前用GPT-4o可能只要300美元。

第二层：模型锁定风险加剧。 当你在某个模型生态（如OpenAI的Assistants API或Google的Managed Agents）上深度构建后，迁移成本极高。厂商涨价时你几乎没有议价权。

第三层：创业赛道重新洗牌。 高模型成本会淘汰那些"薄利多销"的AI套壳产品，同时利好那些能创造高附加值的深度应用——同样的API成本，产出价值更高的产品才能存活。

我们能学到什么

其一，不要把定价策略建立在"模型会越来越便宜"的假设上。 2023-2025年确实是模型降价的黄金时代，但那是因为VC补贴和巨头抢份额。2026年的信号很明确：那个时代结束了。

其二，多模型架构是成本对冲的关键。 同一任务，Google Gemini可能比GPT-5.5便宜60%。在非关键场景下使用更便宜的模型，在核心场景使用最强模型，这种混合策略可以大幅降低总成本。

其三，本地模型的价值正在回归。 当云端API持续涨价，开源模型（如Llama 4、Gemma 4、Mistral）在特定场景下的性价比优势会越来越明显。对于句子分类、文本摘要等标准化任务，一个微调过的本地小模型可能比调用GPT-5.5更划算。

数据深挖：涨价幅度具体有多大

让我们把Tunguz的数据展开看细节。

Google Gemini的涨价轨迹最令人担忧。2024年初Gemini Pro定价约为0.50/1.50美元（输入/输出，每百万token），到2026年5月Gemini 3.1 Pro涨到2.00/12.00美元。三年累计涨幅输入400%、输出800%。虽然仍是三家最低价，但涨幅远超通胀。

OpenAI走了一条"先补贴后收割"的经典互联网路线。 GPT-4o时代定价降到约2.50/10美元，扩张市场份额。GPT-5.5直接跳到5.00/30美元，输出价格涨了200%。OpenAI CFO Sarah Friar在2025年底WSJ Tech Live上甚至提到需要"政府担保"来融资芯片和数据中心——虽然24小时内被三连否认，但这暴露出成本压力的真实程度。

Anthropic的"稳定"可能是假象。 Claude Opus 4.7维持了5.00/25美元的定价，但这是在公司大规模融资（Google投资20亿美元等）支撑下实现的。Dario Amodei本人在2026年2月坦承："如果营收预测差一年，没有任何对冲能阻止我们破产。"

一个关键数字值得注意：按JP Morgan的模型，整个AI行业需要年营收6500亿美元才能给当前capex带来10%回报。而2025年实际运行率约250亿美元——差距26倍。这不是"模型贵不贵"的问题，而是整个商业模式需要重新校准。

AI模型API价格三年走势
▲ 2024-2026年三大AI厂商模型输入价格走势（单位：美元/百万token）

行动建议

1. 立即做一次API成本审计。 统计过去30天各模型的调用量和费用，计算你的"加权平均token成本"。这个数字将是你未来优化的基准线。

2. 建立模型降级机制。 为你的产品设计三层模型调用策略：核心路径用最强模型，次关键路径用性价比模型，非关键路径用小模型或规则引擎。例如：客户对话摘要用Gemini Flash就够了，不需要GPT-5.5。

3. 关注开源模型进展。 Gemma 4（Google刚在I/O 2026上开源）、Llama 4等模型的能力正在快速接近闭源模型。如果你的场景不要求SOTA推理能力，现在就是评估迁移的时机。

4. 在定价策略中预留模型成本缓冲。 如果你的SaaS产品月费是29美元，而单用户月均API成本是5美元——当API涨价50%时，你的毛利率会从83%降到74%。建议在模型成本基础上保留至少30%缓冲。

5. 关注Google的Managed Agents定价。 Google I/O 2026新推出的Managed Agents服务（基于Gemini 3.5 Flash和Antigravity）可能提供不同的计价方式——按Agent会话而非按token。这对高频调用场景可能更划算。

常见问题

问：模型会一直涨下去吗？ 不一定。Tunguz的框架是"现金充裕时降价抢份额，紧张时涨价保利润"。如果未来有新的融资潮或硬件突破（如TPU v8、更高效的推理芯片），价格可能再次下行。但2026年不建议押注降价。

问：用小模型替代大模型，效果会差多少？ 取决于场景。文本分类、关键词提取等结构化任务，小模型（Gemini Flash、Claude Haiku）的效果可能达到大模型的90-95%。但复杂推理、长文写作等任务差距较大。关键是区分场景。

问：中国的AI模型（DeepSeek、Qwen等）价格如何？ 中国模型走的是另一条定价曲线——DeepSeek一直以极低价格著称（输入约0.14美元/百万token），Qwen也保持了竞争力。如果你的业务允许使用国产模型且数据合规，这可以大幅降低成本。但要注意能力和生态差异。

问：AI创业者现在最该做什么？ 不要恐慌，但要清醒。模型涨价是结构性趋势，不是短期波动。三个优先事项：审计成本、建立多模型架构、评估开源替代方案。早做准备的创业者会比后知后觉的竞争者多出12-18个月缓冲期。

#AI创业 #AI模型 #开源模型 #成本管控 #一人公司

本文由AI辅助创作，经人工审核编辑发布