AI风向

【AI风向】GPT-5.5比旗舰模型贵了6倍,Google三年涨价300%:AI模型正在集体涨价

知名VC Tomasz Tunguz最新分析:三大AI厂商定价策略分道扬镳,但方向出奇一致——都在涨价。对AI创业者来说,这意味着成本结构正在发生根本性变化。

事件回顾

5月20日,Theory Ventures合伙人、前Google PM Tomasz Tunguz发布了一篇名为《The Unsustainable Subsidy》的博客文章,用三张图表揭示了当下AI行业最敏感的神经:模型定价。

Tunguz追踪了Google、OpenAI、Anthropic三家公司的旗舰模型定价历史,发现了一个令人不安的趋势。

Google Gemini的定价在三年内涨了三倍。从最初的低价策略一路爬升,Gemini 3.1 Pro当前定价为输入2美元/百万token、输出12美元/百万token。虽然仍是三家中的"价格屠夫",但涨势明确。

OpenAI走了一条更复杂的曲线。旗舰模型价格先降后升——补贴期结束后开始回涨。GPT-5.5目前定价输入5美元/百万token、输出30美元/百万token——这个输出价格是Google的2.5倍。

Anthropic是唯一保持定价相对稳定的玩家。Claude Opus 4.7定价输入5美元/百万token、输出25美元/百万token,与去年持平甚至略有下降。

但无论曲线形状如何,终点都在同一个方向:涨。

涨价背后的三个底层逻辑

第一,烧钱竞赛不可持续。 三大厂商的资本支出(capex)都在创纪录。JP Morgan估算,AI基建要获得10%回报率,整个行业需要6500亿美元年营收——而当前只有约250亿美元。26倍的差距让补贴变得不可能。

第二,战略切换:从抢份额到保利润。 Tunguz提出了一个简明的框架:资金充裕时降价抢市场,资金紧张时涨价保利润。"现在三者都处于后一种状态。"

第三,模型能力的"边际效应递减"。 新一代模型的性能提升幅度不如前代,但训练和推理成本却大幅增加。如果GPT-5.5的推理成本是GPT-4o的3-5倍但效果提升只有30%,涨价就成了必然。

以下是当前三大厂商旗舰模型的定价对比:

厂商模型输入($/1M token)输出($/1M token)
GoogleGemini 3.1 Pro$2.00$12.00
AnthropicClaude Opus 4.7$5.00$25.00
OpenAIGPT-5.5$5.00$30.00

来源:Tom Tunguz博客(2026年5月20日)

三大AI模型定价对比
▲ 2026年5月三大AI厂商旗舰模型定价对比(来源:Tom Tunguz)

对AI创业者的三层影响

第一层:API调用成本直接上升。 如果你的产品重度依赖某个特定模型,涨价直接侵蚀利润。一个日均100万token输出的AI应用,用GPT-5.5月成本约900美元——一年前用GPT-4o可能只要300美元。

第二层:模型锁定风险加剧。 当你在某个模型生态(如OpenAI的Assistants API或Google的Managed Agents)上深度构建后,迁移成本极高。厂商涨价时你几乎没有议价权。

第三层:创业赛道重新洗牌。 高模型成本会淘汰那些"薄利多销"的AI套壳产品,同时利好那些能创造高附加值的深度应用——同样的API成本,产出价值更高的产品才能存活。

我们能学到什么

其一,不要把定价策略建立在"模型会越来越便宜"的假设上。 2023-2025年确实是模型降价的黄金时代,但那是因为VC补贴和巨头抢份额。2026年的信号很明确:那个时代结束了。

其二,多模型架构是成本对冲的关键。 同一任务,Google Gemini可能比GPT-5.5便宜60%。在非关键场景下使用更便宜的模型,在核心场景使用最强模型,这种混合策略可以大幅降低总成本。

其三,本地模型的价值正在回归。 当云端API持续涨价,开源模型(如Llama 4、Gemma 4、Mistral)在特定场景下的性价比优势会越来越明显。对于句子分类、文本摘要等标准化任务,一个微调过的本地小模型可能比调用GPT-5.5更划算。

数据深挖:涨价幅度具体有多大

让我们把Tunguz的数据展开看细节。

Google Gemini的涨价轨迹最令人担忧。2024年初Gemini Pro定价约为0.50/1.50美元(输入/输出,每百万token),到2026年5月Gemini 3.1 Pro涨到2.00/12.00美元。三年累计涨幅输入400%、输出800%。虽然仍是三家最低价,但涨幅远超通胀。

OpenAI走了一条"先补贴后收割"的经典互联网路线。 GPT-4o时代定价降到约2.50/10美元,扩张市场份额。GPT-5.5直接跳到5.00/30美元,输出价格涨了200%。OpenAI CFO Sarah Friar在2025年底WSJ Tech Live上甚至提到需要"政府担保"来融资芯片和数据中心——虽然24小时内被三连否认,但这暴露出成本压力的真实程度。

Anthropic的"稳定"可能是假象。 Claude Opus 4.7维持了5.00/25美元的定价,但这是在公司大规模融资(Google投资20亿美元等)支撑下实现的。Dario Amodei本人在2026年2月坦承:"如果营收预测差一年,没有任何对冲能阻止我们破产。"

一个关键数字值得注意:按JP Morgan的模型,整个AI行业需要年营收6500亿美元才能给当前capex带来10%回报。而2025年实际运行率约250亿美元——差距26倍。这不是"模型贵不贵"的问题,而是整个商业模式需要重新校准。

AI模型API价格三年走势
▲ 2024-2026年三大AI厂商模型输入价格走势(单位:美元/百万token)

行动建议

1. 立即做一次API成本审计。 统计过去30天各模型的调用量和费用,计算你的"加权平均token成本"。这个数字将是你未来优化的基准线。

2. 建立模型降级机制。 为你的产品设计三层模型调用策略:核心路径用最强模型,次关键路径用性价比模型,非关键路径用小模型或规则引擎。例如:客户对话摘要用Gemini Flash就够了,不需要GPT-5.5。

3. 关注开源模型进展。 Gemma 4(Google刚在I/O 2026上开源)、Llama 4等模型的能力正在快速接近闭源模型。如果你的场景不要求SOTA推理能力,现在就是评估迁移的时机。

4. 在定价策略中预留模型成本缓冲。 如果你的SaaS产品月费是29美元,而单用户月均API成本是5美元——当API涨价50%时,你的毛利率会从83%降到74%。建议在模型成本基础上保留至少30%缓冲。

5. 关注Google的Managed Agents定价。 Google I/O 2026新推出的Managed Agents服务(基于Gemini 3.5 Flash和Antigravity)可能提供不同的计价方式——按Agent会话而非按token。这对高频调用场景可能更划算。

常见问题

问:模型会一直涨下去吗? 不一定。Tunguz的框架是"现金充裕时降价抢份额,紧张时涨价保利润"。如果未来有新的融资潮或硬件突破(如TPU v8、更高效的推理芯片),价格可能再次下行。但2026年不建议押注降价。

问:用小模型替代大模型,效果会差多少? 取决于场景。文本分类、关键词提取等结构化任务,小模型(Gemini Flash、Claude Haiku)的效果可能达到大模型的90-95%。但复杂推理、长文写作等任务差距较大。关键是区分场景。

问:中国的AI模型(DeepSeek、Qwen等)价格如何? 中国模型走的是另一条定价曲线——DeepSeek一直以极低价格著称(输入约0.14美元/百万token),Qwen也保持了竞争力。如果你的业务允许使用国产模型且数据合规,这可以大幅降低成本。但要注意能力和生态差异。

问:AI创业者现在最该做什么? 不要恐慌,但要清醒。模型涨价是结构性趋势,不是短期波动。三个优先事项:审计成本、建立多模型架构、评估开源替代方案。早做准备的创业者会比后知后觉的竞争者多出12-18个月缓冲期。


#AI创业 #AI模型 #开源模型 #成本管控 #一人公司

本文由AI辅助创作,经人工审核编辑发布