AI风向

【AI风向】前沿AI价格暴涨3倍,外包+开源模型成本仅1/30,AI创业的算力账要重算了

当GPT-5.5的价格已经是GPT-5的3倍,而DeepSeek的价格是前者的1/30,AI创业者的算力账单正在被彻底重写。

事件回顾

5月26日,SignalBloom AI发表了一篇引发广泛讨论的分析文章《Outsourcing plus local AI will soon become more economical vs. frontier labs》,在Hacker News上迅速获得174分和191条评论,登上当日热榜。

文章的核心论点简单而犀利:前沿AI实验室正在集体涨价,而开源模型和外包工程师的组合正在逼近"足够好"的临界点——届时,花钱雇一个海外工程师+给他DeepSeek API Key,可能比直接买前沿模型的API更划算。

这不是空穴来风。来看一组作者整理的价格变动数据:

  • GPT-5.5(2026年4月发布):输入$5/百万token,输出$30/百万token,比两个月前的GPT-5.4翻了一倍,更是8个月前GPT-5($1.25/$10)的3倍以上
  • Gemini 3.5 Flash:$1.50/$9.00,比前代Gemini-3-flash-preview($0.50/$3.00)涨了3倍
  • Anthropic Opus-4.7:虽然表面单价没涨,但新tokenizer让token消耗量增加了32%-47%——变相涨价。

综合计算缓存命中率后,作者给出了一个惊人的对比:

  • OpenAI 混合价格:$2.80/百万agentic token
  • Anthropic 混合价格:$2.82/百万agentic token
  • DeepSeek 混合价格:$0.094/百万agentic token

差距是30倍。

双重挤压:用量涨,单价也涨

更值得警惕的是,这轮涨价并非发生在用量下降的背景下。恰恰相反,"Tokenmaxxing"(Token最大化主义)正在席卷硅谷。

据腾讯新闻报道,2026年2月全球前十AI模型的Token总消耗量突破27万亿,国产大模型贡献超五成。中国整体日均Token消耗从2024年初的千亿级飙升至万亿级。工程师们甚至在竞相消耗尽可能多的AI token,以证明自己"拥抱AI"——这已经成为硅谷的一种内部文化现象。

用量暴涨+价格暴涨=企业的AI账单正在失控。

Uber COO Andrew Macdonald在本周接受Business Insider采访时直言:"AI spending is getting harder to justify"(AI支出越来越难以为继)。Uber总裁也在The Verge的采访中表达了同样的担忧。当连硅谷巨头都开始对AI账单感到肉疼时,中小创业公司的处境可想而知。

DeepSeek的"反向操作":永久降价75%

而就在前沿实验室集体涨价的同时,DeepSeek却在做完全相反的事。

5月22日,DeepSeek官方宣布:DeepSeek-V4-Pro模型API永久降价75%,从原价降至1/4。此前的2.5折限时优惠结束后,正式定价直接锁定在优惠水平。据Caixin Global报道,DeepSeek正在筹备新一轮融资,但即便面临资金需求,其定价策略依然选择了"低价普惠"路线。

这不是孤例。证券之星的报道指出,DeepSeek V4-Pro的API价格仅为GPT-5.5 Pro加权价格的零头。中国大模型市场正在经历一场残酷但有益的价格战——对于AI创业者来说,这意味着前所未有的低成本算力。

这对AI创业者意味着什么?

SignalBloom的文章提出了一个关键洞察:AI agent在编码任务上已经超越了人类工程师,但在长期记忆、元记忆(知道自己不知道什么)、证据充分性评估等维度上仍然落后。 这意味着,现阶段的"最佳性价比"方案不是纯AI自主运行,而是"人类工程师+足够好的AI模型"的组合。

具体来说,作者构建了一个经济模型:

  • 假设外包工程师月薪$1100(一些HN评论者认为这个数字偏低,实际可能在$2000-5000区间)
  • 给他一个DeepSeek API Key($0.094/百万token)
  • 对比直接使用前沿模型API的纯token成本

结论是:随着token消耗量持续增长和前沿模型继续涨价,外包+开源模型的组合将在未来几个月内变得越来越有吸引力。 这个动态为前沿实验室的定价设定了一个"天花板"——价格不能无限涨下去,因为替代方案正在快速成熟。

三个值得关注的趋势

1. "人+AI"混合模式正在成为最优解

HN热评中,一位用户分享了他朋友公司(一家美国软件公司)的真实案例:他们正准备裁掉东欧的几个编程团队,用少量美国程序员+AI替代。 "他们生产效率大幅提升,新功能上线速度更快。"

这不是AI替代人的故事,而是"会用AI的人替代不会用AI的人"的故事。对于AI创业者来说,这意味着:投资于自己和团队的AI使用能力,比投资于最贵的模型API更重要。

2. 本地AI部署的障碍正在被突破

Eagle 3.1同日发布——这是EAGLE团队、vLLM团队和TorchSpec团队的联合成果,专注于推测解码(speculative decoding)加速。这类技术进步正在让本地部署LLM的成本和速度接近云端API。

尽管有HN评论者指出"内存成本让本地AI不太现实",但硬件价格也在下降,推理优化技术迭代飞快。"本地AI+外包"这条路线不是明天就会实现的,但它每过一个月就变得更可行一点。

3. 前沿模型的"溢价"还值不值?

HN上最高赞评论问得很直白:"当前闭源前沿模型确实比DeepSeek最新版更强。但能力差距是否足以 justify 30倍的价格差?"

对于大多数AI创业场景——写代码、写文案、做客服、处理数据——"足够好"比"最强"更有经济学意义。 除非你的业务核心依赖于前沿模型独有的推理能力(比如复杂的数学证明或前沿科研),否则30倍的价格差很难在ROI上成立。

行动建议

  1. 重新审视你的AI支出结构:列出每个AI API的月花费,然后问自己:这个任务真的需要GPT-5.5吗?换个便宜的模型效果差多少?
  2. 尝试DeepSeek V4-Pro:75%的降价意味着它的性价比已经远超大部分闭源选项。对于代码生成、文本处理等常规任务,实测表现已经不输前沿模型太多。
  3. 投资于Prompt Engineering和AI使用技能:正如SignalBloom文章指出的——同样的模型,高手和普通人的使用效果差异巨大。这可能是目前ROI最高的AI投资。
  4. 关注本地部署方案:即使现在不部署,持续跟踪vLLM、Ollama等项目的进展。当本地推理的成本曲线越过你的API账单时,切换的时机就到了。

底线

前沿AI实验室正在走一条危险的路——在用量暴涨的时候同步涨价。这不仅会推动用户寻找替代方案,更会加速开源模型和本地部署生态的成熟。AI创业者的算力账,是时候重算了。


*数据来源:SignalBloom AI分析文章(2026年5月26日)、Hacker News讨论、Caixin Global、证券之星、腾讯新闻、Business Insider、The Verge* *写作声明:本文由AI辅助创作,经人工审核编辑*

#AI创业 #AI成本 #DeepSeek #前沿模型定价 #Token经济 #一人公司

本文由AI辅助创作,经人工审核编辑发布