AI风向

【AI风向】中国模型掀翻美国AI定价:Qwen 3.7 Max让「天价Token」沦为智商税

一篇HN 141分爆文揭开遮羞布:中国企业用5.6倍价差撕碎了美国AI的「OnlyFans经济体」,而多数创业公司还在交"智商税"。

事件回顾

2026年6月6日,一篇题为《The OnlyFans Economy of American AI》的长文在Hacker News上引爆讨论——141 points、196条评论,冲上当日热榜前列。

作者是一位自2022年底就开始深耕AI的老工程师。他用一个极其尖锐的比喻定义了当前AI行业的荒诞局面:美国AI公司正在经营一种"OnlyFans经济"——靠用户的盲目崇拜(simps)和巨额账单(cucks)来支撑离谱的IPO估值。

那谁是打破这个局面的"搅局者"?

答案是阿里巴巴的Qwen 3.7 Max。

这款5月20日发布的模型,在Artificial Analysis智能指数上位列第5,与GPT-5.4(xhigh)平起平坐,超越了Google Gemini 3.5 Flash。SWE-Bench Pro得分60.6%,可圈可点。

但真正让硅谷胆寒的,不是它的跑分,而是它的价格。

5.6倍价差:为什么美国AI公司慌了

看看这些数字:

  • Qwen 3.7 Max:$2.50/百万输入token,$7.50/百万输出token
  • Claude Opus 4.6:比Qwen 3.7 Max贵约5.6倍(来源:Yotta Labs对比评测)
  • GPT-5.5:即使在6月促销价$1.25/$3.75下,仍比Qwen贵8倍(来源:CodingFleet对比分析)

更夸张的是,阿里巴巴在6月1日又发布了Qwen 3.7 Plus——输入仅$0.40/百万token,输出$1.60/百万token。比Max再便宜6倍,还支持图像和视频多模态。

两个模型加在一起,形成了一套完整的"高低搭配"体系:

  • Max负责高精度编码和复杂Agent任务
  • Plus覆盖日常文本生成和多模态场景
  • 同一套API、同一套生态,零迁移成本

这就是中国AI的屠刀:不是跟你比谁更强,而是让你算算账。

文章作者算了一笔个人账:$100的token套餐获得10万credits,不仅能用Qwen 3.7 Max,还附带DeepSeek、Moonshot、MiniMax等多家模型——"我没有任何理由再为美国模型的溢价买单。"

而企业端的账更触目惊心。文中引用了一个匿名案例:某公司在Claude AI上一个月烧掉$500 million——因为没设使用上限。还有团队裁掉员工拥抱AI,结果"AI预算4个月烧完全年"。

原文引用了一句X上的惨痛总结:"A life-changing amount of money was wasted on tokens that did not produce anything of value."(改变人生的一笔钱,全花在了毫无产出的token上。)

HN评论区:撕裂的美国AI共识

196条评论呈现出深层次的撕裂:

一条高赞评论直言:"AI模型正在被中国商品化,这从一开始就是我的立场。阻止美国公司'拥有'AI,是中国的国家安全利益。他们会持续发布模型来确保这件事不会发生。"

另一条则点破了美国企业的真实困境:"大多数美国公司(尤其是受监管企业)不敢碰任何中国模型,即使他们知道从经济上完全说得通。只要这种'禁忌'还成立,卡特尔(Cartel)就能继续收割利润。这是被监管保护的垄断。"

还有工程师指出:"开源模型已经能跟前沿实验室正面竞争,阻止大企业切换的唯一原因是对中国的恐惧。我看不到OpenAI或Anthropic会通过发布顶级开源模型来削弱自己的商业模式——但英伟达最终会这么做的。"

最扎心的一条评论可能是这个——"文章说得对,但当你的CTO连OpenRouter都没听说过,只会看Anthropic的销售PPT时,选Claude就是'最安全'的决策。"

为什么这件事对AI创业者至关重要

1. 成本结构正在被改写

对于一个人公司或小型创业团队,模型成本是最敏感的经营指标之一。

$100月费能做什么?

  • 美国路线:勉强覆盖GPT-5.5或Claude Opus 4.6的基础日常使用
  • 中国路线:Qwen 3.7 Max + DeepSeek + Moonshot + MiniMax,全部打通

这不仅仅是省钱的问题——它改变了"什么业务值得用AI做"的经济等式。

当推理成本下降到原来的1/5到1/8时,原本"用AI不划算"的场景突然变得可行。自动客服、实时翻译、批量代码审查、大规模数据清洗——这些以前"Token费比人工还贵"的场景,正在被中国模型改写。

2. "质量溢价"正在蒸发

一个被多次验证的趋势:从DeepSeek到Qwen,中国模型追平美国前沿模型的时间窗口越来越短。

DeepSeek R1引爆全网是在2025年1月,18个月后的今天:

  • Qwen 3.7 Max已与GPT-5.4在多项基准上持平
  • 有工程师实测"让模型工作数小时并真正完成任务"的能力,Qwen已不输Claude
  • 价格差距不仅没有缩小,反而在扩大——因为中国模型还在持续降价

原文作者的评价一针见血:"如果你不瞎,你会注意到那条S曲线的拐弯处——美国前沿模型已经停止为它们的溢价提供理由。"

3. 供应链风险必须正视

但这不是一篇"吹中国踩美国"的文章。作为一个务实的创业者,你必须看到硬币的另一面:

地缘政治风险是真实存在的。 受监管行业(金融、医疗、政府合同)使用中国模型可能面临合规问题。即使技术上没有问题,客户信任和监管审查也是绕不开的障碍。

生态成熟度差距仍在。 Claude Code、GPT Codex背后的第三方工具链、SDK支持、社区最佳实践——这些"隐性基础设施"美国模型仍有明显优势。

稳定性承诺。 阿里巴巴的API服务质量在过去12个月波动明显,Anthropic和OpenAI在SLA保障上仍更可靠。

行动建议

短期(立即执行)

  1. 用OpenRouter跑一轮真实对比:不要看跑分,把你的实际任务(代码生成、长文写作、数据分析)用Qwen 3.7 Max和Claude Opus各跑一遍,用实际产出做判断,不要靠"感觉"。
  2. 把模型调用分层
  • 高敏感任务(客户数据、合规场景)→ 继续用美国模型
  • 日常开发辅助、内容生成、内部工具 → 切到Qwen/DeepSeek
  • 这么做能在不影响核心质量的前提下,token费直降70-80%
  1. 关注Qwen 3.7 Plus的落地案例:$0.40/百万输入的多模态模型,这个价位已经开始逼近"免费"区间。第一批吃螃蟹的人的实战经验,会比任何跑分都有参考价值。
  1. 建立多模型路由层:不要把鸡蛋放在一个篮子里。用litellm或自建路由层,根据任务类型、成本预算、延迟要求动态选择模型。这是2026年AI创业公司的标配能力。
  2. 关注英伟达的开源动向:原文和评论区都提到了一个关键预期——英伟达最终会发布对标前沿的顶级开源模型。如果这件事在12个月内发生,美国AI的价格体系将面临真正的雪崩。

长期战略思考

  1. 接受AI模型的商品化趋势:无论你喜不喜欢,AI推理正在变成水电煤。创业公司的护城河不在"用了哪个模型",而在"怎么组合工具链、怎么设计工作流、怎么积累领域数据"。把时间花在后者上,而不是追着跑分榜切换模型。

本文讨论的中国模型切换策略需要综合考虑地缘政治风险、客户信任、监管合规、服务质量稳定性等因素。实际决策应结合自身业务场景和法律环境审慎评估。各模型定价和性能数据截至2026年6月8日,请以官方最新公告为准。


#AI创业 #模型定价 #Qwen #降本增效 #一人公司

AI辅助创作,经人工审核编辑发布

本文由AI辅助创作,经人工审核编辑发布