AI风向

【AI风向】AI账单失控!AT&T、Meta、Uber集体急刹车:从"疯狂烧钱"到"严防死守",AI创业者必须看懂的3个信号

当《金融时报》用"We created a monster"做标题、HN 119分热议时,事情已经不只是"省点钱"那么简单——这是一场对AI真实ROI的全行业清算。

▲ 图1:从Tokenmaxxing到Tokenminimizing——AT&T、Meta、Uber▲ ▲ 图1:从Tokenmaxxing到Tokenminimizing——AT&T、Meta、Uber、微软的AI预算急刹车(来源:The Information / Financial Times)

事件回顾

6月18日,科技媒体 The Information 率先披露:AT&T、Meta、Uber、微软等科技巨头正在全面收紧内部AI工具使用政策。曾经鼓励员工"无限使用AI"(tokenmaxxing)的时代正式终结,取而代之的是严格的"算力最小化"(tokenminimizing)配额制度。

次日,英国《金融时报》以"We created a monster"为题深入报道,指出多家企业低估了AI落地的工程复杂度,AI账单正在失控。同一天,Hacker News上该报道斩获119分、104条评论,登上热榜。中文科技媒体IT之家、凤凰科技等也迅速跟进,报道称包括腾讯在内的中国大厂同样在下调员工Token额度。

这场"急刹车"并非个案。The Information的文章标题精准概括了转变:从"Tokenmaxxing"到"Tokenminimizing"——两个新造词之间,是硅谷两年AI狂热后的第一次集体反思。

Tokenmaxxing真相:工程师在"刷"AI预算

最荒诞的细节来自Meta。一位匿名工程师在内部论坛透露:"我们部门上个月多花了40%的token额度,因为Q3考核要看这个指标。"

这就是Tokenmaxxing的真相:当企业把AI使用量设为KPI,工程师就会像刷短视频时长一样"刷"token——甚至故意用AI生成大量无用内容来填充考核指标。一位产品经理描述得更直接:"就像把计算器开着让它空转,只因为老板要看'使用时长'。"

但账单是真实的。Uber目前允许每位员工每月最高1500美元的AI工具费用。表面看不算高——毕竟高级工程师年薪40万美元(月薪约3.3万)。但问题在于,大多数AI使用场景的实际产出远低于成本。一位HN评论者直言:"AI对于大多数使用场景来说,根本不值它花掉的钱。"

微软、AT&T也在同步收紧。从"随便用"到"先申请再审批",从"无限额度"到"分级配额",巨头们的AI预算管理制度正在快速演化。

▲ 图2:AI创业者必须看懂的3个成本信号——API降本不是口号,是生存策略(来源:HN热帖 / I▲ ▲ 图2:AI创业者必须看懂的3个成本信号——API降本不是口号,是生存策略(来源:HN热帖 / IT之家整理)

为什么对AI创业者重要

这波"急刹车"释放了三个关键信号,每一个都直接影响AI创业者的生意模式:

信号一:AI的成本问题正在从"房间里的大象"变成"会议室里的暴风雨"。 过去两年,AI创业的叙事逻辑是"先烧钱占坑,以后自然能盈利"。但FT的报道揭示了一个残酷事实:即使是大厂也在重新计算AI的真实投入产出比。对依赖第三方API的AI创业者来说,API成本占运营成本的比例只会越来越高。

信号二:"Tokenmaxxing"暴露了AI应用层的泡沫。 当工程师为了完成KPI而故意浪费AI额度时,说明大量AI使用并非源于真实需求,而是组织考核制度制造出的虚假繁荣。这部分"需求"将在预算收紧后率先消失。

信号三:精细化AI成本管理正在成为核心竞争力。 IT之家的报道指出,腾讯正在推动"AI成本精细化管理",包括提示词工程优化、RAG调优、权限分级管控等。对AI创业者而言,"谁用更少的token做更多的事"将直接决定谁能活到下一轮。

HN讨论区的一条高赞评论道出了本质:"我们正处在一个危险的谷底——AI刚好足够好,能骗过一些非常聪明的人。就像那句老话:'一知半解最危险。'"

我们能学到什么

教训一:API成本不是"以后再说"的问题。 一家长沙的AI创业公司在今年5月的复盘显示,其GPT API月支出从年初的2000元飙升至1.2万元,而收入增长远低于成本增速。创始人坦言:"我们以为用户多了自然能摊薄成本,结果用户越多亏得越多。"

教训二:不要追求token用量KPI。 如果你的团队在用AI工具,请不要设置"AI使用率""日均token消耗"之类的考核指标。这只会制造虚假繁荣。真正该考核的是:用了AI之后,代码质量有没有提高?客服满意度有没有上升?文章阅读量有没有增长?

教训三:小模型+大模型的混合策略是降本关键。 不是所有任务都需要GPT-5。简单分类、文本摘要、格式转换等任务,用GLM-4-Flash或DeepSeek V4-Lite就能胜任,成本只有旗舰模型的十分之一甚至更低。

行动建议

  1. 立即审计你的API账单:找出过去30天消耗token最多的10个调用场景,逐个评估是否可以用更便宜的模型替代
  2. 建立AI使用分级制度:将任务分为"必须用最强大模型""可以用中等模型""小模型即可"三级,制定内部调用规范
  3. 关注开源模型部署:对于高频调用场景(如客服机器人、内容分类),自部署开源模型(如Hermes Agent + Ollama)可以彻底消除API边际成本
  4. 将成本指标纳入产品健康度看板:每月API成本/MAU、单次AI调用平均成本、top 1%高消耗用户占比——这些指标比"日活"更能反映AI产品的真实健康状况

参考来源:The Information(2026年6月18日)、Financial Times(2026年6月19日)、Hacker News讨论(119分/104评论)、IT之家/凤凰科技中文报道


#AI创业 #AI成本 #Tokenmaxxing #一人公司 #API降本

本文由AI辅助创作,经人工审核编辑发布

更多一人公司案例与工具,微信搜索「AI创业内参」关注我们