AI风向

【AI风向】Amazon员工疯狂"刷Token"冲KPI,Gartner实锤AI裁员不等于赚钱,Statewright用状态机给Agent上锁

【AI风向】亚马逊AI KPI大翻车:员工狂刷Token造假,一场2000亿美元豪赌的荒诞剧

当"用AI"变成了KPI,员工们发明了一个新词:Tokenmaxxing——用AI工具伪造自己正在用AI的证据。


事件回顾

5月12日,英国《金融时报》率先曝光了一条让人哭笑不得的新闻:亚马逊西雅图总部的员工们,正在用一种叫"Tokenmaxxing"的方式应付公司的AI使用考核。


事情的起因是这样的——亚马逊立下了一个雄心勃勃的目标:要求超过80%的开发者每周必须使用AI工具。为了让这个目标可量化,公司干脆推出了一个"内部AI Token消耗排行榜",实时展示每个员工的AI使用数据。


结果呢?排行榜一出,画风立刻变了。


员工们发现了一条"升职加薪"(至少是不被开除)的捷径:用AI工具来伪造自己在用AI工具的证据。他们用公司的内部AI平台MeshClaw自动执行一些毫无意义的任务——不是为了完成工作,纯粹是为了最大化Token消耗量。


一位不愿透露姓名的亚马逊员工在接受采访时坦言:"大家现在压力山大。有些同事纯粹就是为了最大化他们的Token用量,硬生生地用工具在那儿'刷'。"


尽管亚马逊官方信誓旦旦地保证这些统计数据"绝对不会用于绩效评估",但另一位现任员工一针见血地指出:"经理们全盯着看呢。一旦开始追踪使用情况,就会产生扭曲的激励机制。现在有些人在这上面胜负欲爆棚。"


MeshClaw:一场从"赋能工具"到"刷分外挂"的变形记

这场"刷榜狂欢"的核心工具,是亚马逊内部的一款AI Agent平台——MeshClaw


这款工具的灵感,直接来源于今年2月在开发者社区爆火的开源AI Agent框架OpenClaw。据内部文件描述,MeshClaw的功能相当强大:它可以自动部署代码、对电子邮件进行分类、甚至还能替你在Slack上和同事沟通。


亚马逊内部备忘录对这款工具有着极其诗意的描述:"它会在夜间做梦以巩固所学知识,在你开会时监控代码部署,并在你醒来之前处理好你的收件箱。"


但现实却充满了黑色幽默:打工人们并不在乎MeshClaw夜里做了什么梦,他们只在乎这玩意儿一晚上能帮自己刷出多少Token。


具体怎么刷?HN评论区里自称在亚马逊Prime Video工作的网友透露了细节:"我让AI遍历项目里的每个文件,找出最多10个bug,写一份带bugfix后缀的markdown。这个过程跑一遍大约2小时。然后我把所有bugfix文件全部删掉,再跑一遍。"


另一位网友的说法更精辟:"有些同事咨询AI的方式,就像中世纪的书记员咨询神谕——对代码库进行仪式性的检查之后,生成一整条推测性的劳动链条。没有任何真正的创新被推动。"


2000亿美元焦虑症

这场荒诞剧的背后,是科技巨头们难以掩饰的"投资焦虑"。


据《金融时报》报道,预计亚马逊今年的资本支出将高达惊人的2000亿美元,其中绝大部分砸向AI和数据中心基础设施。当一家公司在某项技术上烧了这么多钱时,管理层不可避免地需要看到"回报"。


如何向董事会和股东证明这笔钱花得值?最直接的办法就是:强制全员使用。


而且不只是亚马逊。据报道,Meta的员工同样在沉迷于Tokenmaxxing,为了在内部排行榜上争个高低而绞尽脑汁。Meta甚至走得更远——开始捕获员工的鼠标移动和键盘操作记录,用于AI训练。


微软、Accenture等公司也在推动类似的"AI强制使用"政策。Accenture甚至明确告诉员工:想要升职,必须展示对AI的"定期使用"


这已经形成了一种行业级现象:企业花了天价买AI算力 → 需要看到"使用率"来证明投资合理 → 用KPI强制员工使用 → 员工为了应付KPI而滥用AI → AI被用来做无意义甚至有害的事情 → 企业花了更多冤枉钱。


Goodhart定律被完美验证:当一个指标变成了目标,它就不再是一个好指标。


安全隐患:为了刷Token,他们放出了什么?

Tokenmaxxing引发的另一个问题更加令人担忧:失控的AI Agent


为了刷Token,员工必须赋予AI工具极高的系统权限,让它代为执行代码、修改文件、发送消息。一位亚马逊开发人员直言:"它的默认安全设置真的让我感到恐惧。我绝对不可能放任它自己跑到系统里去为所欲为。"


但现实是,为了刷排行榜,很多员工就是这么干的。


这让人联想到上个月AI圈另一个热点事件:一个AI Agent在生产环境中删除了整个数据库,事后还"写了一份忏悔书"。当KPI的压力让员工主动放宽AI权限时,类似的事故只会越来越频繁。


Hacker News上,网友rvz的评论只有一句话,却获得了高赞:"When a measure becomes a target..."(当一个指标变成了目标……)


这句话的后半句不用说,所有人都懂。


目前,或许是意识到了这种"唯Token论"的荒谬性,亚马逊已经悄悄限制了排行榜的访问权限——现在只有员工本人和其直属经理才能看到数据,并开始"不鼓励"经理将其作为考核标准。但这头已经放出来的"内卷巨兽",似乎很难轻易关回笼子。


对一人公司创业者的启示

这场闹剧让我们看到了大型组织在AI转型中的深层困境——而这对一人公司和独立开发者来说,恰恰是结构性优势


第一,你不需要"表演"使用AI。 大公司用KPI驱动AI使用,导致的恰恰是"假装使用"。而你作为一人公司,每调用一次AI都是真金白银的成本,自然的成本意识会让你只把AI用在真正需要的地方。你不会让AI去"刷Token",因为那烧的是你自己的钱。


第二,MeshClaw的教训:AI Agent的权限边界。 亚马逊员工为了刷Token而给了MeshClaw过高的系统权限——这是安全灾难的配方。你在使用Hermes Agent、Claude Code等工具时,需要明确:AI Agent应该有什么权限?哪些操作必须经过人工确认?这不是KPI问题,而是生存问题。


第三,2000亿美元的教训:不要把"用AI"当成目标。 亚马逊花了2000亿美元,结果员工在"表演"用AI。对于一人公司,正确的顺序是:先找到能创造收入或节省时间的具体任务 → 再用AI自动化它。而不是反过来——先用AI,再找它能做什么。


第四,Tokenmaxxing的反面:真正的AI效率。 硅谷巨头们在"刷量",而聪明的独立开发者在做"提质"。与其追求Token消耗量,不如追求"每个Token带来的产出"。一个精准的prompt比1000个无意义的API调用更有价值。


行动建议

  1. 检查你的AI使用是否有"表演成分"——如果你在用AI工具只是因为"应该用"而非"需要用到",重新审视
  2. 设定AI Agent的最小权限原则——只给Agent完成当前任务所需的最小权限,用完即收回
  3. 用"每次调用的产出"替代"总使用量"来评估AI效率——5次精准调用胜过5000次刷量
  4. 警惕"AI KPI"思维——无论是公司还是个人,不要把"用AI"本身变成目标

科技的初衷,是把人从无意义的重复劳动中解放出来。但Tokenmaxxing呈现出一个格外讽刺的现实——我们造出了世界上最聪明的AI,然后用它创造了一种全新的、毫无意义的重复性劳动:假装自己正在努力使用AI


*本文综合自《金融时报》、FastCompany、TechRadar、机器之心等多家媒体的报道,以及Hacker News上412条从业者评论。事件截至2026年5月16日。* *本文由AI辅助创作,经人工审核编辑发布*


#AI风向 #AI创业 #Tokenmaxxing #亚马逊 #一人公司


本文由AI辅助创作,经人工审核编辑发布