AI风向

【AI风向】AI Agent一年内成功率从12%飙到66%:但只有6%的公司赚到了钱

斯坦福2026年AI指数报告揭示了一个残酷真相:AI Agent已经逼近人类水平,但94%的企业还没学会怎么用它挣钱。

事件回顾

斯坦福大学人本AI研究院(HAI)近日发布了2026年AI指数报告,这份423页的报告有一个数字让整个科技圈炸了锅:AI Agent在真实计算机操作任务上的成功率,从去年的12%直接跳到了66.3%

这个数据来自OSWorld基准测试——一个让AI Agent真正操作操作系统、打开文件、导航应用、完成多步骤工作流的严苛考试。一年前,AI Agent还在12分挣扎;一年后,它已经考到66分,距离人类水平的72分只差6个百分点。

更惊人的是编码能力的飞跃。在SWE-bench Verified这个编程权威基准上,AI从去年的60%正确率飙升至接近100%。编写代码这件事,AI已经几乎不会犯错。

与此同时,AI的整体渗透速度超过了历史上任何一项技术。报告显示,2025年全球88%的企业已经在不同程度上采用了AI,生成式AI在三年内覆盖了全球53%的人口——这个速度超过了个人电脑,也超过了互联网。

为什么重要

如果说这些数据只讲了一个故事,那就是:AI Agent在技术上已经准备就绪,但企业还没有准备好接受它

麦肯锡2025年全球AI调查报告给出了一个扎心的数字:在近千家受访企业中,只有6%能被称为"高绩效企业"——即那些真正通过AI投资获得了实质性利润提升的公司。更直白地说:94%的企业在AI上花了钱,但没看到利润。

更具体的数字是:76%的小企业已经在"用AI",但只有14%把AI融入了日常运营。"用AI"和"靠AI赚钱"之间,隔着一个巨大的鸿沟。

这个鸿沟被斯坦福报告称为"部署鸿沟"(Deployment Gap)。nexos.ai产品负责人Zilvinas Girenas的话一针见血:"挑战已经不是模型够不够好,而是离业务最近的人能不能自己搭建和运行Agent,安全地,不用等IT部门。"

另外两个数据值得注意:一是麦肯锡发现只有不到10%的企业在任何一个业务职能中规模化部署了AI Agent;二是86%的企业领导者认为自己的组织"没有很好地准备好将AI融入日常运营"。

翻译成大白话就是:老板知道AI有用,但不知道怎么用

我们能学到什么

1. 技术领先≠商业领先,差距在"最后一公里"

AI Agent从12%跳到66%,是技术层面的胜利。但6%的高绩效企业占比告诉我们,技术突破到商业回报之间,还隔着团队、流程、数据、治理、安全五座大山。

对于AI创业者来说,这意味着:卖铲子的时代还没结束,但教人用铲子的生意才刚刚开始。帮助中小企业跨越"部署鸿沟"——无论是Agent搭建服务、行业解决方案、还是培训咨询——都是巨大的市场机会。

2. "用了"和"用好了"是两码事

76%的小企业"用了AI",14%"融入了日常运营",6%"赚到了钱"。这三个数字之间的断崖式下跌,揭示了一个残酷的商业逻辑:浅尝辄止的AI应用不会带来任何竞争优势

对一人公司和中小企业而言,正确的策略不是"多试用几个AI工具",而是选定1-2个核心场景,把AI Agent深度整合进业务流,直到它变成日常运营的"自来水"。

3. Agent的"操作计算机"能力打开了全新商业模式

12%到66.3%这个跳跃意味着:以前只能用API调用的AI,现在可以像人一样操作软件界面。这意味着所有没有API的传统软件,都突然可以被AI自动化了。

想象一下:一个AI Agent可以登录你的财务软件、导出报表、发到微信群、更新飞书文档——全程不需要任何人写代码。这种"UI层自动化"的能力,将催生一波全新的AI创业机会,尤其是在中小企业数字化服务领域。

高绩效企业的秘密:他们做对了什么?

麦肯锡的报告不只是给了"6%"这个扎心数字,还揭示了高绩效企业和普通企业之间的关键差异:

第一,高绩效企业在AI上的投入不是为了"省成本",而是为了"改模式"。他们使用AI进行企业级转型变革的可能性是普通企业的3倍。普通企业在用AI写邮件、做PPT、翻译文档;高绩效企业在用AI重构供应链、自动化客户旅程、改造产品研发流程。

第二,超过三分之一的高绩效企业将20%以上的数字化预算投入AI。相比之下,普通企业还在"先试试看,效果好再加钱"的阶段。AI投资的"临界质量"(critical mass)效应非常明显:不足够的投入意味着永远看不到真正的回报。

第三,高绩效企业规模化部署AI Agent的可能性是普通企业的3倍。不是做一个Agent玩玩,而是在多个业务职能中同时推进。麦肯锡指出,普通企业中只有不到10%在任何一个职能中规模化部署了Agent。

这三个差异指向同一个结论:AI不是"省钱的工具",而是"换赛道的门票"。把它当省钱工具的企业,能省15%;把它当换赛道门票的企业,有可能重塑整个行业的竞争格局。

行动建议

如果你是一个人在创业:从你的日常工作中找出一个重复性最高的任务,用一个AI Agent(Claude Code、OpenClaw、Hermes Agent等)去自动化它。不要追求宏大叙事,追求"省下每天1小时"。当每天省下1小时后,用多出来的时间去做"改模式"的事——开发新产品、谈新客户、探索新渠道。

如果你在服务客户:不要再问客户"要不要用AI",而是直接指出他们业务流程中哪一步可以被AI Agent替代,算出一笔具体的省钱账。斯坦福的数据和麦肯锡的报告就是最好的"信任状"。更进一步:帮客户从"省钱思维"切换到"换赛道思维",这个咨询服务的溢价远高于单纯的工具部署。

关注部署工具而非模型本身:当AI Agent能力逼近人类水平,竞争的焦点将不再是"谁的模型更强",而是"谁能帮企业安全、合规、高效地把Agent部署上线"。Agent治理平台、低代码Agent搭建工具、行业Agent模板——这些都是当下最值得押注的方向。

警惕"假AI化"陷阱:76%的企业说在"用AI",但只有14%融入日常。真正的AI化不是装一个ChatGPT插件,而是让AI Agent成为业务流程中不可替代的一环。判断标准很简单:如果关掉AI,你的业务还能正常运转吗?如果能,说明你还没真正用上AI。


技术跑在了前面,但钱还在后面追。对创业者来说,这个"时间差"就是你的机会窗口。

#AI创业 #AI Agent #斯坦福AI指数 #一人公司 #部署鸿沟

AI辅助创作,经人工审核编辑发布

本文由AI辅助创作,经人工审核编辑发布