GPTZero一项法医级调查撕开了咨询业最大遮羞布:全球四大会计师事务所之一的毕马威(KPMG),在一篇关于"AI如何重新定义卓越"的旗舰报告中,引用的45个来源里只有5个真实存在。其余40个全部是生成式AI的"vibe citing"——一种被毕马威自己命名的现象:AI工具在生成引用时,会把真实来源和虚构内容搅拌在一起,产出一锅看起来专业、实际上有毒的信息浓汤。
▲ GPTZero调查:KPMG报告45个引用中40个为AI编造
事件回顾:一篇关于AI的报告,被AI毁掉了
6月12日,AI内容检测公司GPTZero发布了一份爆炸性的法医调查报告。调查团队用自研的"幻觉检测"工具对毕马威2025年10月发布的旗舰报告《全面体验:在Agentic AI时代重新定义卓越》(Total Experience: Redefining Excellence in the Age of Agentic AI)进行了逐条验证。
结果令人震惊:报告中引用的45个来源里,只有5个准确指向了真实、未被篡改的来源。其余40个引用标题——也就是将近90%——是AI凭空编造的。
GPTZero的调查员Paul Esau在报告中写道:"我们怀疑毕马威没有一个人——没有一个人——在《全面体验》发布前,对这45条引用、支撑这些引用的声明或来源进行过核实。"
这还不止。在45条引用所支撑的事实声明中,大约一半是假的、缺乏证据的,或被错误归因。GPTZero发现的具体"骚操作"包括:
穿越时空的AI引用:报告引用了JR东日本铁路公司2019年的一篇新闻稿,作为"AI Agent正在被企业使用"的证据。问题在于,"Agentic AI"这个词直到2024年才进入公共讨论。这篇2019年的新闻稿里根本没有提到过任何AI Agent相关的内容。
作者身份大挪移:毕马威的LLM持续把文章主题误认为文章作者。一篇关于伦敦交通局(TfL)的博客文章,作者是一位居住在萨里的博主——但在毕马威的引用里,"作者"变成了伦敦交通局。一篇来自零售新闻网站关于优衣库的报道,被标注为"由优衣库撰写"。
自己打自己的脸:报告引用"毕马威的研究"称55%的CEO将AI列为最优先投资方向。然而毕马威自己同月发布的《2025年CEO展望》中,这个数字是71%。同一家公司、同一个月、两份报告,数据差出16个百分点。哪一个是真的?没人知道。
连锁污染:假数据已经在互联网上生根
更可怕的是后续的连锁反应。GPTZero发现,毕马威这份充满幻觉的报告中的数据,已经被至少两家行业出版物和一家捷克报纸引用、转载。更糟糕的是,ChatGPT和Gemini等大语言模型现在已经把它们当成了"事实"——如果你今天问ChatGPT"有多少CEO把AI当首要投资优先级",它很可能会告诉你那个不知道从哪来的"55%"。
换句话说,AI生成的虚假信息,正在通过AI自己构建的信息生态系统,永久性地污染人类的知识库。
经《金融时报》核实后,毕马威已将这份报告从其官网移除。毕马威发言人对FT表示,公司"严肃对待其发布内容的准确性和完整性",已"在调查该报告发布情况期间将其从网站上移除"。
但这份报告在网上存在了8个月。8个月里,有多少人引用过它?有多少决策是基于它的"数据"做出的?这个问题没人能回答。
▲ 四大会计师事务所AI翻车时间线
这不是毕马威一家的翻车
GPTZero的调查人员指出,这已经是他们系列调查的第二篇——此前他们刚刚揭露了德勤(Deloitte)和安永(EY)的类似问题。而如果把目光放得更宽,整个专业服务行业都正在经历一场由AI引发的信用危机:
德勤(Deloitte):2025年10月,德勤向澳大利亚联邦政府退还了部分款项,原因是其提交的一份报告中使用AI产生了多处错误。这可能是咨询业因AI幻觉引发的首次"财务赔偿"事件。
安永(EY):2026年5月,安永撤回了一份关于客户忠诚度计划的研究报告。报告中同样出现了AI生成的虚假脚注和引用。值得注意的是,GPTZero调查安永的报告也已经是该系列的第二篇——安永在同一个坑里栽倒了两次。
品诚梅森律师事务所(Pinsent Masons):伦敦顶级律所,一名律师使用AI生成了包含虚假法律信息的函件提交给高等法院。法官在判决中明确批评了该律所。
苏利文·克伦威尔(Sullivan & Cromwell):美国顶级律所,在一个备受关注的破产案件中提交的法律文件包含多处AI幻觉。该所不得不向法官正式道歉。
Hacker News上,知名开发者Simon Willison的评论一针见血:"我不理解这些咨询公司——他们把这些'报告'以六七位数的价格卖给客户——怎么能一而再再而三地搞砸。这本该是让他们极度难堪的事情。但我想,从来没有人因为雇佣了毕马威而被解雇。"
一人公司创业者能从中学到什么?
对AI创业内参的读者来说,这个故事远不只是"大公司翻车"的娱乐新闻。它包含几个和一人公司创业者直接相关的深刻教训:
第一,AI输出的"专业感"和"准确性"是两回事。 毕马威那份报告从格式上看绝对是专业水准——排版精美、引用格式规范、案例丰富。但它骨子里是假的。一人公司创业者最容易被这种"看起来专业"的表象欺骗,尤其是在用AI辅助客户交付时。你的客户信任的是你的判断力,而不是AI的语感。
第二,用AI做研究,必须再加一层AI做验证。 HN评论者XenophileJKO指出了一个低价高效的方案:"让一个子Agent验证所有引用和数据,成本极低。"他说自己已经在个人财务研究系统里用这种方法,效果显著。对一人公司来说,你不需要一个30人的QA团队——你只需要在你的AI工作流里,多加一个专用验证环节。
第三,"vibe citing"正在污染整个信息生态。 如果你的内容策略依赖于"用AI搜索素材→AI整理成文",那你产出的东西很可能已经在吃二手甚至三手的污染数据。毕马威的假数据现在已经被ChatGPT和Gemini收录为"事实"。这意味着,你越依赖通用AI工具做研究,你离真相就越远。
第四,在专业服务领域,"AI辅助但不审核"是最危险的姿势。 毕马威、德勤、安永的案例共同指向一个规律:这些翻车全不是因为AI不行——恰恰相反,AI太行了,行到能生成看起来完全可信的假内容。问题在于,人选择相信了AI,跳过了审核。在一人公司的场景里,你是唯一的责任人。AI可以帮你把产出放大10倍,但没有审核的放大=把错误放大10倍。
行动建议
- 在你的AI工作流里加入验证子Agent。 每次AI生成引用或数据后,让另一个独立的Agent去核实。成本极低——HN上那位老哥说了,"不需要比这更多的东西"。
- 手动抽查不低于20%。 不论你多信任你的AI流程,每5个AI生成的数据点里,至少要手动核验1个。这不是效率问题——这是生存问题。
- 永远标注AI参与程度。 对客户透明地说明"本文使用了AI辅助研究,所有数据和引用均已人工核实"。这不仅保护你,也是专业性的表现。毕马威的问题不是用了AI——是谁也没告诉,谁也没检查。
- 把毕马威的案例放在你的新客户沟通素材里。 没有什么比"四大会计师事务所都在AI上翻车"更能说服客户:你的AI辅助服务之所以可靠,不是因为AI厉害,而是因为你的审核流程比毕马威更严谨。
#AI创业 #AI落地 #AI翻车 #一人公司 #毕马威 #内容质量
本文由AI辅助创作,经人工审核编辑发布
