【AI风向】毕马威用AI写了篇"AI有多牛"的报告，结果45处引用有40处是AI瞎编的——四大会计师事务所集体翻车实录

GPTZero一项法医级调查撕开了咨询业最大遮羞布：全球四大会计师事务所之一的毕马威（KPMG），在一篇关于"AI如何重新定义卓越"的旗舰报告中，引用的45个来源里只有5个真实存在。其余40个全部是生成式AI的"vibe citing"——一种被毕马威自己命名的现象：AI工具在生成引用时，会把真实来源和虚构内容搅拌在一起，产出一锅看起来专业、实际上有毒的信息浓汤。

▲ GPTZero调查：KPMG报告45个引用中40个为AI编造

事件回顾：一篇关于AI的报告，被AI毁掉了

6月12日，AI内容检测公司GPTZero发布了一份爆炸性的法医调查报告。调查团队用自研的"幻觉检测"工具对毕马威2025年10月发布的旗舰报告《全面体验：在Agentic AI时代重新定义卓越》（Total Experience: Redefining Excellence in the Age of Agentic AI）进行了逐条验证。

结果令人震惊：报告中引用的45个来源里，只有5个准确指向了真实、未被篡改的来源。其余40个引用标题——也就是将近90%——是AI凭空编造的。

GPTZero的调查员Paul Esau在报告中写道："我们怀疑毕马威没有一个人——没有一个人——在《全面体验》发布前，对这45条引用、支撑这些引用的声明或来源进行过核实。"

这还不止。在45条引用所支撑的事实声明中，大约一半是假的、缺乏证据的，或被错误归因。GPTZero发现的具体"骚操作"包括：

穿越时空的AI引用：报告引用了JR东日本铁路公司2019年的一篇新闻稿，作为"AI Agent正在被企业使用"的证据。问题在于，"Agentic AI"这个词直到2024年才进入公共讨论。这篇2019年的新闻稿里根本没有提到过任何AI Agent相关的内容。

作者身份大挪移：毕马威的LLM持续把文章主题误认为文章作者。一篇关于伦敦交通局（TfL）的博客文章，作者是一位居住在萨里的博主——但在毕马威的引用里，"作者"变成了伦敦交通局。一篇来自零售新闻网站关于优衣库的报道，被标注为"由优衣库撰写"。

自己打自己的脸：报告引用"毕马威的研究"称55%的CEO将AI列为最优先投资方向。然而毕马威自己同月发布的《2025年CEO展望》中，这个数字是71%。同一家公司、同一个月、两份报告，数据差出16个百分点。哪一个是真的？没人知道。

连锁污染：假数据已经在互联网上生根

更可怕的是后续的连锁反应。GPTZero发现，毕马威这份充满幻觉的报告中的数据，已经被至少两家行业出版物和一家捷克报纸引用、转载。更糟糕的是，ChatGPT和Gemini等大语言模型现在已经把它们当成了"事实"——如果你今天问ChatGPT"有多少CEO把AI当首要投资优先级"，它很可能会告诉你那个不知道从哪来的"55%"。

换句话说，AI生成的虚假信息，正在通过AI自己构建的信息生态系统，永久性地污染人类的知识库。

经《金融时报》核实后，毕马威已将这份报告从其官网移除。毕马威发言人对FT表示，公司"严肃对待其发布内容的准确性和完整性"，已"在调查该报告发布情况期间将其从网站上移除"。

但这份报告在网上存在了8个月。8个月里，有多少人引用过它？有多少决策是基于它的"数据"做出的？这个问题没人能回答。

▲ 四大会计师事务所AI翻车时间线

这不是毕马威一家的翻车

GPTZero的调查人员指出，这已经是他们系列调查的第二篇——此前他们刚刚揭露了德勤（Deloitte）和安永（EY）的类似问题。而如果把目光放得更宽，整个专业服务行业都正在经历一场由AI引发的信用危机：

德勤（Deloitte）：2025年10月，德勤向澳大利亚联邦政府退还了部分款项，原因是其提交的一份报告中使用AI产生了多处错误。这可能是咨询业因AI幻觉引发的首次"财务赔偿"事件。

安永（EY）：2026年5月，安永撤回了一份关于客户忠诚度计划的研究报告。报告中同样出现了AI生成的虚假脚注和引用。值得注意的是，GPTZero调查安永的报告也已经是该系列的第二篇——安永在同一个坑里栽倒了两次。

品诚梅森律师事务所（Pinsent Masons）：伦敦顶级律所，一名律师使用AI生成了包含虚假法律信息的函件提交给高等法院。法官在判决中明确批评了该律所。

苏利文·克伦威尔（Sullivan & Cromwell）：美国顶级律所，在一个备受关注的破产案件中提交的法律文件包含多处AI幻觉。该所不得不向法官正式道歉。

Hacker News上，知名开发者Simon Willison的评论一针见血："我不理解这些咨询公司——他们把这些'报告'以六七位数的价格卖给客户——怎么能一而再再而三地搞砸。这本该是让他们极度难堪的事情。但我想，从来没有人因为雇佣了毕马威而被解雇。"

一人公司创业者能从中学到什么？

对AI创业内参的读者来说，这个故事远不只是"大公司翻车"的娱乐新闻。它包含几个和一人公司创业者直接相关的深刻教训：

第一，AI输出的"专业感"和"准确性"是两回事。 毕马威那份报告从格式上看绝对是专业水准——排版精美、引用格式规范、案例丰富。但它骨子里是假的。一人公司创业者最容易被这种"看起来专业"的表象欺骗，尤其是在用AI辅助客户交付时。你的客户信任的是你的判断力，而不是AI的语感。

第二，用AI做研究，必须再加一层AI做验证。 HN评论者XenophileJKO指出了一个低价高效的方案："让一个子Agent验证所有引用和数据，成本极低。"他说自己已经在个人财务研究系统里用这种方法，效果显著。对一人公司来说，你不需要一个30人的QA团队——你只需要在你的AI工作流里，多加一个专用验证环节。

第三，"vibe citing"正在污染整个信息生态。 如果你的内容策略依赖于"用AI搜索素材→AI整理成文"，那你产出的东西很可能已经在吃二手甚至三手的污染数据。毕马威的假数据现在已经被ChatGPT和Gemini收录为"事实"。这意味着，你越依赖通用AI工具做研究，你离真相就越远。

第四，在专业服务领域，"AI辅助但不审核"是最危险的姿势。 毕马威、德勤、安永的案例共同指向一个规律：这些翻车全不是因为AI不行——恰恰相反，AI太行了，行到能生成看起来完全可信的假内容。问题在于，人选择相信了AI，跳过了审核。在一人公司的场景里，你是唯一的责任人。AI可以帮你把产出放大10倍，但没有审核的放大=把错误放大10倍。

行动建议

在你的AI工作流里加入验证子Agent。 每次AI生成引用或数据后，让另一个独立的Agent去核实。成本极低——HN上那位老哥说了，"不需要比这更多的东西"。
手动抽查不低于20%。 不论你多信任你的AI流程，每5个AI生成的数据点里，至少要手动核验1个。这不是效率问题——这是生存问题。
永远标注AI参与程度。 对客户透明地说明"本文使用了AI辅助研究，所有数据和引用均已人工核实"。这不仅保护你，也是专业性的表现。毕马威的问题不是用了AI——是谁也没告诉，谁也没检查。
把毕马威的案例放在你的新客户沟通素材里。 没有什么比"四大会计师事务所都在AI上翻车"更能说服客户：你的AI辅助服务之所以可靠，不是因为AI厉害，而是因为你的审核流程比毕马威更严谨。

#AI创业 #AI落地 #AI翻车 #一人公司 #毕马威 #内容质量

本文由AI辅助创作，经人工审核编辑发布