【AI风向】KPMG用AI写报告翻了车：45条引用仅5条真实，四大咨询巨头也败给了AI幻觉

一家年收入超360亿美元的全球顶级咨询公司，用AI给客户写了一份"重新定义卓越"的报告——结果45条引用中只有5条是真的。GPTZero将这种现象命名为"vibe citing"（感觉式引用），而KPMG已悄悄下架了该报告。

▲ GPTZero审查发现：KPMG报告45条引用仅5条真实，vibe citing成为AI时代新风险

事件回顾

2025年10月，毕马威（KPMG）国际发布了一份名为《全面体验：在AI智能体时代重新定义卓越》的研究报告，总结了其全球客户体验卓越研究的年度成果。

八个月后，AI检测公司GPTZero对这份报告进行了系统性审查，结果令人震惊：报告中45条引用，只有5条准确指向了真实来源。28条引用中，标题被改写或混入了伪造成分；12条引用的信息过于模糊或残缺，根本无法核实。更严重的是，大约一半基于这些引用的事实陈述也是虚假的、缺乏依据的，或被归因到了错误的来源。

GPTZero将这种现象命名为"vibe citing"（感觉式引用）——和硅谷流行的"vibe coding"（感觉式编程）异曲同工：AI会根据指令"感觉"拼凑出一段看起来像真的内容，但谁也不知道它到底从哪里来的。

典型的翻车现场

报告中最离谱的案例之一是关于阿联酋航空的描述。报告声称阿联酋航空"推出了一款名为Sara的移动聊天机器人，可以与乘客对话并更改航班"。事实是：Sara是阿联酋航空2023年推出的一款实体机器人助手（不是聊天机器人），它根本无法修改航班预订。

报告还列举了瑞银集团、瑞士联邦铁路和伦敦交通局的AI智能体部署案例研究。GPTZero指出，这些案例所引用的来源要么根本无法证实报告中的说法，要么包含改写和捏造内容，严重损害了其可信度。

另一个自相矛盾的尴尬时刻：报告称"55%的CEO将AI列为最高投资优先级"。然而，KPMG自己当月发布的《2025年CEO展望》调查显示，这个数字其实是71%。AI不仅对外部信息产生了幻觉，连自家的内部数据都搞错了。

不是孤例：四大咨询的AI翻车史

KPMG并非第一个在AI使用上出丑的咨询巨头。去年，德勤（Deloitte）被迫向澳大利亚政府退还了项目费用——因为一份纳税人资助的报告中被发现混入了AI生成的内容。

普华永道（PwC）今年早些时候放话："不接受AI的员工将被辞退。"但讽刺的是，KPMG的一位合伙人在澳大利亚被曝出用AI来完成一场关于AI的考试。

这些事件背后有一个共同模式：咨询公司一边向客户兜售"AI转型"方案，一边在内部对AI的使用缺乏基本的质量控制。

为什么重要

1. 咨询业的信任危机。 企业每年花费数十亿美元购买咨询公司的研究报告和战略建议。如果KPMG这样的顶级机构都无法保证报告的事实准确性，整个行业的可信度都将受损。一份充满虚假引用的报告一旦被用于重大商业决策，后果不堪设想。

2. AI工具在企业场景的局限性暴露无遗。 KPMG的报告大概率使用了某种AI研究工具来收集案例和数据。这个案例清楚地表明：当前的AI在需要精确引用来源的场景下仍然非常不可靠。企业不能假设AI生成的内容天然可信，必须建立严格的人工审核流程。

3. "vibe citing"将成为AI时代的新风险术语。 GPTZero创造的这个词汇正在迅速传播——它精准描述了AI幻觉在学术研究和商业报告中的一种特定表现形态。和"deepfake""hallucination"一样，"vibe citing"有望成为AI风险词典中的标准词汇。

4. 监管将加速收紧。 当四大咨询公司接连出现AI滥用问题，监管机构不会坐视不管。未来类似报告可能需要标注AI参与程度、提供幻觉检测结果等，这种透明度要求很可能成为行业新标准。

▲ 四大咨询AI翻车史：Deloitte退款、KPMG下架——咨询业需要AI质量管控体系

我们能学到什么

1. AI辅助≠AI替代——尤其在涉及事实核查的环节

KPMG的报告问题是AI在"找证据"环节充当了替代者而非辅助者。正确的做法是：AI可以帮助发现潜在案例和来源，但每个引用都必须经过人工验证——打开原始链接、确认内容、核实数据。

对于AI创业者和内容创作者而言，这是一条铁律：不要让AI替你做事实核查。用它来提速，然后自己把关。

2. "看起来靠谱"是最危险的信号

GPTZero指出，KPMG报告中的很多引用"看起来"指向真实来源，但标题被改写、作者被调换、或内容被重新组合。这种"半真半假"的引用比完全捏造的更难被发现——因为它们乍一看确实通向某个真实网站或论文。

警惕这种"看起来靠谱"的幻觉形式。建立引用验证清单：标题是否匹配？作者是否正确？日期是否合理？引用的内容是否确实出现在原出处？

3. 内部流程比外部表态更重要

KPMG的官方回应是："我们认真对待已发布内容的准确性和完整性。该报告已被下架，我们正在审查其发布流程。"但问题在于：一份需要45条引用支撑的专业报告，为什么在发布前没有经过人工逐条验证？

这提醒所有使用AI的组织：文化比工具更重要。在内部建立"AI输出必须经人工验证"的流程规范，比对外宣传"拥抱AI"的漂亮话更关键。

行动建议

建立引用验证SOP：如果你的团队或项目依赖AI进行研究和写作，立即建立一份标准操作流程——每一条AI生成的外部引用都必须包含原始链接，并由至少一个人工审核员确认。
引入AI幻觉检测工具：GPTZero、Originality.ai等工具已经可以自动检测AI生成的引用和内容。将这些工具嵌入内容审核流程，作为发布前的最后一道防线。
制定AI使用披露政策：无论是商务报告、研究文章还是公众号内容，考虑在适当位置披露AI参与程度。透明本身就是一种质量信号——告诉读者"我们用AI辅助了初稿，但所有数据和引用都经过人工验证"。
警惕"vibe citing"蔓延到你的领域：KPMG的案例不是孤例。学术论文、行业白皮书、商业计划书都在面临同样的风险。如果你是AI创业者，确保你的产品和营销材料中的每一个数据点都可以追溯到原始来源。

#AI创业 #AI幻觉 #vibe_citing #咨询业 #AI风险 #一人公司

本文由AI辅助创作，经人工审核编辑发布