AI风向

【AI风向】KPMG用AI写报告翻了车:45条引用仅5条真实,四大咨询巨头也败给了AI幻觉

一家年收入超360亿美元的全球顶级咨询公司,用AI给客户写了一份"重新定义卓越"的报告——结果45条引用中只有5条是真的。GPTZero将这种现象命名为"vibe citing"(感觉式引用),而KPMG已悄悄下架了该报告。

GPTZero审查发现:KPMG报告45条引用仅5条真实,vibe citing成为AI时代新风险▲ GPTZero审查发现:KPMG报告45条引用仅5条真实,vibe citing成为AI时代新风险

事件回顾

2025年10月,毕马威(KPMG)国际发布了一份名为《全面体验:在AI智能体时代重新定义卓越》的研究报告,总结了其全球客户体验卓越研究的年度成果。

八个月后,AI检测公司GPTZero对这份报告进行了系统性审查,结果令人震惊:报告中45条引用,只有5条准确指向了真实来源。28条引用中,标题被改写或混入了伪造成分;12条引用的信息过于模糊或残缺,根本无法核实。更严重的是,大约一半基于这些引用的事实陈述也是虚假的、缺乏依据的,或被归因到了错误的来源。

GPTZero将这种现象命名为"vibe citing"(感觉式引用)——和硅谷流行的"vibe coding"(感觉式编程)异曲同工:AI会根据指令"感觉"拼凑出一段看起来像真的内容,但谁也不知道它到底从哪里来的。

典型的翻车现场

报告中最离谱的案例之一是关于阿联酋航空的描述。报告声称阿联酋航空"推出了一款名为Sara的移动聊天机器人,可以与乘客对话并更改航班"。事实是:Sara是阿联酋航空2023年推出的一款实体机器人助手(不是聊天机器人),它根本无法修改航班预订

报告还列举了瑞银集团、瑞士联邦铁路和伦敦交通局的AI智能体部署案例研究。GPTZero指出,这些案例所引用的来源要么根本无法证实报告中的说法,要么包含改写和捏造内容,严重损害了其可信度。

另一个自相矛盾的尴尬时刻:报告称"55%的CEO将AI列为最高投资优先级"。然而,KPMG自己当月发布的《2025年CEO展望》调查显示,这个数字其实是71%。AI不仅对外部信息产生了幻觉,连自家的内部数据都搞错了。

不是孤例:四大咨询的AI翻车史

KPMG并非第一个在AI使用上出丑的咨询巨头。去年,德勤(Deloitte)被迫向澳大利亚政府退还了项目费用——因为一份纳税人资助的报告中被发现混入了AI生成的内容。

普华永道(PwC)今年早些时候放话:"不接受AI的员工将被辞退。"但讽刺的是,KPMG的一位合伙人在澳大利亚被曝出用AI来完成一场关于AI的考试。

这些事件背后有一个共同模式:咨询公司一边向客户兜售"AI转型"方案,一边在内部对AI的使用缺乏基本的质量控制。

为什么重要

1. 咨询业的信任危机。 企业每年花费数十亿美元购买咨询公司的研究报告和战略建议。如果KPMG这样的顶级机构都无法保证报告的事实准确性,整个行业的可信度都将受损。一份充满虚假引用的报告一旦被用于重大商业决策,后果不堪设想。

2. AI工具在企业场景的局限性暴露无遗。 KPMG的报告大概率使用了某种AI研究工具来收集案例和数据。这个案例清楚地表明:当前的AI在需要精确引用来源的场景下仍然非常不可靠。企业不能假设AI生成的内容天然可信,必须建立严格的人工审核流程。

3. "vibe citing"将成为AI时代的新风险术语。 GPTZero创造的这个词汇正在迅速传播——它精准描述了AI幻觉在学术研究和商业报告中的一种特定表现形态。和"deepfake""hallucination"一样,"vibe citing"有望成为AI风险词典中的标准词汇。

4. 监管将加速收紧。 当四大咨询公司接连出现AI滥用问题,监管机构不会坐视不管。未来类似报告可能需要标注AI参与程度、提供幻觉检测结果等,这种透明度要求很可能成为行业新标准。

四大咨询AI翻车史:Deloitte退款、KPMG下架——咨询业需要AI质量管控体系▲ 四大咨询AI翻车史:Deloitte退款、KPMG下架——咨询业需要AI质量管控体系

我们能学到什么

1. AI辅助≠AI替代——尤其在涉及事实核查的环节

KPMG的报告问题是AI在"找证据"环节充当了替代者而非辅助者。正确的做法是:AI可以帮助发现潜在案例和来源,但每个引用都必须经过人工验证——打开原始链接、确认内容、核实数据。

对于AI创业者和内容创作者而言,这是一条铁律:不要让AI替你做事实核查。用它来提速,然后自己把关。

2. "看起来靠谱"是最危险的信号

GPTZero指出,KPMG报告中的很多引用"看起来"指向真实来源,但标题被改写、作者被调换、或内容被重新组合。这种"半真半假"的引用比完全捏造的更难被发现——因为它们乍一看确实通向某个真实网站或论文。

警惕这种"看起来靠谱"的幻觉形式。建立引用验证清单:标题是否匹配?作者是否正确?日期是否合理?引用的内容是否确实出现在原出处?

3. 内部流程比外部表态更重要

KPMG的官方回应是:"我们认真对待已发布内容的准确性和完整性。该报告已被下架,我们正在审查其发布流程。"但问题在于:一份需要45条引用支撑的专业报告,为什么在发布前没有经过人工逐条验证?

这提醒所有使用AI的组织:文化比工具更重要。在内部建立"AI输出必须经人工验证"的流程规范,比对外宣传"拥抱AI"的漂亮话更关键。

行动建议

  1. 建立引用验证SOP:如果你的团队或项目依赖AI进行研究和写作,立即建立一份标准操作流程——每一条AI生成的外部引用都必须包含原始链接,并由至少一个人工审核员确认。
  2. 引入AI幻觉检测工具:GPTZero、Originality.ai等工具已经可以自动检测AI生成的引用和内容。将这些工具嵌入内容审核流程,作为发布前的最后一道防线。
  3. 制定AI使用披露政策:无论是商务报告、研究文章还是公众号内容,考虑在适当位置披露AI参与程度。透明本身就是一种质量信号——告诉读者"我们用AI辅助了初稿,但所有数据和引用都经过人工验证"。
  4. 警惕"vibe citing"蔓延到你的领域:KPMG的案例不是孤例。学术论文、行业白皮书、商业计划书都在面临同样的风险。如果你是AI创业者,确保你的产品和营销材料中的每一个数据点都可以追溯到原始来源。

#AI创业 #AI幻觉 #vibe_citing #咨询业 #AI风险 #一人公司

本文由AI辅助创作,经人工审核编辑发布