全球最大预印本平台arXiv今日凌晨宣布:凡论文中出现AI生成的虚构参考文献,所有署名作者禁投一年。同期Nature研究披露:仅2025年就有14.7万篇论文含虚假引用。
事件回顾
今天凌晨,俄勒冈州立大学杰出教授、arXiv计算机科学分区机器学习板块首席版主Thomas G. Dietterich正式宣布了一项震动学术界的新规:凡在投稿论文中存在"无可辩驳的证据"表明作者未核查大语言模型生成内容,所有署名作者将被禁止向arXiv投稿一年。
所谓"无可辩驳的证据",Dietterich给出了明确示例:虚构的参考文献、以及LLM生成后作者忘记删除的元注释——比如"这是200字的摘要,您需要我做任何修改吗?"或"此表中的数据为示意性质,请填入实验的实际数据"。
处罚措施极其严厉:一年禁投期结束后,作者再次向arXiv投稿时,论文必须先被"声誉良好的同行评审平台"接收,才能上传至arXiv。 这意味着被处罚者从"自由上传预印本"降级为"必须经过传统期刊审稿"才能回到arXiv。
这一政策背后有扎实的数据支撑。就在新规发布前一天(5月14日),Nature刊登了一项大规模研究:康奈尔大学Yian Yin团队审计了arXiv、bioRxiv、SSRN和PubMed Central四大研究仓储中的250万篇论文和预印本,涉及1.11亿条参考文献,发现仅2025年一年就有146,932条"幻觉引用"——即指向根本不存在的论文或研究者的虚假参考文献。
数据触目惊心:不同学科的AI幻觉污染率
Nature报道的研究揭示了一个令人不安的学科差异:
| 研究仓储 | 学科领域 | 幻觉引用率 |
|---|---|---|
| SSRN | 社会科学 | 1.91% |
| arXiv | 物理/计算机科学 | 0.39% |
| PubMed Central | 生物医学 | 0.27% |
| bioRxiv | 生物学 | 0.21% |
社会科学预印本平台SSRN以1.91%的幻觉引用率"夺冠"——几乎是其他主要仓储的5倍。研究者Yian Yin在接受Nature采访时表示:"我们对幻觉引用的整体规模和动态感到非常震惊。"
更值得关注的是,研究发现幻觉引用在2022年(ChatGPT发布年份)之前几乎不存在,而在2023年之后呈爆发式增长。并且,问题集中出现在发表记录较少的"新手研究者"群体中——暗示部分研究者正在用AI走捷径"批量生产"论文。
AI学界连锁反应:顶会早已竖起红线
arXiv并非第一个对AI滥用亮剑的学术平台。事实上,2025-2026年的多个AI顶会已经出台了针对作者和审稿人的双重约束:
- ICLR 2026:对不主动披露使用AI的作者予以惩罚;审稿人违规使用AI审稿,其自己的投稿论文可能被直接拒稿。
- ICML 2026:严禁将LLM列为论文作者,严禁任何形式的隐藏提示词注入。
- CVPR 2025:审稿任何阶段禁止使用LLM撰写或翻译评审意见;审稿人提交AI生成意见,自身论文可能被直接拒绝。
- EMNLP 2025:被接收论文必须附带"负责任NLP检查清单",声明AI使用情况。
arXiv的新规将这一趋势推向了新的高度——从此前的"要求披露"升级为"违规即拉黑"。
为什么重要:AI创业者的三个关键启示
1. AI内容的责任边界正在固化
arXiv新规的核心逻辑是:"在论文上署名即表示每位作者对其全部内容承担完全责任,无论这些内容是如何生成的。" 这条原则正在从学术界向产业界蔓延。对于AI创业者而言,这意味着:
- 用AI生成的商业文档、技术白皮书、产品文案,一旦出问题,责任100%由人类承担
- "是AI写的"不能成为免责理由——这个认知正在被制度固化
- 内容审核和事实核查将成为一个明确的成本项
2. 学术诚信危机将催生新的检测工具市场
Nature研究显示,1100万条参考文献中有近15万条是假的,这已经是一个无法靠人工解决的规模问题。arXiv新规要求"声誉良好的同行评审"作为解禁条件,意味着期刊和会议需要自动化检测工具。
目前已涌现的检测方向:DOI交叉验证、引用图谱一致性检查、LLM输出水印检测。对AI创业者而言,这是一个正在形成的B端工具市场——面向学术出版社、大学科研处、基金评审机构的内容真实性核验服务。
3. "AI辅助≠AI替代"的行业共识正在加速形成
无论是arXiv的"作者全责"原则,还是各顶会的"必须披露AI使用"要求,本质上都在刻画同一条线:AI可以辅助,但人类必须主导全流程并承担最终责任。 这个原则对AI内容创业、AI编程工具、AI设计工具等赛道都有深远影响——"全自动"可能不是卖点,反而是风险。
我们能学到什么
第一,核查文化必须成为AI工作流的默认配置。 arXiv给出的"无可辩驳的证据"案例——忘记删除的LLM元注释和虚构参考文献——暴露的不是AI能力问题,而是使用者的流程缺陷。在自己的AI内容生产线上,至少要有一个"人工终审"环节。
第二,跟踪学术界的AI治理政策演变,可以预判产业监管方向。 学术界通常是AI治理的"先行试点"。arXiv的"署名即全责"原则,大概率会在未来2-3年内出现在商业合同、行业标准甚至法律条文中。
第三,虚假内容检测正在成为独立赛道。 14.7万篇论文含虚假引用这个数据本身就是一个巨大的市场需求信号。如果你正在寻找AI创业方向,内容真实性验证工具值得关注。
行动建议
•如果你的产品涉及AI生成内容:立即在用户协议和产品设计中加入"人类审阅义务"条款,这是监管趋严前的必要准备。
•如果你在做AI内容创业:将事实核查流程标准化、工具化,这不仅是质量控制,更是合规刚需。
•如果你是AI应用开发者:关注引用验证API、幻觉检测工具的生态机会,这是一个需求明确但供给不足的市场。
参考信息来源:机器之心报道(腾讯新闻转载·2026年5月15日)、Nature新闻文章"Hallucinated citations highest in social sciences preprints site"(Chris Stokel-Walker·2026年5月14日)、Thomas G. Dietterich在Twitter/X的官方声明、康奈尔大学Yian Yin团队arXiv预印本研究论文。
#AI风向 #arXiv #学术诚信 #AI幻觉 #内容审核 #一人公司
本文由AI辅助创作,经人工审核编辑发布
