arXiv 新规:AI 幻觉引用将被封禁 1 年
arXiv 宣布新规:提交包含 AI 幻觉引用的论文将被封禁 1 年,后续投稿必须先在同行评审期刊发表。这是学术预印本平台针对 AI 生成虚假文献的最严厉措施。
2026年5月15日 · 阅读约 4 分钟
核心结论
2026 年 5 月 14 日,arXiv 正式宣布了一项针对 AI 生成虚假引用(幻觉引用)的严厉处罚政策:一旦发现论文中包含 AI 幻觉参考文献,作者将被禁止在 arXiv 投稿 1 年,且解禁后必须先在正规同行评审期刊发表才能重新使用 arXiv。
这是全球最大的学术预印本平台首次对 AI 生成内容造假祭出实质性惩罚,意味着学术出版业对 AI 乱象的容忍度已降至冰点。
关键要点
- 事件时间:2026 年 5 月 14 日
- 处罚力度:1 年投稿禁令,后续投稿需经同行评审
- 影响范围:arXiv 每年收到超 20 万篇投稿,涵盖物理、数学、计算机科学等多学科
- 波及对象:所有使用 AI 工具生成论文却未核实引用的作者
政策背景
arXiv(发音为"archive")是 1991 年由 Paul Ginsparg 创建的学术预印本平台,目前由康奈尔大学运营。它允许研究者在正式发表前公开发布论文,已成为物理学、计算机科学等领域的事实标准交流平台。
然而,随着 ChatGPT、Claude 等大语言模型在学术写作中的普及,一个严重问题随之浮现:AI 模型会自信地生成看似合理却完全不存在的参考文献 — 即"幻觉引用"(hallucinated references)。这些假引用不仅误导读者,还严重污染了学术文献数据库。
据俄勒冈州立大学 Thomas Dietterich 教授在 Twitter 上披露的信息,arXiv 已正式将此政策纳入执行流程。
关键影响
| 维度 | 变化 | 对我们意味着什么 | 建议动作 |
|---|---|---|---|
| 学术诚信 | AI 生成虚假引用将被严厉追责 | AI 辅助学术写作需增设人工核查环节 | 所有引用必须在 Google Scholar/PubMed 核实 |
| 内容创作 | AI 输出需要更严格的 fact-check | 内容生产者需建立验证 pipeline | 引入引用验证自动检查工具 |
| 工具使用 | AI 写作工具需强化引用准确性 | 需谨慎对待 AI 生成的参考文献 | 手动补充而非依赖 AI 生成引用 |
| 行业影响 | 期刊编辑审核压力增大 | 审核流程中增加 AI 生成检测 | 用 AI 检测 AI,建立双重验证机制 |
arXiv 的影响与意义
arXiv 选择用"1 年禁令 + 强制同行评审"而非永久封杀的方式,反映出他们在打击 AI 造假与鼓励开放科学之间的平衡考量:
- 轻于学术不端、重于监管真空:相比传统学术不端(数据造假、剽窃),AI 幻觉引用的主观恶意较低,但实际危害不小
- 激励而非惩罚:要求解禁后在同行评审期刊发表,本质上是在引导研究者回归严谨的学术规范
- 可执行性强:arXiv 拥有投稿审核团队,且有权利要求期刊交叉验证
对内容生产者的启示
虽然本政策主要针对学术论文,但对于使用 AI 工具进行内容生产的人来说,同样有重要参考价值:
- 引用必须可验证 — 无论是学术论文还是技术博客,声称的参考文献必须有真实来源
- AI 是助手,不是作者 — AI 生内容需要人工审核,尤其涉及事实引用时
- 建立核查流程 — 用 AI 辅助生产后,用搜索工具逐条验证引用真实性
工具词条
在 AI 内容生产工作流中,OpenAI、ChatGPT、Claude 等工具已成为常见生产工具。正确使用这些工具,需要了解它们的局限性 — 尤其在事实性和引用准确性方面。DeepSeek V4、Gemini 等模型也在不断提升引用准确率,但截至目前,没有模型能保证 100% 真实的参考文献输出。
相关延伸资料
- Twitter: Thomas Dietterich 披露 arXiv 新政
- HN 讨论: New arXiv policy: 1-year ban for hallucinated references
内链引导
- 学会用 AI Agent 正确辅助内容生产:AI Agent 驱动内容自动化:n8n MCP 从零搭建指南
- 深入了解 AI 自动化工具的实战使用:他用 Claude + n8n 搭建 AI 自动化系统,6 个月从 $4,000 到 $12,000/月