ChatGPT 5.5 Pro 产出可发表 LaTeX 论文:AI 写作能力里程碑
菲尔兹奖得主 Timothy Gowers 亲测:ChatGPT 5.5 Pro 在 17 分钟内构思出数论证明,再花 2 分钟自动写成 LaTeX 预印本。这是 AI 首次独立产出可发表的学术论文级输出,对内容自动化生产具有里程碑意义。
2026年5月10日 · 阅读约 5 分钟
核心结论
2026 年 5 月 8 日,菲尔兹奖得主 Timothy Gowers 发布了一篇引起学术界震动的博客文章:ChatGPT 5.5 Pro 仅用 17 分钟推理 + 2 分钟写作,就完成了一个数论问题的证明构造,并自动输出为 LaTeX 格式的学术预印本。
| 关键指标 | 数据 |
|---|---|
| 测试时间 | 2026-05-08 |
| 测试人 | Timothy Gowers(菲尔兹奖得主,剑桥大学) |
| 问题类型 | 加性数论 sumset 直径上界证明 |
| 推理时间 | 17 分 05 秒 |
| LaTeX 生成 | 2 分 23 秒 |
| 输出格式 | 完整 LaTeX 预印本(可直接投稿) |
| HN 热度 | 639 upvotes,当日第一 |
关键结论:这是 AI 首次从「解题工具」进化为「学术写作协作者」,对内容自动化生产的意义远大于数学界本身。
背景:Gowers 的测试设计
Gowers 挑选了一个由数学家 Mel Nathanson 在其论文中提出的公开问题——证明 sumset 直径的二次上界。这个问题的特点在于:
- 它有已知的线性代数构造(Nathanson 的原证),但非最优
- ChatGPT 需要自己发现更高效的 Sidon 集合来改进上界
- 证明思路需要真正的组合数学洞察,而非文献检索
Gowers 在 HN 讨论中补充:他刻意选择了一个「不太热门但已有公开记录」的问题,以确保 ChatGPT 不是在复制已有结果。
「我觉得这个测试是公平的:ChatGPT 确实需要自己构造证明,而不是从文献中摘抄。」— Timothy Gowers
关键过程还原
Step 1:推理(17 分钟)
ChatGPT 5.5 Pro 花了 17 分钟思考问题结构。它的核心洞察是:Nathanson 使用 2 的幂次方作为 Sidon 集构造的基座,但这导致直径呈线性增长。如果改用更高效的二次 Sidon 集,就可以把直径从线性压到二次最优。
这正是组合数学中典型的「换个好工具」时刻。Gowers 评论说:「Nathanson 没这么做,可能是因为他试图推广自己的归纳构造,而 ChatGPT 从零出发直接选择了最优路径。」
Step 2:写作(2 分钟 23 秒)
ChatGPT 初始输出风格「冗长且带有典型 LLM 腔调」。Gowers 直接要求:"请把它写成 LaTeX 格式的学术预印本风格。" 2 分 23 秒后,ChatGPT 输出了一个结构完整的 LaTeX 文档,包含引言、引理、证明、结论和参考文献框架。
Step 3:验证(数小时)
Gowers 花了数小时手动验证证明的正确性。最终确认:证明逻辑完整,且 ChatGPT 还用同样的方法改进了 Nathanson 的另一个相关结论(限制 sumset 问题)。
最终的预印本在这里:A note on sumsets and restricted sumsets
对内容自动化生产的启示
这次实验对 AI 内容生产领域有三点关键启示:
| 维度 | 传统 AI 写作(GPT-4) | ChatGPT 5.5 Pro |
|---|---|---|
| 输出形式 | 散文 / Markdown 博客 | 结构化 LaTeX 学术论文 |
| 推理深度 | 表面模式匹配 | 17 分钟深度链式推理 |
| 迭代能力 | 需用户反复提示 | 按「写成论文」一次性重构 |
| 事实准确性 | 频繁幻觉 | 经 Fields 奖得主验证,证明正确 |
这意味着:AI 的输出格式天花板正在被打破。以前只能写博客,现在可以写论文。对内容创作者来说,这意味着:
- 高质量结构化内容(研究报告、白皮书、技术文档)的生产成本将急剧下降
- AI 输出的「可验证性」在提高——Gowers 能验证数学证明,就说明不是空洞的 AI 废话
- LaTeX/Markdown 结构化输出将成为 AI 内容生产的标配
学术界的分歧
HN 讨论中出现了两派观点:
乐观派(包括 John Baez 等知名数学家)认为:
- 如果问题本身就够难,AI 能思考 17 分钟本身就是突破
- 「如果思想的价值来自其效用而非稀缺性,那 AI 创造更多好思想是好事」
- 物理学教授反馈:Gemini 能找出代码中漏写的虚数单位,这种细粒度检查在传统 peer review 中极为罕见
担忧派认为:
- 培养 PhD 学生的「入门级问题」池已被 AI 抽干
- 「能做研究」的最低门槛正在被 AI 抬高
- 未来判断一项工作的价值,将越来越难以剥离 AI 的贡献
工具词条(自然匹配)
本文涉及的核心 AI 工具:OpenAI、ChatGPT、Claude、Gemini。这些工具的 API 价格和推理能力正在快速迭代,对自动化内容生产管线至关重要。
相关延伸资料
内链引导
- 想用 AI 做结构化内容输出?看:如何用 Claude Code 实现自动化内容生产:30 分钟从零搭建 AI 写作工作流
- AI 写作的可靠性如何保证?看:他靠 AI 代码审查+规范驱动开发月入过万:自由开发者的实战复盘
- 想了解 AI Agent 内容生产的最新工具?看:AI Agent 工具实操教程:从安装到自动化工作流