WayToClawEarn
高影响HN / Gowers's Weblog

ChatGPT 5.5 Pro 产出可发表 LaTeX 论文:AI 写作能力里程碑

菲尔兹奖得主 Timothy Gowers 亲测:ChatGPT 5.5 Pro 在 17 分钟内构思出数论证明,再花 2 分钟自动写成 LaTeX 预印本。这是 AI 首次独立产出可发表的学术论文级输出,对内容自动化生产具有里程碑意义。

2026年5月10日 · 阅读约 5 分钟

核心结论

2026 年 5 月 8 日,菲尔兹奖得主 Timothy Gowers 发布了一篇引起学术界震动的博客文章:ChatGPT 5.5 Pro 仅用 17 分钟推理 + 2 分钟写作,就完成了一个数论问题的证明构造,并自动输出为 LaTeX 格式的学术预印本

关键指标数据
测试时间2026-05-08
测试人Timothy Gowers(菲尔兹奖得主,剑桥大学)
问题类型加性数论 sumset 直径上界证明
推理时间17 分 05 秒
LaTeX 生成2 分 23 秒
输出格式完整 LaTeX 预印本(可直接投稿)
HN 热度639 upvotes,当日第一

关键结论:这是 AI 首次从「解题工具」进化为「学术写作协作者」,对内容自动化生产的意义远大于数学界本身。

背景:Gowers 的测试设计

Gowers 挑选了一个由数学家 Mel Nathanson 在其论文中提出的公开问题——证明 sumset 直径的二次上界。这个问题的特点在于:

  • 它有已知的线性代数构造(Nathanson 的原证),但非最优
  • ChatGPT 需要自己发现更高效的 Sidon 集合来改进上界
  • 证明思路需要真正的组合数学洞察,而非文献检索

Gowers 在 HN 讨论中补充:他刻意选择了一个「不太热门但已有公开记录」的问题,以确保 ChatGPT 不是在复制已有结果。

「我觉得这个测试是公平的:ChatGPT 确实需要自己构造证明,而不是从文献中摘抄。」— Timothy Gowers

关键过程还原

Step 1:推理(17 分钟)

ChatGPT 5.5 Pro 花了 17 分钟思考问题结构。它的核心洞察是:Nathanson 使用 2 的幂次方作为 Sidon 集构造的基座,但这导致直径呈线性增长。如果改用更高效的二次 Sidon 集,就可以把直径从线性压到二次最优。

这正是组合数学中典型的「换个好工具」时刻。Gowers 评论说:「Nathanson 没这么做,可能是因为他试图推广自己的归纳构造,而 ChatGPT 从零出发直接选择了最优路径。」

Step 2:写作(2 分钟 23 秒)

ChatGPT 初始输出风格「冗长且带有典型 LLM 腔调」。Gowers 直接要求:"请把它写成 LaTeX 格式的学术预印本风格。" 2 分 23 秒后,ChatGPT 输出了一个结构完整的 LaTeX 文档,包含引言、引理、证明、结论和参考文献框架。

Step 3:验证(数小时)

Gowers 花了数小时手动验证证明的正确性。最终确认:证明逻辑完整,且 ChatGPT 还用同样的方法改进了 Nathanson 的另一个相关结论(限制 sumset 问题)。

最终的预印本在这里:A note on sumsets and restricted sumsets

ChatGPT latex paper mathematical proof

对内容自动化生产的启示

这次实验对 AI 内容生产领域有三点关键启示:

维度传统 AI 写作(GPT-4)ChatGPT 5.5 Pro
输出形式散文 / Markdown 博客结构化 LaTeX 学术论文
推理深度表面模式匹配17 分钟深度链式推理
迭代能力需用户反复提示按「写成论文」一次性重构
事实准确性频繁幻觉经 Fields 奖得主验证,证明正确

这意味着:AI 的输出格式天花板正在被打破。以前只能写博客,现在可以写论文。对内容创作者来说,这意味着:

  • 高质量结构化内容(研究报告、白皮书、技术文档)的生产成本将急剧下降
  • AI 输出的「可验证性」在提高——Gowers 能验证数学证明,就说明不是空洞的 AI 废话
  • LaTeX/Markdown 结构化输出将成为 AI 内容生产的标配

学术界的分歧

HN 讨论中出现了两派观点:

乐观派(包括 John Baez 等知名数学家)认为:

  • 如果问题本身就够难,AI 能思考 17 分钟本身就是突破
  • 「如果思想的价值来自其效用而非稀缺性,那 AI 创造更多好思想是好事」
  • 物理学教授反馈:Gemini 能找出代码中漏写的虚数单位,这种细粒度检查在传统 peer review 中极为罕见

担忧派认为:

  • 培养 PhD 学生的「入门级问题」池已被 AI 抽干
  • 「能做研究」的最低门槛正在被 AI 抬高
  • 未来判断一项工作的价值,将越来越难以剥离 AI 的贡献

工具词条(自然匹配)

本文涉及的核心 AI 工具:OpenAIChatGPTClaudeGemini。这些工具的 API 价格和推理能力正在快速迭代,对自动化内容生产管线至关重要。

相关延伸资料

内链引导

免责声明:本站案例均为知识分享内容,仅供灵感与参考,不构成收益承诺;由此进行的外部执行与结果请自行判断并承担相应责任。