一个普通人的单次提示,80分钟破解60年数学难题:GPT-5.4 Pro 如何重塑研究门槛

想象一下:你23岁,没有专业数学训练背景,只是对数论有点业余兴趣。面对一个困扰了埃尔德什(Paul Erdős)、Sárközy和Szemerédi等顶级数学家近60年的难题,你只输入了一个提示词。80分钟后,AI完成深度推理;再过30分钟,它吐出一份结构完整的LaTeX论文。问题解决了,而且社区很快在erdosproblems.com上标记为已解决,Terence Tao等数学家给出积极评价。

这不是科幻小说,而是2026年4月真实发生在Liam Price身上的故事。他借助GPT-5.4 Pro,一击解决Erdős问题#1196——关于“primitive sets”(原始集)的求和猜想。 [[1]](https://www.erdosproblems.com/1196)

这个事件远不止于“AI又解了一道题”。它标志着AI从数学计算工具,真正跃升为能够发现新连接、提出非传统路径的“合作者”。更重要的是,它告诉每一个普通人:前沿数学研究的门槛,正在被大幅降低。你不需要十年苦读博士课程,或许只需要一个好的提示和一台能调用顶级模型的电脑,就能参与到曾经只有少数天才才能触及的领域。

一个23岁小白的“一击必杀”——事件全景还原

Erdős问题#1196的背景,要从“primitive set”说起。简单来说,一个primitive set是正整数的一个子集,其中任意两个不同元素互不整除(没有一个是另一个的倍数)。经典例子包括所有素数,或者所有恰好有k个素因子的数。

埃尔德什、Sárközy和Szemerédi在几十年前提出猜想:对于足够大的x,在[x, ∞)范围内的任意primitive set A,满足

\[

\sum_{a \in A, a > x} \frac{1}{a \log a} < 1 + o(1)

\]

随着x趋于无穷,这个和的上界接近1。Lichtman此前证明了一个较弱的上界(约1.399 + o(1)),并在相关族问题上投入多年精力,但#1196的核心量化版本长期受阻。 [[2]](https://www.forbes.com/sites/anishasircar/2026/04/17/ai-solved-a-mathematical-problem-that-had-stumped-the-worlds-best-minds-for-decades/)

Liam Price的突破极其简洁。据报道,他仅用一个提示(one-shot),让GPT-5.4 Pro自主推理约80分钟,模型不仅找到了证明,还生成了可读的LaTeX稿件。证明的关键在于,它没有沿袭人类常见的从分析转向概率的“自然路径”,而是巧妙利用了von Mangoldt函数(Λ(n))结合Markov过程的思想,保留纯解析框架,找到了人类长期忽略的算术路径。 [[3]](https://politicalcalculations.blogspot.com/2026/04/ai-finds-novel-proof-for-erdos-problem.html)

erdosproblems.com页面很快更新状态为“已解决”,并附上Overleaf链接。Terence Tao在论坛评论中指出,这个证明揭示了整数结构(anatomy of integers)与Markov过程理论之间此前未被明确建立的紧密联系:“这可能对整数解剖学做出超出这个特定问题的有意义贡献。” Jared Duker Lichtman(该问题族的主要人类专家)也评价它可能是一篇“Book Proof”——埃尔德什口中上帝之书里的优雅证明。 [[4]](https://www.reddit.com/r/math/comments/1smehbo/stunning_ai_breakthrough_gpt_54_solves_erdos/)

社区反应迅速:有人开始用Lean形式化验证,证明已被确认正确。这不是AI自说自话,而是经过数学家审视和社区讨论的真实进展。

“AI生成的论文无意中突出了两个数学领域之间比文献中明确表述的更紧密的联系。”——Terence Tao

这个故事的反差感强烈:一个几乎没有高级数学训练的年轻人,用一次提示,就完成了专家多年未竟的工作。它像一记警钟,也像一扇突然打开的门。

AI辅助数学研究的真实进展——从辅助到合作

AI在数学领域的演进并非一夜之间。从早期AlphaProof、AlphaGeometry在奥林匹克级别问题上的突破,到近年GPT系列、Aristotle等工具在形式化证明和Erdős问题上的贡献,路径清晰可见。

早期,AI更多扮演“强力搜索者和验证者”角色。它擅长快速检索文献、生成候选证明草稿、辅助形式化(Lean、Isabelle等)。2025-2026年间,AI对Erdős问题的贡献已累计数十个:有的帮助定位遗漏文献,有的拼凑现有定理形成新解,有的则实现部分自主证明。

#1196的独特价值在于其“非人类路径”。人类研究者倾向于将问题转化为概率视角,因为“从分析到概率”的跳跃在直觉上自然。但GPT-5.4 Pro反其道而行之,坚守解析工具箱,用von Mangoldt权重巧妙编码唯一分解定理(∑_{q|n} Λ(q) = log n),并结合Markov链观点构建对偶证书或流网络解释。这种方法在事后看有前兆,但此前未被充分探索。Tao和Lichtman都提到,这一步“有一定跳跃性”,即使回顾时显得优雅。 [[5]](https://www.facebook.com/xixidu/posts/gpt-54-pro-solves-erd%C5%91s-problem-1196note-that-jared-duker-lichtman-is-one-of-the/10174317623480637/)

当前阶段,AI的强项清晰:

  • 发现新连接:快速探索组合空间,提出人类因认知偏好而忽略的角度。
  • 速度与规模:80分钟完成人类可能需数月迭代的推理。
  • 生成可验证输出:直接产出LaTeX或形式化代码,降低沟通成本。

但局限同样明显:AI仍可能产生幻觉,需要人类专家进行严格审视和最终验证;创造性跃迁仍有边界,真正“从零发明”新理论框架的案例仍少;形式验证(如Lean)仍是确保可靠性的关键环节。

Forbes和Scientific American等报道均强调,这次事件不同于单纯的“文献挖掘”,而是展现了AI在提出原创技术路径上的潜力。 [[6]](https://www.scientificamerican.com/article/amateur-armed-with-chatgpt-vibe-maths-a-60-year-old-problem/)它推动数学社区认真对待“人机共创”模式:AI负责广度探索和快速迭代,人类负责方向把控、美学判断和跨领域洞见。

普通人能借鉴的“AI+人类”研究新范式

对中国AI用户来说,这个故事最振奋人心的部分在于可复制性。Liam Price并非天才数学家,他成功的关键在于“vibe matching”式的提问方式:不死板预设证明路径,而是描述问题本质、鼓励AI自由进行长链推理,并用直觉进行轻度引导。

实用“AI Co-Pilot”工作流建议(从小白到进阶均可上手):

1. 问题表述阶段:用自然语言清晰定义问题,避免过度技术化。示例:“考虑primitive sets,其中元素互不整除。探索对∑ 1/(a log a) 的上界估计,允许使用von Mangoldt函数或Markov观点,尝试寻找人类文献中较少走的纯解析路径。”

2. 鼓励长推理:添加指令如“请进行逐步、深入的链式推理,不要过早收敛。探索至少3-5种不同角度,并在每步解释动机和潜在缺陷。”

3. 迭代与验证:让AI输出中间步骤后,人工审视关键跳跃点,追问“这个连接是否有文献支持?能否用SymPy或简单数值实验验证小案例?”

4. 输出格式控制:要求生成LaTeX片段、伪代码或形式化语句,便于后续验证。

这里给出一个简化的AI数学探索提示模板,你可以在支持长上下文的模型(如GPT-5.4 Pro)中直接使用:

你是一位探索性数论研究员。任务:针对以下猜想[插入具体问题],不要局限于已有文献的常见方法。尝试结合[指定工具,如von Mangoldt函数、生成函数、概率视角等],生成多种候选路径。

要求:

  • 每条路径包含动机、核心技术步骤、潜在优势与风险。
  • 进行至少2000 tokens的详细推理。
  • 最后总结最有前景的一条,并输出LaTeX格式的关键引理证明草稿。
  • 如果发现新连接,明确指出它与哪些经典定理的关联。
结合代码验证的实用技巧:对于数论关系,可以用Python + SymPy快速检查小规模案例。以下是一个简单片段,用于验证primitive set的基本性质(可直接复制尝试):
import sympy as sp

import itertools

def is_primitive_set(s):

"""检查集合是否为primitive set(无元素整除另一元素)"""

for a, b in itertools.combinations(s, 2):

if a % b == 0 or b % a == 0:

return False

return True

示例:检查小集合

test_set = [6, 35, 11] # 6=23, 35=57, 11=11,互不整除

print(is_primitive_set(test_set)) # True

这个代码虽简单,却能帮助你快速验证AI生成的构造是否合理。在实际研究中,你可以让AI生成更复杂的SymPy脚本,用于符号计算或数值逼近。

潜在风险与应对
  • 幻觉:AI可能自信地输出错误步骤。解决办法是要求模型自我质疑,或用独立会话交叉验证。
  • 验证负担:复杂证明仍需人工或形式工具把关。新手可从小型猜想或教科书习题开始练手。
  • 依赖陷阱:过度依赖AI可能削弱个人直觉培养。建议始终保留“人类判断最后拍板”的环节。

核心范式是:人类负责方向选择、价值判断和跨领域整合,AI负责深度探索、速度迭代和草稿生成。这样组合,能让普通人高效完成文献综述、idea brainstorm、证明草稿,甚至小规模原创探索。

想亲手体验GPT-5.4 Pro这样强大的数学推理能力?立即访问 api.884819.xyz,注册即可调用最新OpenAI前沿模型,搭建属于自己的AI研究助手,开启人机共创之旅——很多读者已经用它加速了学习和项目,效果远超预期。新用户注册即送体验token。

AI数学时代的门槛与未来

Erdős问题#1196的解决,像一个信号弹:数学研究正从“少数天才独占的象牙塔”,走向“人机共创的开放场域”。未来几年,我们很可能看到AI在更多猜想、甚至更广阔的科学领域实现类似跃迁。中国AI用户凭借对国产模型(如Deepseek、Qwen系列)的熟悉和对实用工具的敏感,有望率先拥抱这一浪潮,加速个人成长或衍生新应用。

当然,门槛降低不等于零门槛。形式验证依然重要,创造性直觉仍有不可替代的价值,伦理与可解释性问题也会伴随而来。但机遇远大于挑战:学生可以用AI辅助攻克难题,研究者能更快迭代假设,业余爱好者甚至能贡献有价值的洞见。

这个时代,决定你能否参与的,不再只是起点学历,而是你是否愿意尝试新工具、迭代提示,并保持批判性思考。

当AI能在一小时内帮普通人破解60年数学难题,下一个被颠覆的领域会是什么?下一篇文章,我们聊聊“GPT-5.4 Pro在代码生成与复杂系统模拟上的最新突破,以及普通开发者如何用它快速迭代产品原型”——敬请期待,别错过你的下一波生产力跃升。

本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。

#AI数学 #GPT-5.4 #Erdős问题 #人机共创 #Prompt技巧 #数论 #人工智能 #8848AI #AI研究 #数学突破