**GPT-5.4 Pro 帮人类推进 60 年未解 Erdős 难题:
一个困扰数学界 60 年的问题,被一个 23 岁的年轻人用一次 GPT-5.4 Pro 提示,在大约 80 分钟内推进了关键一步。这听起来像科幻,但它真实发生了,而且最震撼的不是“AI 解决了难题”,而是它如何解决的。
许多人看到这类新闻,第一反应是惊呼“AI 要取代数学家了”。但仔细看整个过程,你会发现这更像一场新型协作的预演:人类负责提出正确的问题、筛选方向和最终验证,AI 则在高频试错、路径探索和意外连接上展现出惊人效率。这次事件,不是 AI 单枪匹马征服数学,而是标志着 AI 正在从单纯的答案生成器,逐步升级为人类研究者的推理搭档。
60 年未解的 Erdős 难题,难在“思路”而非“算力”
Paul Erdős 是 20 世纪最多产的数学家之一,他留下了大量以自己名字命名的开放问题。这些问题往往看似简单,却卡住了几代顶尖数学家。Erdős Problem #1196 正是其中之一,它涉及“primitive sets”(原始集)——一种特殊的正整数集合,其中任意两个不同元素的乘积都不再属于该集合。
简单类比一下:想象你有一堆积木,每块代表一个正整数。你要挑选一部分积木组成集合,保证任意两块拼在一起后形成的“新积木”不能再放回这堆里。这个集合的最大“密度”或某种加权和的上界,就是问题的核心。Erdős、Sárközy 和 Szemerédi 等数学家很早就提出了相关猜想,后续工作围绕如何精确界定这个集合的性质展开。
为什么这么难?不是因为计算量巨大,而是因为找到正确的证明思路极其稀缺。以往尝试大多转向实分析工具,把问题映射到连续空间,用概率或渐近分析来处理。但这些路径常常卡在某些分析困难上,难以收紧界限。几十年过去,人类数学家尝试了多种方向,却始终没能完全破解这个具体变体。
这类问题的本质是“创造性跳跃”:你需要发现两个看似无关概念之间的深层联系,或者找到一个古典工具的意外用法。纯靠人力试错,成本极高;纯靠蛮力搜索,空间又大到离谱。这正是 AI 参与后显得特别有价值的地方——它能快速生成大量候选思路,并从中筛选出人类可能忽略的路径。
GPT-5.4 Pro 到底做了什么?辅助,而非独立“证明”
根据公开记录,23 岁的 Liam Price(无高等数学专业训练)向 GPT-5.4 Pro 发出了一个提示,模型在约 80 分钟的思考时间内生成了解决方案,随后又花 30 分钟整理成 LaTeX 格式。结果被发布在 erdosproblems.com 上,目前形式化验证正在进行中。
关键在于角色分工:- AI 做了什么:它没有简单复制已有文献,而是提出了一种全新的证明策略。模型避开了人类惯用的“转向实分析”路线,而是留在整数的算术领域,巧妙地运用了 von Mangoldt 函数。这个古典工具通常与素数和 Riemann zeta 函数深度关联,它编码了一个基本恒等式:任意正整数 n 的除数上 von Mangoldt 权重的和等于 log n,这本质上反映了整数的唯一分解性质。
通过这个工具,模型化解了之前堵塞分析路径的困难,找到了一个更直接的算术论证。数学家 Terence Tao 在论坛评论中指出,这一工作揭示了整数结构与 Markov 过程理论之间此前未被充分描述的联系,甚至可能超出这个具体问题的意义。另一位研究者也评价称,模型使用的 Markov 链技巧是人类多年来忽略的创造性一步。
- AI 没做什么:它不是独立完成整个科研闭环。人类用户定义了问题边界,提供了初始提示,模型输出后仍需数学家审查、形式化验证(如用 Lean 证明助手),并评估其更广泛含义。最终是否被完全接受为“新证明”,还需要社区进一步确认。
这不是“AI 独立解决数学难题”的神话,而是典型的人机协作:人类设定目标与验证标准,AI 负责高密度推理探索和压缩搜索空间。它像一个极度勤奋且没有认知偏见的助手,能在短时间内尝试人类可能几年都试不完的方向。
“这更接近一本‘Book Proof’(优雅的证明)。”——有数学家在阅读后如此评价。
与以往一些 AI 数学案例不同,这次的关键亮点在于方法的新颖性。许多早期“解决”其实是模型挖出了尘封文献中的已有结果,而这次 GPT-5.4 Pro 似乎真正贡献了原创性的连接。
AI 辅助数学研究,已走到哪个阶段?
把这次事件放回更大背景看,AI 在数学领域的角色正在悄然演变。
早期,AI 更多是“刷题工具”或文献搜索加速器。它能快速定位相关论文、生成反例,或在简单定理上提供形式化证明。最近一两年,随着模型推理能力的提升,它开始进入更复杂的组合问题、几何推理和分析领域。Erdős 问题社区已成为一个生动观测点:AI 工具已帮助标记了数十个问题的进展,有的找到文献解决,有的贡献部分结果,还有少数像 #1196 这样展现出潜在原创路径。
当前阶段可以用一个简化框架描述 AI 在数学研究流程中的位置:
1. 提出假设与发散思路:AI 擅长快速生成多个候选路径,包括人类因偏见或知识局限容易忽略的“冷门”角度。
2. 搜索与压缩空间:模型能并行探索大量可能性,筛选出可验证性较高的子方向,极大缩短试错周期。
3. 人工筛选与深化:人类数学家判断哪些思路值得深入,结合领域直觉进行调整。
4. 形式化验证:借助 Lean 等工具,将证明严格化,确保无懈可击。
5. 论文产出与意义提炼:最终由人类完成叙事、上下文关联和更广影响的讨论。
在这个流程里,AI 最突出的价值在于加速探索的前半段。它不怕“傻尝试”,也不受固有范式束缚,能发现意想不到的桥梁,比如这次 von Mangoldt 函数与问题核心的巧妙结合。
当然,边界依然清晰。AI 目前还难以独立处理极高抽象度的概念创新、长期研究规划,或在缺乏清晰反馈信号的领域坚持正确方向。人类在定义“什么问题值得解”、评估美感和潜在影响上,仍不可替代。短期内,AI 更可能是研究团队的“超级初级研究员”——速度快、精力无限,但需要有经验的导师指导方向。
以往案例也印证了这一点:有些 AI “解决”后来被发现是已有结果的重现,而真正有价值的进展,往往来自人机紧密配合下的意外发现。
普通人能借鉴什么?学会把 AI 当成“推理搭档”
你可能不是数学家,但这次事件的方法论,对每个需要处理复杂问题的人都有启发。
核心是“发散-收敛-验证”的工作流:
- 先让 AI 大量生成候选思路(发散),不要急着评判对错;
- 然后人工或结合模型按可验证性、潜在价值排序(收敛);
- 最后自己或用工具严格校验关键步骤。
举个生活化例子。假设你在工作中要写一份复杂方案:
1. 提示模型:“针对这个问题,请给出至少 5 条完全不同的解决路径,每条包括核心假设、可能障碍和初步证据方向。”
2. 逐一审视,挑选 1-2 条最有潜力的。
3. 让模型深入展开选中的路径,你负责补充实际数据、风险评估和业务判断。
4. 最后人工润色并验证逻辑闭环。
这个思路同样适用于代码调试(让 AI 提出多种 bug 定位策略)、数据分析(生成不同建模假设)、调研报告(发散信息源与框架)甚至个人学习(拆解一个难懂的概念)。
一个简单可复用的提示模板(你可以直接尝试):
“请针对 [具体问题],先列出 5-7 个可能的解决或证明路径。每条路径描述核心想法、依赖的工具/概念、潜在优势和风险。最后按‘新颖性 + 可验证性’排序,并说明理由。”
用好这个模板的关键,不是追求 AI 一次性给出完美答案,而是把 AI 当成“高频思考伙伴”,你负责最终的判断与整合。未来,真正拉开差距的,不是谁会用 AI 问问题,而是谁会组织 AI 的推理过程,像指挥一支探索队一样,让机器的广度弥补人类的深度局限。
从数学难题到日常生产力
这次 GPT-5.4 Pro 在 Erdős #1196 上的表现,提醒我们:AI 的真正突破,往往不是取代人类,而是重新定义人机协作的边界。它让原本高不可攀的探索成本大幅降低,让更多人(包括业余爱好者)能参与到高质量推理中来。
对专业研究者而言,这意味着研究节奏可能加快;对工程师和知识工作者而言,这是一套可迁移的“AI 辅助复杂思考”方法;对普通人而言,它降低了大问题的门槛——你不需要成为专家,就能借助强大模型拆解难题。
想亲身试试这种“让模型先发散推理、再由人筛选验证”的工作流吗?可以去 api.884819.xyz 看看 API 接入方式,把大模型无缝接到你的笔记、代码、调研或知识库流程里。新用户注册即送体验token,国产模型完全免费,没有月租,按量付费,注册后直接可用。
下一篇,我们会拆一套普通人也能落地的“AI 研究工作流”:如何系统地让模型发散、收敛、事实校验,把 AI 从偶尔聊天的工具,真正变成每天提升生产力的推理搭档。敬请期待。 本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。#AI新闻 #GPT-5.4 #Erdős问题 #人工智能 #数学AI #人机协作 #Prompt技巧 #AI生产力 #8848AI #AI研究