**GPT-5.4 Pro 帮人类推进 60 年未解 Erdős 难题：

本文最后更新于 2026-04-29，文章内容可能已经过时。

GPT-5.4 Pro 帮人类推进 60 年未解 Erdős 难题：AI 从“答案机”升级为研究搭档

一个困扰数学界 60 年的问题，被一个 23 岁的年轻人用一次 GPT-5.4 Pro 提示，在大约 80 分钟内推进了关键一步。这听起来像科幻，但它真实发生了，而且最震撼的不是“AI 解决了难题”，而是它如何解决的。

许多人看到这类新闻，第一反应是惊呼“AI 要取代数学家了”。但仔细看整个过程，你会发现这更像一场新型协作的预演：人类负责提出正确的问题、筛选方向和最终验证，AI 则在高频试错、路径探索和意外连接上展现出惊人效率。这次事件，不是 AI 单枪匹马征服数学，而是标志着 AI 正在从单纯的答案生成器，逐步升级为人类研究者的推理搭档。

60 年未解的 Erdős 难题，难在“思路”而非“算力”

Paul Erdős 是 20 世纪最多产的数学家之一，他留下了大量以自己名字命名的开放问题。这些问题往往看似简单，却卡住了几代顶尖数学家。Erdős Problem #1196 正是其中之一，它涉及“primitive sets”（原始集）——一种特殊的正整数集合，其中任意两个不同元素的乘积都不再属于该集合。

简单类比一下：想象你有一堆积木，每块代表一个正整数。你要挑选一部分积木组成集合，保证任意两块拼在一起后形成的“新积木”不能再放回这堆里。这个集合的最大“密度”或某种加权和的上界，就是问题的核心。Erdős、Sárközy 和 Szemerédi 等数学家很早就提出了相关猜想，后续工作围绕如何精确界定这个集合的性质展开。

为什么这么难？不是因为计算量巨大，而是因为找到正确的证明思路极其稀缺。以往尝试大多转向实分析工具，把问题映射到连续空间，用概率或渐近分析来处理。但这些路径常常卡在某些分析困难上，难以收紧界限。几十年过去，人类数学家尝试了多种方向，却始终没能完全破解这个具体变体。

这类问题的本质是“创造性跳跃”：你需要发现两个看似无关概念之间的深层联系，或者找到一个古典工具的意外用法。纯靠人力试错，成本极高；纯靠蛮力搜索，空间又大到离谱。这正是 AI 参与后显得特别有价值的地方——它能快速生成大量候选思路，并从中筛选出人类可能忽略的路径。

GPT-5.4 Pro 到底做了什么？辅助，而非独立“证明”

根据公开记录，23 岁的 Liam Price（无高等数学专业训练）向 GPT-5.4 Pro 发出了一个提示，模型在约 80 分钟的思考时间内生成了解决方案，随后又花 30 分钟整理成 LaTeX 格式。结果被发布在 erdosproblems.com 上，目前形式化验证正在进行中。

关键在于角色分工：

AI 做了什么：它没有简单复制已有文献，而是提出了一种全新的证明策略。模型避开了人类惯用的“转向实分析”路线，而是留在整数的算术领域，巧妙地运用了 von Mangoldt 函数。这个古典工具通常与素数和 Riemann zeta 函数深度关联，它编码了一个基本恒等式：任意正整数 n 的除数上 von Mangoldt 权重的和等于 log n，这本质上反映了整数的唯一分解性质。

通过这个工具，模型化解了之前堵塞分析路径的困难，找到了一个更直接的算术论证。数学家 Terence Tao 在论坛评论中指出，这一工作揭示了整数结构与 Markov 过程理论之间此前未被充分描述的联系，甚至可能超出这个具体问题的意义。另一位研究者也评价称，模型使用的 Markov 链技巧是人类多年来忽略的创造性一步。

AI 没做什么：它不是独立完成整个科研闭环。人类用户定义了问题边界，提供了初始提示，模型输出后仍需数学家审查、形式化验证（如用 Lean 证明助手），并评估其更广泛含义。最终是否被完全接受为“新证明”，还需要社区进一步确认。

这不是“AI 独立解决数学难题”的神话，而是典型的人机协作：人类设定目标与验证标准，AI 负责高密度推理探索和压缩搜索空间。它像一个极度勤奋且没有认知偏见的助手，能在短时间内尝试人类可能几年都试不完的方向。

“这更接近一本‘Book Proof’（优雅的证明）。”——有数学家在阅读后如此评价。

与以往一些 AI 数学案例不同，这次的关键亮点在于方法的新颖性。许多早期“解决”其实是模型挖出了尘封文献中的已有结果，而这次 GPT-5.4 Pro 似乎真正贡献了原创性的连接。

AI 辅助数学研究，已走到哪个阶段？

把这次事件放回更大背景看，AI 在数学领域的角色正在悄然演变。

早期，AI 更多是“刷题工具”或文献搜索加速器。它能快速定位相关论文、生成反例，或在简单定理上提供形式化证明。最近一两年，随着模型推理能力的提升，它开始进入更复杂的组合问题、几何推理和分析领域。Erdős 问题社区已成为一个生动观测点：AI 工具已帮助标记了数十个问题的进展，有的找到文献解决，有的贡献部分结果，还有少数像 #1196 这样展现出潜在原创路径。

当前阶段可以用一个简化框架描述 AI 在数学研究流程中的位置：

1. 提出假设与发散思路：AI 擅长快速生成多个候选路径，包括人类因偏见或知识局限容易忽略的“冷门”角度。

2. 搜索与压缩空间：模型能并行探索大量可能性，筛选出可验证性较高的子方向，极大缩短试错周期。

3. 人工筛选与深化：人类数学家判断哪些思路值得深入，结合领域直觉进行调整。

4. 形式化验证：借助 Lean 等工具，将证明严格化，确保无懈可击。

5. 论文产出与意义提炼：最终由人类完成叙事、上下文关联和更广影响的讨论。

在这个流程里，AI 最突出的价值在于加速探索的前半段。它不怕“傻尝试”，也不受固有范式束缚，能发现意想不到的桥梁，比如这次 von Mangoldt 函数与问题核心的巧妙结合。

当然，边界依然清晰。AI 目前还难以独立处理极高抽象度的概念创新、长期研究规划，或在缺乏清晰反馈信号的领域坚持正确方向。人类在定义“什么问题值得解”、评估美感和潜在影响上，仍不可替代。短期内，AI 更可能是研究团队的“超级初级研究员”——速度快、精力无限，但需要有经验的导师指导方向。

以往案例也印证了这一点：有些 AI “解决”后来被发现是已有结果的重现，而真正有价值的进展，往往来自人机紧密配合下的意外发现。

普通人能借鉴什么？学会把 AI 当成“推理搭档”

你可能不是数学家，但这次事件的方法论，对每个需要处理复杂问题的人都有启发。

核心是“发散-收敛-验证”的工作流：

先让 AI 大量生成候选思路（发散），不要急着评判对错；
然后人工或结合模型按可验证性、潜在价值排序（收敛）；
最后自己或用工具严格校验关键步骤。

举个生活化例子。假设你在工作中要写一份复杂方案：

1. 提示模型：“针对这个问题，请给出至少 5 条完全不同的解决路径，每条包括核心假设、可能障碍和初步证据方向。”

2. 逐一审视，挑选 1-2 条最有潜力的。

3. 让模型深入展开选中的路径，你负责补充实际数据、风险评估和业务判断。

4. 最后人工润色并验证逻辑闭环。

这个思路同样适用于代码调试（让 AI 提出多种 bug 定位策略）、数据分析（生成不同建模假设）、调研报告（发散信息源与框架）甚至个人学习（拆解一个难懂的概念）。

一个简单可复用的提示模板（你可以直接尝试）：

“请针对 [具体问题]，先列出 5-7 个可能的解决或证明路径。每条路径描述核心想法、依赖的工具/概念、潜在优势和风险。最后按‘新颖性 + 可验证性’排序，并说明理由。”

用好这个模板的关键，不是追求 AI 一次性给出完美答案，而是把 AI 当成“高频思考伙伴”，你负责最终的判断与整合。未来，真正拉开差距的，不是谁会用 AI 问问题，而是谁会组织 AI 的推理过程，像指挥一支探索队一样，让机器的广度弥补人类的深度局限。

从数学难题到日常生产力

这次 GPT-5.4 Pro 在 Erdős #1196 上的表现，提醒我们：AI 的真正突破，往往不是取代人类，而是重新定义人机协作的边界。它让原本高不可攀的探索成本大幅降低，让更多人（包括业余爱好者）能参与到高质量推理中来。

对专业研究者而言，这意味着研究节奏可能加快；对工程师和知识工作者而言，这是一套可迁移的“AI 辅助复杂思考”方法；对普通人而言，它降低了大问题的门槛——你不需要成为专家，就能借助强大模型拆解难题。

想亲身试试这种“让模型先发散推理、再由人筛选验证”的工作流吗？可以去 api.884819.xyz 看看 API 接入方式，把大模型无缝接到你的笔记、代码、调研或知识库流程里。新用户注册即送体验token，国产模型完全免费，没有月租，按量付费，注册后直接可用。

下一篇，我们会拆一套普通人也能落地的“AI 研究工作流”：如何系统地让模型发散、收敛、事实校验，把 AI 从偶尔聊天的工具，真正变成每天提升生产力的推理搭档。敬请期待。 本文由8848AI原创，转载请注明出处。关注8848AI，带你从零开始学AI。

#AI新闻 #GPT-5.4 #Erdős问题 #人工智能 #数学AI #人机协作 #Prompt技巧 #AI生产力 #8848AI #AI研究