本文最后更新于 2026-05-13,文章内容可能已经过时。

fchollet 那句话我看了三遍:符号学习不是要干掉 Agent,而是要干掉"暴力喂数据"这件事本身

我第一次看到这条推文,脑子里出现了一个问号。

fchollet 说的大意是:符号学习(symbolic learning)将会取代梯度下降,但它不是代码 Agent 的替代品。 我当时的反应是——等等,这两句话放在一起是什么意思?符号学习取代梯度下降,那 Agent 呢?Agent 又是什么角色?

我猜很多人和我一样,看完之后觉得"好像懂了,又好像没懂"。

这篇文章就是我把这句话拆开、反复咀嚼之后的理解记录。不保证和 fchollet 本人的意思完全一致,但我会尽量把每一层逻辑说清楚——最后你会发现,这件事和你每天写 Prompt 的方式,有直接关系。

---

第一章:先把这句话翻译成人话

François Chollet,Keras 的创始人,也是 ARC-AGI 基准测试的设计者。他长期以来是 AI 领域里少数敢于持异见的人之一——在 LLM 一片叫好的时候,他一直在说"这条路走不到 AGI"。

他的核心立场可以用一句话概括:

当前的深度学习本质上是"插值机器",它擅长在已见过的数据之间做内插,但面对真正的新问题,它会崩。

这不是在说 LLM 没用。他是在说,LLM 的"学会了"和人类的"学会了",是两种根本不同的东西。

要理解他说的"符号学习 vs 梯度下降",先用一个类比建立直觉:

  • 梯度下降 = 一个孩子通过反复练习打篮球,靠肌肉记忆记住投篮动作。练了一万次,投篮姿势很稳定——但如果换一个陌生角度,可能就不行了。
  • 符号学习 = 这个孩子学会了物理学,知道抛物线的公式。不管站在哪个角度,他都能推算出应该用多大力、什么角度出手。

一个靠"记忆模式",一个靠"理解规则"。

fchollet 说的不是"符号学习要消灭 AI Agent"——他说的是,未来的 AI 不应该继续靠堆数据来"记",而应该有能力靠规则来"推"。而代码 Agent,恰恰是一种符号执行系统,他在为它背书,不是在批评它。

---

第二章:梯度下降到底有什么"原罪"?

梯度下降是深度学习的核心训练机制。简单说,就是模型通过不断调整参数,让预测结果和正确答案之间的误差越来越小。这个过程需要大量数据,需要反复迭代,最终模型"记住"了数据里的规律。

这套机制非常强大,强大到让我们产生了一种错觉:只要数据足够多、模型足够大,什么问题都能解决。

但梯度下降有三个根本性的局限:

1. 数据饥渴症

训练一个能力不错的 LLM,需要的数据量是天文数字级别的。人类学会一件事,可能只需要几个例子;模型学会同样的事,可能需要几百万个例子。这不只是效率问题,更是一个信号——这两种"学会",本质上不同。

2. 泛化能力的上限

ARC-AGI 基准测试是 fchollet 专门设计来测试"真正泛化能力"的。这个测试的特点是:每道题都是全新的规律,不会在训练数据里出现。人类做这类题,平均正确率在 85% 以上。而当前最强的 LLM,在这个测试上的表现远不及人类水平——这个差距,即便是 GPT-5 级别的模型也没有完全抹平。

3. 遇到新场景会"幻觉"

最直观的例子:为什么 GPT 做复杂数学题会算错,但计算器不会?

因为计算器执行的是符号规则2 + 3 = 5 是一条永远成立的逻辑规则,不需要"见过这道题"才能算对。而 LLM 做数学题,本质上是在"回忆"训练数据里见过的类似题型——如果这道题的结构稍微变形,它就可能给出一个听起来很有信心、但实际上错误的答案。

这就是 fchollet 说的"原罪":梯度下降学到的,是统计关联,不是逻辑规则。

---

第三章:符号学习是什么?它凭什么能替代梯度下降?

"符号系统"这个词听起来很学术,其实你每天都在用。

数学公式是符号系统,代码是符号系统,if-then 规则是符号系统,棋谱是符号系统。它们的共同特点是:可解释、可组合、可推导

你不需要见过 f(x) = x² 的所有取值,才能知道 f(3) = 9。你只需要理解这条规则,然后执行推导。

fchollet 的主张,用一张简化的架构图来理解:

传统深度学习:

[原始数据] → [神经网络] → [输出]

(全靠学习数据里的模式)

fchollet 理想中的混合架构:

[原始数据] → [神经网络(感知层)] → [结构化表示]

[符号系统(推理层)]

[输出]

神经网络负责"看懂世界"——把图像、语言、声音转化为结构化的表示。符号系统负责"想清楚"——基于这些结构化表示,进行逻辑推导、规则应用、约束求解。

这不是一个全新的想法。早在 AI 的早期,符号主义就是主流——专家系统、逻辑推理引擎,都是这条路线的产物。后来深度学习崛起,符号主义被边缘化了。fchollet 的判断是:这一轮 LLM 热潮之后,符号系统会以新的形态回归,和神经网络形成互补。

值得注意的是,他说的"符号学习取代梯度下降",不是说梯度下降会消失,而是说主导地位会转移——从"靠数据暴力拟合"转向"靠规则显式推理"。

---

第四章:这和"代码 Agent"有什么关系?对我写 Prompt 有什么影响?

这里有一个很容易误读的地方,需要专门澄清。

fchollet 说"符号学习不是代码 Agent 的替代品",很多人以为这是在贬低代码 Agent。其实恰恰相反——代码 Agent 本身就是一个符号执行系统

当一个 AI Agent 写出一段 Python 代码并执行它,它实际上是在把自然语言问题转化为符号系统(代码),然后让符号系统去处理那些神经网络不擅长的部分(精确计算、逻辑判断、数据操作)。

这就是为什么代码 Agent 在数学和逻辑任务上,表现比纯文本 LLM 稳定得多。它不是靠"回忆"来算 2^100 是多少,而是写一行 print(2**100) 让计算机去算。

这个洞察,直接影响你写 Prompt 的方式。

如果你理解了"神经网络负责感知、符号系统负责推理"这个框架,你就会明白:在 Prompt 里引入符号化结构,相当于在帮模型做"感知→推理"的切换,让它少靠"回忆",多靠"规则"。

来看两组对比示例:

---

示例一:分析任务

❌ 模糊版 Prompt
帮我分析一下这份销售数据,给出结论。

问题:模型不知道"分析"的边界在哪里,只能凭训练数据里的印象来猜你想要什么,输出往往泛泛而谈。

✅ 符号化结构版 Prompt
请按照以下步骤分析这份销售数据:

1. 首先识别数据中的时间范围和主要维度(产品、地区、渠道)

2. 计算每个维度的总销售额和环比增长率

3. 找出增长率最高和最低的各 3 个子类目

4. 基于以上数据,给出不超过 3 条可操作的建议

约束条件:

  • 所有数字保留两位小数
  • 结论部分不超过 200 字
  • 如果数据不足以支持某项计算,明确说明"数据不足",不要推测

改进点:显式步骤 = 程序逻辑;约束条件 = 规则边界;"不要推测"= 防止幻觉的符号化限制。

---

示例二:推理任务

❌ 模糊版 Prompt
小明比小红大 3 岁,小红比小李小 2 岁,小李今年 20 岁,小明多大?

这道题对人来说很简单,但对 LLM 来说,如果不引导推理步骤,有时候会直接给出错误答案。

✅ 符号化结构版 Prompt
请用以下格式逐步推理,每一步都写出完整的推导过程:

已知条件:

  • 小明比小红大 3 岁
  • 小红比小李小 2 岁
  • 小李今年 20 岁

推理步骤:

Step 1: 由"小李今年 20 岁"得出 → 小李的年龄 = ?

Step 2: 由"小红比小李小 2 岁"得出 → 小红的年龄 = ?

Step 3: 由"小明比小红大 3 岁"得出 → 小明的年龄 = ?

最终答案:小明今年 X 岁。

改进点:把自然语言问题转化为显式的步骤链——这正是符号推理的本质。模型被迫走"规则推导"的路径,而不是靠"印象"直接跳答案。

---

💡 想直接测试符号化 Prompt 的效果?

>

文中的对比示例都可以在 [api.884819.xyz](https://api.884819.xyz) 上直接跑——支持多模型切换,你可以用同一组 Prompt 对比 GPT-5.2、Claude Opus 4.6、Gemini 3.1 Pro 的表现差异,亲眼看谁在"符号化指令"下表现更稳定。新用户注册即送体验 token,国产模型(Deepseek/千问等)完全免费,没有月租。

---

第五章:这场争论对普通开发者的实际意义

学界的争论可能还要持续很多年,但有几个结论,现在就可以带走:

结论一:LLM 的"会"和人类的"会"不一样

这不是在贬低 LLM,而是在帮你校准预期。当模型在某类任务上反复出错,不要只想着"换个更大的模型"——先想想这个任务是否本质上需要符号推理,然后考虑在 Prompt 里显式引入规则结构。

结论二:符号化 Prompt 是现在就能用的技术

不需要等待"神经网络 + 符号系统混合架构"的模型真正落地,你现在就可以通过 Prompt 设计来模拟这个效果:显式步骤 = 程序逻辑,约束条件 = 规则边界,格式要求 = 符号化输出。

结论三:代码 Agent 是这个方向的最佳实践

如果你在构建 AI 应用,遇到需要精确计算、逻辑判断、数据操作的场景,优先考虑让模型生成代码来执行,而不是让它直接"回答"。这是目前最成熟的"神经网络 + 符号系统"组合方式。

用一句话总结 fchollet 这句话的核心:

不是要干掉 Agent,而是要干掉"靠堆数据蒙答案"这件事——而你写 Prompt 的方式,就是你现在能控制的那个变量。

这个方向正在影响下一代 AI 工具的设计方式。提前理解,至少意味着你在用这些工具的时候,不只是在"试",而是在"懂"。

---

fchollet 的这个判断,其实已经在悄悄影响一批新工具的设计逻辑——

有人开始把"程序合成"重新捡回来,有人在 Agent 框架里嵌入显式的逻辑规划层,有人在研究让模型自己生成"推理规则"而不只是生成"推理结果"……

下一篇,我们聊聊:当 AI 开始"写规则"而不是"学规则",Prompt 工程师的角色会变成什么?

这个问题的答案,可能比你想象的更让人不安——也更让人兴奋。

---

本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。

#AI思考 #Prompt技巧 #符号学习 #深度学习 #AGI #fchollet #8848AI #AI开发