本文最后更新于 2026-05-13，文章内容可能已经过时。

fchollet 那句话我看了三遍：符号学习不是要干掉 Agent，而是要干掉"暴力喂数据"这件事本身

我第一次看到这条推文，脑子里出现了一个问号。

fchollet 说的大意是：符号学习（symbolic learning）将会取代梯度下降，但它不是代码 Agent 的替代品。 我当时的反应是——等等，这两句话放在一起是什么意思？符号学习取代梯度下降，那 Agent 呢？Agent 又是什么角色？

我猜很多人和我一样，看完之后觉得"好像懂了，又好像没懂"。

这篇文章就是我把这句话拆开、反复咀嚼之后的理解记录。不保证和 fchollet 本人的意思完全一致，但我会尽量把每一层逻辑说清楚——最后你会发现，这件事和你每天写 Prompt 的方式，有直接关系。

---

第一章：先把这句话翻译成人话

François Chollet，Keras 的创始人，也是 ARC-AGI 基准测试的设计者。他长期以来是 AI 领域里少数敢于持异见的人之一——在 LLM 一片叫好的时候，他一直在说"这条路走不到 AGI"。

他的核心立场可以用一句话概括：

当前的深度学习本质上是"插值机器"，它擅长在已见过的数据之间做内插，但面对真正的新问题，它会崩。

这不是在说 LLM 没用。他是在说，LLM 的"学会了"和人类的"学会了"，是两种根本不同的东西。

要理解他说的"符号学习 vs 梯度下降"，先用一个类比建立直觉：

梯度下降 = 一个孩子通过反复练习打篮球，靠肌肉记忆记住投篮动作。练了一万次，投篮姿势很稳定——但如果换一个陌生角度，可能就不行了。
符号学习 = 这个孩子学会了物理学，知道抛物线的公式。不管站在哪个角度，他都能推算出应该用多大力、什么角度出手。

一个靠"记忆模式"，一个靠"理解规则"。

fchollet 说的不是"符号学习要消灭 AI Agent"——他说的是，未来的 AI 不应该继续靠堆数据来"记"，而应该有能力靠规则来"推"。而代码 Agent，恰恰是一种符号执行系统，他在为它背书，不是在批评它。

---

第二章：梯度下降到底有什么"原罪"？

梯度下降是深度学习的核心训练机制。简单说，就是模型通过不断调整参数，让预测结果和正确答案之间的误差越来越小。这个过程需要大量数据，需要反复迭代，最终模型"记住"了数据里的规律。

这套机制非常强大，强大到让我们产生了一种错觉：只要数据足够多、模型足够大，什么问题都能解决。

但梯度下降有三个根本性的局限：

1. 数据饥渴症

训练一个能力不错的 LLM，需要的数据量是天文数字级别的。人类学会一件事，可能只需要几个例子；模型学会同样的事，可能需要几百万个例子。这不只是效率问题，更是一个信号——这两种"学会"，本质上不同。

2. 泛化能力的上限

ARC-AGI 基准测试是 fchollet 专门设计来测试"真正泛化能力"的。这个测试的特点是：每道题都是全新的规律，不会在训练数据里出现。人类做这类题，平均正确率在 85% 以上。而当前最强的 LLM，在这个测试上的表现远不及人类水平——这个差距，即便是 GPT-5 级别的模型也没有完全抹平。

3. 遇到新场景会"幻觉"

最直观的例子：为什么 GPT 做复杂数学题会算错，但计算器不会？

因为计算器执行的是符号规则：2 + 3 = 5 是一条永远成立的逻辑规则，不需要"见过这道题"才能算对。而 LLM 做数学题，本质上是在"回忆"训练数据里见过的类似题型——如果这道题的结构稍微变形，它就可能给出一个听起来很有信心、但实际上错误的答案。

这就是 fchollet 说的"原罪"：梯度下降学到的，是统计关联，不是逻辑规则。

---

第三章：符号学习是什么？它凭什么能替代梯度下降？

"符号系统"这个词听起来很学术，其实你每天都在用。

数学公式是符号系统，代码是符号系统，if-then 规则是符号系统，棋谱是符号系统。它们的共同特点是：可解释、可组合、可推导。

你不需要见过 f(x) = x² 的所有取值，才能知道 f(3) = 9。你只需要理解这条规则，然后执行推导。

fchollet 的主张，用一张简化的架构图来理解：

传统深度学习：
[原始数据] → [神经网络] → [输出]
（全靠学习数据里的模式）

fchollet 理想中的混合架构：
[原始数据] → [神经网络（感知层）] → [结构化表示]
↓
[符号系统（推理层）]
↓
[输出]

神经网络负责"看懂世界"——把图像、语言、声音转化为结构化的表示。符号系统负责"想清楚"——基于这些结构化表示，进行逻辑推导、规则应用、约束求解。

这不是一个全新的想法。早在 AI 的早期，符号主义就是主流——专家系统、逻辑推理引擎，都是这条路线的产物。后来深度学习崛起，符号主义被边缘化了。fchollet 的判断是：这一轮 LLM 热潮之后，符号系统会以新的形态回归，和神经网络形成互补。

值得注意的是，他说的"符号学习取代梯度下降"，不是说梯度下降会消失，而是说主导地位会转移——从"靠数据暴力拟合"转向"靠规则显式推理"。

---

第四章：这和"代码 Agent"有什么关系？对我写 Prompt 有什么影响？

这里有一个很容易误读的地方，需要专门澄清。

fchollet 说"符号学习不是代码 Agent 的替代品"，很多人以为这是在贬低代码 Agent。其实恰恰相反——代码 Agent 本身就是一个符号执行系统。

当一个 AI Agent 写出一段 Python 代码并执行它，它实际上是在把自然语言问题转化为符号系统（代码），然后让符号系统去处理那些神经网络不擅长的部分（精确计算、逻辑判断、数据操作）。

这就是为什么代码 Agent 在数学和逻辑任务上，表现比纯文本 LLM 稳定得多。它不是靠"回忆"来算 2^100 是多少，而是写一行 print(2**100) 让计算机去算。

这个洞察，直接影响你写 Prompt 的方式。

如果你理解了"神经网络负责感知、符号系统负责推理"这个框架，你就会明白：在 Prompt 里引入符号化结构，相当于在帮模型做"感知→推理"的切换，让它少靠"回忆"，多靠"规则"。

来看两组对比示例：

---

示例一：分析任务

❌ 模糊版 Prompt

帮我分析一下这份销售数据，给出结论。

问题：模型不知道"分析"的边界在哪里，只能凭训练数据里的印象来猜你想要什么，输出往往泛泛而谈。

✅ 符号化结构版 Prompt

请按照以下步骤分析这份销售数据：

1. 首先识别数据中的时间范围和主要维度（产品、地区、渠道）
2. 计算每个维度的总销售额和环比增长率
3. 找出增长率最高和最低的各 3 个子类目
4. 基于以上数据，给出不超过 3 条可操作的建议

约束条件：
所有数字保留两位小数
结论部分不超过 200 字
如果数据不足以支持某项计算，明确说明"数据不足"，不要推测

改进点：显式步骤 = 程序逻辑；约束条件 = 规则边界；"不要推测"= 防止幻觉的符号化限制。

---

示例二：推理任务

❌ 模糊版 Prompt

小明比小红大 3 岁，小红比小李小 2 岁，小李今年 20 岁，小明多大？

这道题对人来说很简单，但对 LLM 来说，如果不引导推理步骤，有时候会直接给出错误答案。

✅ 符号化结构版 Prompt

请用以下格式逐步推理，每一步都写出完整的推导过程：

已知条件：
小明比小红大 3 岁
小红比小李小 2 岁
小李今年 20 岁

推理步骤：
Step 1: 由"小李今年 20 岁"得出 → 小李的年龄 = ?
Step 2: 由"小红比小李小 2 岁"得出 → 小红的年龄 = ?
Step 3: 由"小明比小红大 3 岁"得出 → 小明的年龄 = ?

最终答案：小明今年 X 岁。

改进点：把自然语言问题转化为显式的步骤链——这正是符号推理的本质。模型被迫走"规则推导"的路径，而不是靠"印象"直接跳答案。

---

💡 想直接测试符号化 Prompt 的效果？

文中的对比示例都可以在 [api.884819.xyz](https://api.884819.xyz) 上直接跑——支持多模型切换，你可以用同一组 Prompt 对比 GPT-5.2、Claude Opus 4.6、Gemini 3.1 Pro 的表现差异，亲眼看谁在"符号化指令"下表现更稳定。新用户注册即送体验 token，国产模型（Deepseek/千问等）完全免费，没有月租。

---

第五章：这场争论对普通开发者的实际意义

学界的争论可能还要持续很多年，但有几个结论，现在就可以带走：

结论一：LLM 的"会"和人类的"会"不一样

这不是在贬低 LLM，而是在帮你校准预期。当模型在某类任务上反复出错，不要只想着"换个更大的模型"——先想想这个任务是否本质上需要符号推理，然后考虑在 Prompt 里显式引入规则结构。

结论二：符号化 Prompt 是现在就能用的技术

不需要等待"神经网络 + 符号系统混合架构"的模型真正落地，你现在就可以通过 Prompt 设计来模拟这个效果：显式步骤 = 程序逻辑，约束条件 = 规则边界，格式要求 = 符号化输出。

结论三：代码 Agent 是这个方向的最佳实践

如果你在构建 AI 应用，遇到需要精确计算、逻辑判断、数据操作的场景，优先考虑让模型生成代码来执行，而不是让它直接"回答"。这是目前最成熟的"神经网络 + 符号系统"组合方式。

用一句话总结 fchollet 这句话的核心：

不是要干掉 Agent，而是要干掉"靠堆数据蒙答案"这件事——而你写 Prompt 的方式，就是你现在能控制的那个变量。

这个方向正在影响下一代 AI 工具的设计方式。提前理解，至少意味着你在用这些工具的时候，不只是在"试"，而是在"懂"。

---

fchollet 的这个判断，其实已经在悄悄影响一批新工具的设计逻辑——

有人开始把"程序合成"重新捡回来，有人在 Agent 框架里嵌入显式的逻辑规划层，有人在研究让模型自己生成"推理规则"而不只是生成"推理结果"……

下一篇，我们聊聊：当 AI 开始"写规则"而不是"学规则"，Prompt 工程师的角色会变成什么？

这个问题的答案，可能比你想象的更让人不安——也更让人兴奋。

---

本文由8848AI原创，转载请注明出处。关注8848AI，带你从零开始学AI。

#AI思考 #Prompt技巧 #符号学习 #深度学习 #AGI #fchollet #8848AI #AI开发