当大家狂热追捧代码 Agent 时，Chollet 扔下一颗冷静的炸弹

本文最后更新于 2026-05-13，文章内容可能已经过时。

当大家狂热追捧代码 Agent 时，Chollet 扔下一颗冷静的炸弹

当下，Cursor、Claude Code、Devin 等代码 Agent 工具正让开发者生产力暴增，仿佛 AI 已经彻底接管了编程。但就在这个节点，Keras 作者、ARC-AGI 提出者 François Chollet 在 X 上发出一条精准的提醒。 [[1]](https://x.com/i/status/2054222707055902943)

他的原话是：

“Symbolic learning is not a replacement for coding agents, it's a replacement for gradient descent & NNs: a low-level, completely general, extremely scalable new learning substrate.”

这句话像一盆冷水，浇醒了 Agent 热潮中的狂热。它不是在讨论“怎么让 LLM 更好地写代码”，而是直接指向底层训练机制的范式升级。这为普通开发者提供了一个清晰的认知框架：在追逐短期生产力工具的同时，别把眼睛从长期技术路线移开。

热点一句话，到底在说什么？

Chollet 的这条帖迅速引发讨论。很多人第一反应是“符号学习又回来了？”但他强调的不是传统符号 AI 的复辟，而是对“梯度下降 + 神经网络”这个当前主流学习引擎的替代。

用大白话翻译成三个核心点，普通开发者也能立刻听懂：

1. 符号学习不是“高级 Agent 框架”，而是替换“梯度下降”这个参数拟合引擎的底层新引擎。它不是让你用 LLM 多写点代码，而是改变 AI 从数据中“学习”的根本方式。

2. 它追求“极简符号程序”来无损逆向工程数据背后的生成规则。不像神经网络那样拟合一条“模糊的参数曲线”，符号学习试图找到真正简洁、可读的程序规则。

3. 对“规则简单、本质是程序”的问题，它将比当前 NN + 梯度下降高效几个数量级，同时具备更好的可解释性和可组合性。

Chollet 在 Ndea（他的新研究实验室）正在开发的“Symbolic Descent”（符号下降），正是这个思路的具体实践。它类似于梯度下降在符号空间的等价物：不是在连续参数空间里优化，而是搜索并优化极简的符号程序。 [[2]](https://osmu.app/blog/beyond-deep-learning-francois-chollets-vision-for-agi-and-symbolic-ai)

想象一下：传统深度学习像用无数参数拼凑出一张模糊的照片，而符号学习像直接找到绘制这张照片的简洁代码。哪个更接近“理解”？

当前范式的天花板与痛点

深度学习的核心机制高度一致：一切都是“参数化曲线 + 梯度下降拟合”。模型通过海量数据调整数十亿参数，学会在输入和输出间插值。这种方式在数据充足、分布相似的场景下极其强大，但也暴露出清晰的局限。

数据饥饿与少样本泛化差是最突出的问题。以 Chollet 推动的 ARC-AGI 基准为例，它专门测试 AI 在全新、抽象规则下的少样本泛化能力。人类（尤其是经过少量练习的普通人）能达到很高水平，而当前前沿模型在 ARC-AGI-3 等最新版本上仍面临巨大差距，许多基础测试中 SOTA 模型得分徘徊在低位，远低于人类表现。 [[3]](https://arcprize.org/leaderboard) [[4]](https://www.youtube.com/watch?v=cw2IDXKAFSY)

神经网络的表征是“纠缠”的——知识分散在参数中，难以解释、难以修改、难以组合。模型擅长模式匹配，却很难真正“发现程序”。这导致在需要严谨推理、科学发现或核心算法创新的场景中，它更像一个超级聪明的“模仿者”，而非“发明家”。

历史提供有趣的对比。早期符号 AI 曾因“手工编写规则太难”而失败。如今，符号学习通过自动化程序搜索，试图保留符号系统的可解释性和组合性，同时注入真正的学习能力。这不是简单回归，而是站在深度学习肩膀上的进化。

“我们不是在修补曲线，而是在发明新的学习基底。”——这正是 Chollet 团队在 Ndea 探索的方向。

符号学习 vs 代码 Agent：不是替代，而是互补

很多人误解了 Chollet 的意思，以为他在贬低代码 Agent。恰恰相反，他是在划清界限。

代码 Agent（Cursor、Claude Code、Devin 类）是应用层工具。它们让 LLM 帮开发者写代码、改代码、调试代码，极大提升了日常软件工程的生产力。但底层训练机制依然是梯度下降 + 神经网络。它们是“生产力放大器”，而非范式变革者。 符号学习则是基础设施层创新。它改变模型如何从数据中“学”出规则本身，更像发明一种新的编程语言或编译器。Agent 适合日常流水线任务：搭前后端、写 CRUD、优化已有代码；符号学习更适合科学发现、程序合成、需要强泛化的核心算法场景，比如自动发现物理定律、优化复杂算法或处理规则清晰但数据稀疏的问题。

两者未来高度互补。想象一下：代码 Agent 作为上层接口，而底层推理引擎切换为符号模型——效率和可解释性双双提升。Chollet 的观点正是：别把 Agent 当信仰，它是今天的好工具；符号学习指向的是明天的基础设施。

参数曲线拟合 vs 符号程序树（概念示意）：

左边：海量参数调整出一条平滑但黑箱的曲线。
右边：搜索出一棵极简的程序树，每一个节点都是明确规则，可直接阅读、修改和复用。

这种差异在实际落地中会越来越明显。

对普通开发者的实际意义 + 未来展望

作为中国 AI 开发者，你现在该怎么做？

短期继续拥抱 Agent。用好 GPT 系列、Claude、Gemini 等模型驱动的工具，快速提升编码效率。无论是原型验证还是迭代产品，Agent 都能让你事半功倍。注册 8848AI 平台就能体验这些前沿能力，国产模型如 Deepseek、Qwen3 也完全免费，按量付费无压力。 同时把目光放长远。关注符号学习、程序合成、神经符号混合（Neuro-Symbolic）等新方向。学习 DSL（领域特定语言）设计、程序合成基础知识，甚至尝试小型的符号回归实验。你不需要立刻成为研究员，但保持对底层机制的敏感度，能帮你在下一次浪潮中占据先机。

潜在影响令人期待：更小的模型（极简符号程序远比亿级参数高效）、更低的算力需求、更好的可解释性（审计规则而非参数）、更强的发明能力（真正发现新程序而非插值）。

当然，挑战也不少。符号搜索空间可能爆炸，可扩展性仍在早期，处理真实世界噪声和模糊输入还需要更多创新。历史告诉我们，没有哪种范式能一统江湖，最终可能是混合系统：神经网络处理感知，符号系统负责高层规则和推理。

代码示例对比（简化示意）：

# 传统梯度下降 + NN（伪代码）
import torch
model = nn.Sequential(...)  # 大量参数
optimizer = torch.optim.Adam(model.parameters())
for data in dataloader:
loss = criterion(model(data), target)
optimizer.zero_grad()
loss.backward()  # 梯度下降更新参数
optimizer.step()

# 符号程序搜索简化示意（使用 sympy 或 DSL）
import sympy as sp

x = sp.symbols('x')
假设我们搜索拟合数据的符号表达式
candidates = [x2 + sp.sin(x), 2*x + 3, x3 - x, ...]  # 程序空间搜索
best = min(candidates, key=lambda expr: compute_error(expr, data))
结果是一个明确、可解释的公式，而非黑箱参数
print(best)

左边依赖海量计算优化参数，右边追求发现简洁规则。实际符号系统会更复杂，但核心差异一目了然。

这不是让你放弃现在好用的工具，而是让你站得更高，看得更远。在 Agent 提升效率的同时，理解下一代学习基底的变化，你的作品和职业路径都会更有韧性。

想亲手试试 Agent 开发、符号程序合成实验，或接入前沿 AI 能力？欢迎访问 [api.884819.xyz](https://api.884819.xyz)，这里有开箱即用的接口和示例项目，帮助你快速把今天讨论的想法落地成代码。无论你是想加速现有 workflow，还是探索下一代范式，都能找到适合的工具。新用户注册即送体验token。

符号学习是底层引擎的升级，而代码 Agent 只是今天的生产力工具。下一篇文章，我们将手把手带你用实际代码搭建一个小型“符号 + Agent”混合系统，看看两者结合后能爆发出怎样的效率——敬请期待，别错过。

本文由8848AI原创，转载请注明出处。关注8848AI，带你从零开始学AI。

#AI范式 #符号学习 #FrançoisChollet #ARC-AGI #代码Agent #梯度下降 #神经符号AI #8848AI #程序合成 #AGI之路