当大家狂热追捧代码 Agent 时,Chollet 扔下一颗冷静的炸弹
本文最后更新于 2026-05-13,文章内容可能已经过时。
当下,Cursor、Claude Code、Devin 等代码 Agent 工具正让开发者生产力暴增,仿佛 AI 已经彻底接管了编程。但就在这个节点,Keras 作者、ARC-AGI 提出者 François Chollet 在 X 上发出一条精准的提醒。 [[1]](https://x.com/i/status/2054222707055902943)
他的原话是:
“Symbolic learning is not a replacement for coding agents, it's a replacement for gradient descent & NNs: a low-level, completely general, extremely scalable new learning substrate.”
这句话像一盆冷水,浇醒了 Agent 热潮中的狂热。它不是在讨论“怎么让 LLM 更好地写代码”,而是直接指向底层训练机制的范式升级。这为普通开发者提供了一个清晰的认知框架:在追逐短期生产力工具的同时,别把眼睛从长期技术路线移开。
热点一句话,到底在说什么?
Chollet 的这条帖迅速引发讨论。很多人第一反应是“符号学习又回来了?”但他强调的不是传统符号 AI 的复辟,而是对“梯度下降 + 神经网络”这个当前主流学习引擎的替代。
用大白话翻译成三个核心点,普通开发者也能立刻听懂:
1. 符号学习不是“高级 Agent 框架”,而是替换“梯度下降”这个参数拟合引擎的底层新引擎。它不是让你用 LLM 多写点代码,而是改变 AI 从数据中“学习”的根本方式。
2. 它追求“极简符号程序”来无损逆向工程数据背后的生成规则。不像神经网络那样拟合一条“模糊的参数曲线”,符号学习试图找到真正简洁、可读的程序规则。
3. 对“规则简单、本质是程序”的问题,它将比当前 NN + 梯度下降 高效几个数量级,同时具备更好的可解释性和可组合性。
Chollet 在 Ndea(他的新研究实验室)正在开发的“Symbolic Descent”(符号下降),正是这个思路的具体实践。它类似于梯度下降在符号空间的等价物:不是在连续参数空间里优化,而是搜索并优化极简的符号程序。 [[2]](https://osmu.app/blog/beyond-deep-learning-francois-chollets-vision-for-agi-and-symbolic-ai)
想象一下:传统深度学习像用无数参数拼凑出一张模糊的照片,而符号学习像直接找到绘制这张照片的简洁代码。哪个更接近“理解”?
当前范式的天花板与痛点
深度学习的核心机制高度一致:一切都是“参数化曲线 + 梯度下降拟合”。模型通过海量数据调整数十亿参数,学会在输入和输出间插值。这种方式在数据充足、分布相似的场景下极其强大,但也暴露出清晰的局限。
数据饥饿与少样本泛化差是最突出的问题。以 Chollet 推动的 ARC-AGI 基准为例,它专门测试 AI 在全新、抽象规则下的少样本泛化能力。人类(尤其是经过少量练习的普通人)能达到很高水平,而当前前沿模型在 ARC-AGI-3 等最新版本上仍面临巨大差距,许多基础测试中 SOTA 模型得分徘徊在低位,远低于人类表现。 [[3]](https://arcprize.org/leaderboard) [[4]](https://www.youtube.com/watch?v=cw2IDXKAFSY)神经网络的表征是“纠缠”的——知识分散在参数中,难以解释、难以修改、难以组合。模型擅长模式匹配,却很难真正“发现程序”。这导致在需要严谨推理、科学发现或核心算法创新的场景中,它更像一个超级聪明的“模仿者”,而非“发明家”。
历史提供有趣的对比。早期符号 AI 曾因“手工编写规则太难”而失败。如今,符号学习通过自动化程序搜索,试图保留符号系统的可解释性和组合性,同时注入真正的学习能力。这不是简单回归,而是站在深度学习肩膀上的进化。
“我们不是在修补曲线,而是在发明新的学习基底。”——这正是 Chollet 团队在 Ndea 探索的方向。
符号学习 vs 代码 Agent:不是替代,而是互补
很多人误解了 Chollet 的意思,以为他在贬低代码 Agent。恰恰相反,他是在划清界限。
代码 Agent(Cursor、Claude Code、Devin 类)是应用层工具。它们让 LLM 帮开发者写代码、改代码、调试代码,极大提升了日常软件工程的生产力。但底层训练机制依然是梯度下降 + 神经网络。它们是“生产力放大器”,而非范式变革者。 符号学习则是基础设施层创新。它改变模型如何从数据中“学”出规则本身,更像发明一种新的编程语言或编译器。Agent 适合日常流水线任务:搭前后端、写 CRUD、优化已有代码;符号学习更适合科学发现、程序合成、需要强泛化的核心算法场景,比如自动发现物理定律、优化复杂算法或处理规则清晰但数据稀疏的问题。两者未来高度互补。想象一下:代码 Agent 作为上层接口,而底层推理引擎切换为符号模型——效率和可解释性双双提升。Chollet 的观点正是:别把 Agent 当信仰,它是今天的好工具;符号学习指向的是明天的基础设施。
参数曲线拟合 vs 符号程序树(概念示意):- 左边:海量参数调整出一条平滑但黑箱的曲线。
- 右边:搜索出一棵极简的程序树,每一个节点都是明确规则,可直接阅读、修改和复用。
这种差异在实际落地中会越来越明显。
对普通开发者的实际意义 + 未来展望
作为中国 AI 开发者,你现在该怎么做?
短期继续拥抱 Agent。用好 GPT 系列、Claude、Gemini 等模型驱动的工具,快速提升编码效率。无论是原型验证还是迭代产品,Agent 都能让你事半功倍。注册 8848AI 平台就能体验这些前沿能力,国产模型如 Deepseek、Qwen3 也完全免费,按量付费无压力。 同时把目光放长远。关注符号学习、程序合成、神经符号混合(Neuro-Symbolic)等新方向。学习 DSL(领域特定语言)设计、程序合成基础知识,甚至尝试小型的符号回归实验。你不需要立刻成为研究员,但保持对底层机制的敏感度,能帮你在下一次浪潮中占据先机。潜在影响令人期待:更小的模型(极简符号程序远比亿级参数高效)、更低的算力需求、更好的可解释性(审计规则而非参数)、更强的发明能力(真正发现新程序而非插值)。
当然,挑战也不少。符号搜索空间可能爆炸,可扩展性仍在早期,处理真实世界噪声和模糊输入还需要更多创新。历史告诉我们,没有哪种范式能一统江湖,最终可能是混合系统:神经网络处理感知,符号系统负责高层规则和推理。
代码示例对比(简化示意):# 传统梯度下降 + NN(伪代码)
import torch
model = nn.Sequential(...) # 大量参数
optimizer = torch.optim.Adam(model.parameters())
for data in dataloader:
loss = criterion(model(data), target)
optimizer.zero_grad()
loss.backward() # 梯度下降更新参数
optimizer.step()
# 符号程序搜索简化示意(使用 sympy 或 DSL)
import sympy as sp
x = sp.symbols('x')
假设我们搜索拟合数据的符号表达式
candidates = [x2 + sp.sin(x), 2*x + 3, x3 - x, ...] # 程序空间搜索
best = min(candidates, key=lambda expr: compute_error(expr, data))
结果是一个明确、可解释的公式,而非黑箱参数
print(best)
左边依赖海量计算优化参数,右边追求发现简洁规则。实际符号系统会更复杂,但核心差异一目了然。
这不是让你放弃现在好用的工具,而是让你站得更高,看得更远。在 Agent 提升效率的同时,理解下一代学习基底的变化,你的作品和职业路径都会更有韧性。
想亲手试试 Agent 开发、符号程序合成实验,或接入前沿 AI 能力?欢迎访问 [api.884819.xyz](https://api.884819.xyz),这里有开箱即用的接口和示例项目,帮助你快速把今天讨论的想法落地成代码。无论你是想加速现有 workflow,还是探索下一代范式,都能找到适合的工具。新用户注册即送体验token。
符号学习是底层引擎的升级,而代码 Agent 只是今天的生产力工具。下一篇文章,我们将手把手带你用实际代码搭建一个小型“符号 + Agent”混合系统,看看两者结合后能爆发出怎样的效率——敬请期待,别错过。
本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。#AI范式 #符号学习 #FrançoisChollet #ARC-AGI #代码Agent #梯度下降 #神经符号AI #8848AI #程序合成 #AGI之路