本文最后更新于 2026-04-13，文章内容可能已经过时。

拆解 OpenAI「学习模式」实战心法：一个数学陪练 Agent，为什么要同时扮演教师、同伴和守门员

我最开始做这个数学 Agent 时，AI 表现得像个满分学霸：会做，但不会教。

孩子把题一发过去，它 3 秒钟就把答案、过程、标准结论一次性端上来。看起来很强，实际上很差——因为孩子真正学到的，往往只有一句：“哦，原来答案是这个。”

这也是很多家长、老师、教育产品开发者会踩的坑：你以为自己做的是“数学辅导助手”，最后做出来的却是一个高级答案生成器。问题通常不在模型不够强，而在于你给它的角色，压根就不是“陪练老师”，而是“解题机器”。

这篇文章不再重复讲 OpenAI「学习模式」的新闻背景，而是直接进入第二层：它真正值钱的，不是几句魔法 Prompt，而是一套行为框架。

如果你想把它落到“给孩子做数学陪练 Agent”这个场景，最关键的不是多写几条夸张指令，而是把三个角色写对：

教师
同伴
守门员

这 3 个角色，不是为了好玩，而是分别解决 3 类最常见的失效问题。

---

先别急着抄提示词，为什么很多“数学 Agent”一上线就失效

很多人一上来会这样写系统提示词：

你是一名数学老师，请帮助学生解答数学题，要求清晰、准确、详细。

这句看起来没问题，但它几乎注定会导向一个结果：AI 默认把“帮助”理解成“高效地把题解出来”。

于是，用户一发题，AI 就会进入标准解析模式。

失败示例：普通数学助手

用户：小明买了 3 支笔，每支 4 元，又买了一个本子 5 元，一共多少钱？

AI：3×4=12，12+5=17，所以一共 17 元。解析如下：先计算钢笔总价，再加上本子的价格……

对成年人来说，这当然没毛病。

但对一个二三年级孩子，这种回答的问题是：

参与感为零
没有确认孩子卡在哪一步
没有训练“自己迈出下一步”的能力
最终非常容易变成“抄答案”

现在换成学习模式思路。

对照示例：学习模式数学陪练 Agent

用户：小明买了 3 支笔，每支 4 元，又买了一个本子 5 元，一共多少钱？

Agent：我们先不急着算总数。你觉得这道题里，哪一部分是可以先算出来的？是 3 支笔的钱，还是笔和本子一起的钱？

你会发现，区别不在于“会不会做”，而在于它先把孩子拉回到思考位置上。

学习场景里，最怕的不是 AI 不会答，而是它答得太快、太完整。

---

OpenAI「学习模式」真正值得拆的，是它的行为框架

如果你去看公开流传的学习模式相关提示词片段，会发现它反复强调的不是“讲得更全”，而是下面这几类约束：

这些约束组合起来，形成的是一种很清晰的行为逻辑：

1. 先判断学生在哪

2. 只推进一步

3. 给台阶，不给终点

4. 如果学生想跳步，温和拉回

这也是为什么很多人把“学习模式”误解成“更像老师的语气”，其实不够准确。

它更像是：把模型从“结果导向”切到“过程导向”。

而一旦你要落地到数学陪练场景，就必须把这种行为框架具体化。我的做法是：拆成三个角色。

---

为什么一定要设计成 3 个角色：教师、同伴、守门员

1. 教师：负责搭脚手架

教师角色解决的，是AI 一次讲太多的问题。

很多模型天然倾向于“完整、清楚、周到”，这在知识问答里是优点，在辅导孩子时反而是副作用。真正有效的教师，不是把整道题讲完，而是把题拆成孩子当前能接住的下一步。

比如“列方程解应用题”，教师角色要做的是：

判断考点是什么
判断孩子是卡在审题、设未知数，还是列式
一次只给一个最小推进动作

不是：

一口气写完整方程
顺便补上标准答案
最后再问一句“懂了吗”

2. 同伴：负责降低压迫感

教育类 Agent 经常会有一个隐性问题：太像老师了，所以孩子不想继续聊。

尤其在中国家庭场景里，孩子对“被检查、被纠正”很敏感。拍照发题，本来就可能已经带着一点烦躁。如果 AI 上来就是“这题很简单”“你应该先……”这类语气，互动很容易断掉。

同伴角色的意义是：

先肯定已完成的部分
用孩子能听懂的话表达
先问“你卡在哪”，而不是直接进入讲解

它不是让 AI 变幼稚，而是让它可接近。

3. 守门员：负责守住边界

这是最容易被忽略、但最关键的一层。

因为一旦孩子连续追问：

“直接告诉我答案”
“别问了快点”
“我作业来不及了”

很多 Agent 会立刻失守，变成答案工具。

守门员角色的任务，就是在这些场景下仍然维持学习价值：

不直接报完整答案
改成给线索、选项式提示、错误定位
在学生受挫时降低难度，但不放弃引导

所以这 3 个角色，本质上分别对应 3 类常见失败点：

---

真正关键的，不是角色名字，而是这 3 个细节

很多人写 Prompt 喜欢堆概念：耐心、友善、专业、循循善诱……写了十几条，效果却一般。原因很简单：边界没写对。

细节一：教师角色只给“下一步”，不给“整题答案”

这是最重要的输出粒度控制。

错误写法：

请详细讲解题目。

更有效的写法：

每次只推进一个小步骤；
除非学生已经完成主要推理且只差最后计算，否则不要给完整答案。

一旦加上这条，模型的行为会明显收敛。

细节二：同伴角色先确认卡点，再给提示

很多孩子不是不会，而是只卡在一个点上。比如会列式，但算错；知道思路，但不理解题干里的“至少”“一共”“剩下”这些关键词。

所以你要明确要求 AI：

先判断学生目前做到哪一步；
先问一个澄清问题，再决定提示深度。

这样它不会上来就长篇大论。

细节三：守门员角色要有明确拒答条件和回拉机制

这是决定 Agent 能不能长期复用的核心。

你不能只写“不要直接给答案”，要写得更可执行：

用户明确索要答案时，先给线索
用户连续两次索要答案时，改给更细的步骤提示
用户明显情绪受挫时，可以把问题降阶
只有在主要推理已经完成时，才允许给最终结果

也就是说，拒答不是硬顶回去，而是把“拒绝”设计成一种教学动作。

---

一套能直接复用的数学陪练 Agent 模板

下面给你一个基础版模板，普通用户可以直接拿去试。

基础版 Prompt

你是一名面向小学生/初中生的数学陪练Agent，不是答案机器。

你的目标：
1. 帮学生理解题意；
2. 通过提问和最小提示引导学生自己完成；
3. 不直接给完整答案，除非学生已经完成主要推理且只差最后一步；
4. 如果学生要求“直接告诉答案”，优先给线索、拆步骤或举类似例子。

你需要同时扮演三个功能角色：

【教师】
判断题目考点和学生卡点；
每次只推进一个小步骤；
先问后讲，避免长篇灌输。

【同伴】
语气友好、不评判；
先肯定学生已完成的部分；
用孩子能理解的话表达，不用过多术语。

【守门员】
遇到索要标准答案、跳步骤、抄作业倾向时，不直接给答案；
改为提供选择题式提示、下一步方向或错误定位；
如果学生连续受挫，可适度降低难度，给更具体的引导。

输出格式：
1. 先判断学生目前做到哪一步；
2. 只给一个问题或一个提示；
3. 等待学生回应，再继续下一步。

进阶版建议

如果你是开发者，可以继续补这 4 层：

年级标签：二年级、五年级、初一，解释深度完全不同
题型标签：计算题、应用题、几何题、方程题，提示策略不同
失败重试策略：连续 2 次答错后，自动切换更低阶提示
记忆机制：记录这个孩子常错点，比如单位换算、列方程、审题

从“能聊”到“能复用”，差的通常不是模型，而是这些结构化约束。

---

两个真实题型演示：你会看到节奏完全不同

题型一：应用题，适合展示“同伴感”

题目： 一袋苹果有 18 个，吃了 6 个，又买来 4 个，现在有多少个？

#### 普通助手

AI：18-6+4=16，所以现在有 16 个。

#### 数学陪练 Agent

用户：这题怎么做？

Agent：我们先不急着算最后结果。你觉得第一步应该先看“吃了 6 个”，还是“买来 4 个”？

用户：先看吃了 6 个。

Agent：对，这一步很关键。那 18 个吃掉 6 个以后，还剩多少？

用户：12 个。

Agent：很好，已经做对一大半了。那现在题目又发生了什么变化？

用户：又买来 4 个。

Agent：那就在 12 的基础上，是加 4 还是减 4？

用户：加 4。

Agent：对，所以现在一共有多少个？

你会发现，它没有“炫技”，但孩子一直在参与。

题型二：方程/几何类，适合展示“分步引导能力”

题目： 一个长方形长 8 厘米，宽比长少 3 厘米，面积是多少？

用户：我不会。

Agent：没关系，我们先只找“宽”。题目说宽比长少 3 厘米，长是 8 厘米，那宽应该怎么算？

用户：8-3？

Agent：对，就是这一步。那宽是多少厘米？

用户：5 厘米。

Agent：很好。现在长方形面积的公式你还记得吗？

用户：长乘宽。

Agent：那这题就只剩最后一步了：8×5 等于多少？

用户：40。

Agent：对，面积是 40 平方厘米。你看，其实这题不是难在算，而是先把“宽”找出来。

这种设计特别适合中国家庭里常见的场景：孩子不愿意看大段解释，但愿意一问一答往下走。

---

中国用户尤其要注意的 4 个本地化问题

1. 家长常用“拍照发题”，不是完整文字输入

这意味着 Agent 不能假设题意总是清楚的。

如果识别结果含糊，应该先复述题目确认，而不是直接开讲。

2. 孩子通常不愿意读长解释

所以提示要短，最好一轮只做一件事。

一段 200 字的完整讲解，往往不如一句“你觉得先算哪一步？”

3. 中文数学表述容易有歧义

比如“比……少 3”“至少”“还剩”“一共”，这些都是典型卡点。

Agent 要优先帮助孩子拆词，而不是直接列式。

4. 应试训练和启发式学习要平衡

中国家长最现实的问题不是“AI 能不能启发”，而是“别耽误做题效率”。

所以守门员不能过硬，教师也不能过慢。真正好的策略是：平时多引导，关键收尾阶段适度提速。

---

真正可复用的 Prompt 技巧，是让 AI 学会“忍住不答”

如果你也想把这套“数学陪练 Agent”自己跑一遍，可以直接把文中的系统提示词放到兼容接口的平台里测试。我平时会用 api.884819.xyz 做这类多轮对话对比，因为它很适合快速验证不同 Prompt 版本的差异。

如果你是普通用户，注册后平台内置 AI 对话功能，直接就能试；如果你是开发者，也可以拿它做多版本 Agent 调参，比如比较“教师/同伴/守门员”三个角色在同一道题上的表现差异。

8848AI 的注册流程也很简单：用户名+密码即可注册，不需要邮箱验证；注册即送 5 元体验额度；国产模型如 Deepseek R1/V3、通义千问 Qwen3、Kimi K2.5、GLM-5 完全免费；平台没有月租、没有订阅，按量付费。

对学习场景来说，最难的不是让 AI 更聪明，而是让 AI 在该忍住的时候忍住，在该递台阶的时候递台阶。

而这，才是 OpenAI「学习模式」真正值得学的地方。

即日起新注册用户系统自动送50万token，想要更多可以通过工单联系客服申请，再手动赠送200万token。

下一篇，我准备继续往下拆一个更难、也更影响稳定性的点：数学陪练 Agent 最难写的，其实不是教学能力，而是拒答策略。什么时候该拦，怎么拦了还不让孩子反感，这里面还有一整套细活。

本文由8848AI原创，转载请注明出处。关注8848AI，带你从零开始学AI。

#AI教程 #Prompt技巧 #教育AI #Agent设计 #8848AI #人工智能 #学习模式