拆解 OpenAI「学习模式」实战心法:一个数学陪练 Agent,为什么要同时扮演教师、同伴和守门员
拆解 OpenAI「学习模式」实战心法:一个数学陪练 Agent,为什么要同时扮演教师、同伴和守门员
我最开始做这个数学 Agent 时,AI 表现得像个满分学霸:会做,但不会教。
孩子把题一发过去,它 3 秒钟就把答案、过程、标准结论一次性端上来。看起来很强,实际上很差——因为孩子真正学到的,往往只有一句:“哦,原来答案是这个。”
这也是很多家长、老师、教育产品开发者会踩的坑:你以为自己做的是“数学辅导助手”,最后做出来的却是一个高级答案生成器。问题通常不在模型不够强,而在于你给它的角色,压根就不是“陪练老师”,而是“解题机器”。
这篇文章不再重复讲 OpenAI「学习模式」的新闻背景,而是直接进入第二层:它真正值钱的,不是几句魔法 Prompt,而是一套行为框架。
如果你想把它落到“给孩子做数学陪练 Agent”这个场景,最关键的不是多写几条夸张指令,而是把三个角色写对:
- 教师
- 同伴
- 守门员
这 3 个角色,不是为了好玩,而是分别解决 3 类最常见的失效问题。
---
先别急着抄提示词,为什么很多“数学 Agent”一上线就失效
很多人一上来会这样写系统提示词:
你是一名数学老师,请帮助学生解答数学题,要求清晰、准确、详细。
这句看起来没问题,但它几乎注定会导向一个结果:AI 默认把“帮助”理解成“高效地把题解出来”。
于是,用户一发题,AI 就会进入标准解析模式。
失败示例:普通数学助手
用户:小明买了 3 支笔,每支 4 元,又买了一个本子 5 元,一共多少钱?
AI:3×4=12,12+5=17,所以一共 17 元。解析如下:先计算钢笔总价,再加上本子的价格……
对成年人来说,这当然没毛病。
但对一个二三年级孩子,这种回答的问题是:
- 参与感为零
- 没有确认孩子卡在哪一步
- 没有训练“自己迈出下一步”的能力
- 最终非常容易变成“抄答案”
现在换成学习模式思路。
对照示例:学习模式数学陪练 Agent
用户:小明买了 3 支笔,每支 4 元,又买了一个本子 5 元,一共多少钱?
Agent:我们先不急着算总数。你觉得这道题里,哪一部分是可以先算出来的?是 3 支笔的钱,还是笔和本子一起的钱?
你会发现,区别不在于“会不会做”,而在于它先把孩子拉回到思考位置上。
学习场景里,最怕的不是 AI 不会答,而是它答得太快、太完整。
---
OpenAI「学习模式」真正值得拆的,是它的行为框架
如果你去看公开流传的学习模式相关提示词片段,会发现它反复强调的不是“讲得更全”,而是下面这几类约束:
| 原则片段 | 中文解读 | | 不直接给完整答案 | 先保留学生的思考空间 | | 优先提问,而不是灌输 | 让对话先从“诊断”开始 | | 根据用户程度调整解释深度 | 小学生和初中生不能一个讲法 | | 鼓励自主思考 | 让学生完成关键推理,而不是只看结论 |这些约束组合起来,形成的是一种很清晰的行为逻辑:
1. 先判断学生在哪
2. 只推进一步
3. 给台阶,不给终点
4. 如果学生想跳步,温和拉回
这也是为什么很多人把“学习模式”误解成“更像老师的语气”,其实不够准确。
它更像是:把模型从“结果导向”切到“过程导向”。
而一旦你要落地到数学陪练场景,就必须把这种行为框架具体化。我的做法是:拆成三个角色。
---
为什么一定要设计成 3 个角色:教师、同伴、守门员
1. 教师:负责搭脚手架
教师角色解决的,是AI 一次讲太多的问题。
很多模型天然倾向于“完整、清楚、周到”,这在知识问答里是优点,在辅导孩子时反而是副作用。真正有效的教师,不是把整道题讲完,而是把题拆成孩子当前能接住的下一步。
比如“列方程解应用题”,教师角色要做的是:
- 判断考点是什么
- 判断孩子是卡在审题、设未知数,还是列式
- 一次只给一个最小推进动作
不是:
- 一口气写完整方程
- 顺便补上标准答案
- 最后再问一句“懂了吗”
2. 同伴:负责降低压迫感
教育类 Agent 经常会有一个隐性问题:太像老师了,所以孩子不想继续聊。
尤其在中国家庭场景里,孩子对“被检查、被纠正”很敏感。拍照发题,本来就可能已经带着一点烦躁。如果 AI 上来就是“这题很简单”“你应该先……”这类语气,互动很容易断掉。
同伴角色的意义是:
- 先肯定已完成的部分
- 用孩子能听懂的话表达
- 先问“你卡在哪”,而不是直接进入讲解
它不是让 AI 变幼稚,而是让它可接近。
3. 守门员:负责守住边界
这是最容易被忽略、但最关键的一层。
因为一旦孩子连续追问:
- “直接告诉我答案”
- “别问了快点”
- “我作业来不及了”
很多 Agent 会立刻失守,变成答案工具。
守门员角色的任务,就是在这些场景下仍然维持学习价值:
- 不直接报完整答案
- 改成给线索、选项式提示、错误定位
- 在学生受挫时降低难度,但不放弃引导
所以这 3 个角色,本质上分别对应 3 类常见失败点:
| 角色细节 | 不这样设会怎样 | 这样设后的效果 | | 教师:只给下一步 | AI 一次讲完 | 孩子有参与感 | | 同伴:先确认卡点 | AI 自顾自解释 | 互动更自然 | | 守门员:禁止直接报答案 | 很快变抄作业工具 | 保留练习价值 |---
真正关键的,不是角色名字,而是这 3 个细节
很多人写 Prompt 喜欢堆概念:耐心、友善、专业、循循善诱……写了十几条,效果却一般。原因很简单:边界没写对。
细节一:教师角色只给“下一步”,不给“整题答案”
这是最重要的输出粒度控制。
错误写法:
请详细讲解题目。
更有效的写法:
每次只推进一个小步骤;
除非学生已经完成主要推理且只差最后计算,否则不要给完整答案。
一旦加上这条,模型的行为会明显收敛。
细节二:同伴角色先确认卡点,再给提示
很多孩子不是不会,而是只卡在一个点上。比如会列式,但算错;知道思路,但不理解题干里的“至少”“一共”“剩下”这些关键词。
所以你要明确要求 AI:
先判断学生目前做到哪一步;
先问一个澄清问题,再决定提示深度。
这样它不会上来就长篇大论。
细节三:守门员角色要有明确拒答条件和回拉机制
这是决定 Agent 能不能长期复用的核心。
你不能只写“不要直接给答案”,要写得更可执行:
- 用户明确索要答案时,先给线索
- 用户连续两次索要答案时,改给更细的步骤提示
- 用户明显情绪受挫时,可以把问题降阶
- 只有在主要推理已经完成时,才允许给最终结果
也就是说,拒答不是硬顶回去,而是把“拒绝”设计成一种教学动作。
---
一套能直接复用的数学陪练 Agent 模板
下面给你一个基础版模板,普通用户可以直接拿去试。
基础版 Prompt
你是一名面向小学生/初中生的数学陪练Agent,不是答案机器。
你的目标:
1. 帮学生理解题意;
2. 通过提问和最小提示引导学生自己完成;
3. 不直接给完整答案,除非学生已经完成主要推理且只差最后一步;
4. 如果学生要求“直接告诉答案”,优先给线索、拆步骤或举类似例子。
你需要同时扮演三个功能角色:
【教师】
- 判断题目考点和学生卡点;
- 每次只推进一个小步骤;
- 先问后讲,避免长篇灌输。
【同伴】
- 语气友好、不评判;
- 先肯定学生已完成的部分;
- 用孩子能理解的话表达,不用过多术语。
【守门员】
- 遇到索要标准答案、跳步骤、抄作业倾向时,不直接给答案;
- 改为提供选择题式提示、下一步方向或错误定位;
- 如果学生连续受挫,可适度降低难度,给更具体的引导。
输出格式:
1. 先判断学生目前做到哪一步;
2. 只给一个问题或一个提示;
3. 等待学生回应,再继续下一步。
进阶版建议
如果你是开发者,可以继续补这 4 层:
- 年级标签:二年级、五年级、初一,解释深度完全不同
- 题型标签:计算题、应用题、几何题、方程题,提示策略不同
- 失败重试策略:连续 2 次答错后,自动切换更低阶提示
- 记忆机制:记录这个孩子常错点,比如单位换算、列方程、审题
从“能聊”到“能复用”,差的通常不是模型,而是这些结构化约束。
---
两个真实题型演示:你会看到节奏完全不同
题型一:应用题,适合展示“同伴感”
题目: 一袋苹果有 18 个,吃了 6 个,又买来 4 个,现在有多少个?#### 普通助手
AI:18-6+4=16,所以现在有 16 个。
#### 数学陪练 Agent
用户:这题怎么做?
Agent:我们先不急着算最后结果。你觉得第一步应该先看“吃了 6 个”,还是“买来 4 个”?
用户:先看吃了 6 个。
Agent:对,这一步很关键。那 18 个吃掉 6 个以后,还剩多少?
用户:12 个。
Agent:很好,已经做对一大半了。那现在题目又发生了什么变化?
用户:又买来 4 个。
Agent:那就在 12 的基础上,是加 4 还是减 4?
用户:加 4。
Agent:对,所以现在一共有多少个?
你会发现,它没有“炫技”,但孩子一直在参与。
题型二:方程/几何类,适合展示“分步引导能力”
题目: 一个长方形长 8 厘米,宽比长少 3 厘米,面积是多少?用户:我不会。
Agent:没关系,我们先只找“宽”。题目说宽比长少 3 厘米,长是 8 厘米,那宽应该怎么算?
用户:8-3?
Agent:对,就是这一步。那宽是多少厘米?
用户:5 厘米。
Agent:很好。现在长方形面积的公式你还记得吗?
用户:长乘宽。
Agent:那这题就只剩最后一步了:8×5 等于多少?
用户:40。
Agent:对,面积是 40 平方厘米。你看,其实这题不是难在算,而是先把“宽”找出来。
这种设计特别适合中国家庭里常见的场景:孩子不愿意看大段解释,但愿意一问一答往下走。
---
中国用户尤其要注意的 4 个本地化问题
1. 家长常用“拍照发题”,不是完整文字输入
这意味着 Agent 不能假设题意总是清楚的。
如果识别结果含糊,应该先复述题目确认,而不是直接开讲。
2. 孩子通常不愿意读长解释
所以提示要短,最好一轮只做一件事。
一段 200 字的完整讲解,往往不如一句“你觉得先算哪一步?”
3. 中文数学表述容易有歧义
比如“比……少 3”“至少”“还剩”“一共”,这些都是典型卡点。
Agent 要优先帮助孩子拆词,而不是直接列式。
4. 应试训练和启发式学习要平衡
中国家长最现实的问题不是“AI 能不能启发”,而是“别耽误做题效率”。
所以守门员不能过硬,教师也不能过慢。真正好的策略是:平时多引导,关键收尾阶段适度提速。
---
真正可复用的 Prompt 技巧,是让 AI 学会“忍住不答”
如果你也想把这套“数学陪练 Agent”自己跑一遍,可以直接把文中的系统提示词放到兼容接口的平台里测试。我平时会用 api.884819.xyz 做这类多轮对话对比,因为它很适合快速验证不同 Prompt 版本的差异。
如果你是普通用户,注册后平台内置 AI 对话功能,直接就能试;如果你是开发者,也可以拿它做多版本 Agent 调参,比如比较“教师/同伴/守门员”三个角色在同一道题上的表现差异。
8848AI 的注册流程也很简单:用户名+密码即可注册,不需要邮箱验证;注册即送 5 元体验额度;国产模型如 Deepseek R1/V3、通义千问 Qwen3、Kimi K2.5、GLM-5 完全免费;平台没有月租、没有订阅,按量付费。
对学习场景来说,最难的不是让 AI 更聪明,而是让 AI 在该忍住的时候忍住,在该递台阶的时候递台阶。
而这,才是 OpenAI「学习模式」真正值得学的地方。
即日起新注册用户系统自动送50万token,想要更多可以通过工单联系客服申请,再手动赠送200万token。下一篇,我准备继续往下拆一个更难、也更影响稳定性的点:数学陪练 Agent 最难写的,其实不是教学能力,而是拒答策略。什么时候该拦,怎么拦了还不让孩子反感,这里面还有一整套细活。
本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。#AI教程 #Prompt技巧 #教育AI #Agent设计 #8848AI #人工智能 #学习模式