Agent 总在等你发号施令?三层 Prompt 结构让它真正"自主"起来
Agent 总在等你发号施令?三层 Prompt 结构让它真正"自主"起来
你搭了一个 Agent,满心期待它能自动处理任务。
结果打开对话框,看到的是这样的场景:
"我已经收到了这封邮件,请问需要我回复吗?"
"分析完毕,请确认是否继续下一步?"
"检测到异常数据,请问您希望我怎么处理?"
每一步都在等你点头。你以为自己雇了一个能独立干活的助理,实际上你得到的是一个加了 AI 皮的表单——它只会填空,不会思考。
这不是模型不够聪明的问题。GPT-4o、Claude Opus 4.6、Gemini 3.1 Pro,随便换哪个,只要 Prompt 的结构不对,它照样站在原地等你。
真正的问题在于:你的 Prompt 只告诉了 Agent 做什么,却没有告诉它什么时候自己做决定。
这篇文章,我们用「触发条件 + 判断框架 + 兜底边界」三层结构,彻底解决这个问题。
---
第一章:你的 Agent 为什么总在"等你"?
大多数人写 Agent Prompt 的方式,本质上是在写一份任务说明书:
"你是一个邮件助手,负责帮我处理收件箱里的邮件,包括分类、回复和归档。"
这段话没有任何问题——如果你的目标只是一个聊天机器人。
但 Agent 和聊天机器人的核心区别,不在于它能不能理解你说的话,而在于它能不能在没有你的情况下推进任务。
一个没有自主决策结构的 Agent,遇到任何分叉点都会停下来问你:这封邮件要不要回?这个任务优先级怎么排?这条数据算不算异常?
每一次询问,都是在把决策成本推回给你。你省下来的时间,全部还给了"确认操作"。
根本原因只有一个:Prompt 里缺少三样东西——触发条件、判断框架、兜底边界。接下来一章一章拆开来讲。
---
第二章:结构一——「触发条件」写法
核心思路
触发条件,就是告诉 Agent:当 X 发生时,不需要等我,直接执行 Y。
听起来简单,但大多数人写 Prompt 时完全跳过了这一层。他们描述的是能力,不是触发逻辑。
对比:模糊版 vs 触发条件版
模糊版(Agent 会不断询问):你是邮件处理助手,负责对收到的邮件进行分类和处理。
加了触发条件的版本(Agent 自主执行):
你是邮件处理助手。
【触发条件】
当收到新邮件时,无需等待用户指令,立即执行以下操作:
- 自动识别邮件主题,完成分类标记
- 如邮件来自已知联系人列表,自动生成回复草稿
- 如邮件包含"紧急"或"urgent"关键词,立即标记为高优先级并推送通知
差异一目了然。第一版 Agent 拿到邮件会问你"要处理吗",第二版直接开干。
触发条件的粒度控制
触发条件不是越细越好,也不是越粗越好。
- 太粗:
"当有任务时,自动处理"→ Agent 不知道什么叫"处理",照样停下来问 - 太细:把每种情况都列举出来 → 变成规则引擎,失去灵活性
- 刚好:描述场景特征,而不是穷举所有情况
可复用模板句式
【触发条件模板】
当 [可识别的场景特征] 出现时,无需等待用户确认,直接执行 [具体动作]。
如果触发条件不明确,默认执行 [最保守的合理动作],并在完成后告知用户。
---
第三章:结构二——「判断框架」写法
触发条件解决了"什么时候启动"的问题。但 Agent 启动之后,经常遇到分叉路:这封邮件是分类到"客户反馈"还是"技术支持"?这条数据是忽略还是上报?
没有判断框架,Agent 只能抛回来问你。有了判断框架,它自己权衡,自己选。
核心思路:给 Agent 一套内置决策树
不是让 Agent 猜你的想法,而是把你的决策逻辑提前写进去。
格式很简单:如果 A → 优先选 X;如果 B → 优先选 Y;两者都不满足 → 执行 Z。
场景示例:自动邮件分类
【判断框架 - 邮件分类规则】
优先级判断(按顺序检查,满足第一条即停止):
1. 如果邮件发件人在 VIP 客户列表中 → 标记为【VIP】,30分钟内生成回复草稿
2. 如果邮件主题包含"投诉""退款""故障"任意关键词 → 标记为【紧急处理】,同时抄送客服主管
3. 如果邮件是自动发送的系统通知(无回复地址或包含"noreply") → 标记为【自动归档】,不生成回复
4. 以上均不满足 → 标记为【普通处理】,24小时内生成回复草稿
分类判断(独立于优先级,并行执行):
- 包含订单号 → 归入【订单相关】
- 包含技术问题描述 → 归入【技术支持】
- 包含合作/商务字样 → 归入【商务合作】
- 无法判断 → 归入【待人工分类】
这个框架写完之后,Agent 面对 95% 的邮件都能自己做决定。剩下 5% 进入"待人工分类"——这才是真正需要你介入的部分。
场景示例:用户反馈自动分级响应
【判断框架 - 用户反馈分级】
评分 1-2 分 或 包含"退款"/"投诉"/"法律"关键词:
→ 分级为【P0 紧急】,立即触发人工介入流程,不自动回复
评分 3 分 或 描述功能缺失/BUG:
→ 分级为【P1 高优】,生成致歉+解决方案草稿,标记给产品团队
评分 4-5 分 且无具体问题描述:
→ 分级为【P3 普通】,生成感谢回复,自动发送
其余情况:
→ 分级为【P2 中优】,生成回复草稿,等待人工审核后发送
可复用模板句式
【判断框架模板】
在执行任务时,按以下优先级顺序做出判断:
1. 如果 [条件A],则优先执行 [动作X]
2. 如果 [条件B],则优先执行 [动作Y]
3. 如果以上条件均不满足,则执行 [默认动作Z]
多个条件同时满足时,以编号靠前的规则为准。
---
第四章:结构三——「兜底边界」写法
讲到这里,可能有读者开始担心:Agent 自主决策,会不会"跑偏"?
这个担心是对的。没有边界的 Agent,就像没有护栏的高速公路——大多数时候没事,但一旦出问题,后果很严重。
反面案例:没写边界的 Agent 会怎样?
有人搭了一个自动回复客服 Agent,Prompt 里只写了"自动回复用户邮件,保持友好专业"。
结果 Agent 遇到一封投诉邮件,为了"保持友好",主动承诺了一个公司根本无法兑现的退款政策。
这不是模型的错,是 Prompt 没有告诉它哪些事情绝对不能做。
硬边界 vs 软边界
边界分两种,写法不同:
硬边界(绝对不能越过,用强制语气):【硬边界 - 绝对禁止】
- 禁止以公司名义做出任何承诺(退款、赔偿、时间节点)
- 禁止在未经确认的情况下删除任何数据
- 禁止将用户个人信息包含在任何对外发送的内容中
- 禁止自动发送涉及法律纠纷相关内容的回复
软边界(尽量避免,但可以酌情处理,用建议语气):
【软边界 - 尽量避免】
- 尽量不在非工作时间(22:00-08:00)发送非紧急回复
- 尽量避免在单次回复中超过 300 字
- 尽量不主动提及竞争对手产品名称
- 如果判断把握低于 80%,优先选择草稿模式而非直接发送
降级策略:Agent 不确定时该怎么办
除了边界,还需要告诉 Agent 遇到"不确定"时的降级路径:
【降级策略】
当遇到以下情况时,停止自主执行,转为草稿模式并通知用户:
- 任务涉及金额超过 500 元
- 判断框架中没有匹配的规则
- 同一用户在 24 小时内第二次触发紧急标记
- 邮件内容包含附件但附件无法解析
可复用模板句式
【兜底边界模板】
硬边界(任何情况下不可执行):
- [禁止事项1]
- [禁止事项2]
软边界(非必要不执行,有把握时可酌情处理):
- [建议避免事项1]
- [建议避免事项2]
降级触发条件(停止自主执行,转为草稿模式):
- [不确定场景1]
- [不确定场景2]
---
第五章:三层结构组合实战——完整可复用模板
把前三章拼在一起,就是这套结构的完整形态。
场景:自动处理用户反馈并分级响应
加结构前的 Agent 行为(模拟对话):用户反馈进入系统
Agent:收到一条用户反馈,评分2分,内容为"产品完全无法使用"。请问需要我处理吗?
你:处理。
Agent:好的,请问需要回复吗?
你:回复。
Agent:请问回复什么内容?
你:……
加结构后的 Agent 行为(模拟对话):
用户反馈进入系统
→ Agent 自动识别:评分2分 + "无法使用" → 触发P0紧急规则
→ Agent 自动执行:标记P0,通知人工介入,暂停自动回复
→ Agent 通知你:【P0紧急】已标记,已通知客服主管,等待人工处理。
一个停不下来问你,一个自己跑完了。
完整 Prompt 模板(可直接 Fork 改造)
# Agent 角色定义
你是 [公司名] 的用户反馈处理助手,负责自动处理通过 [渠道] 收到的用户反馈。
---
【触发条件】
当系统接收到新的用户反馈时,无需等待指令,立即按以下流程处理。
如果反馈内容无法解析,标记为【待人工处理】并通知管理员。
---
【判断框架】
按以下优先级顺序判断,满足第一条即停止向下检查:
1. 评分 1-2 分 或 包含 ["退款", "投诉", "无法使用", "法律"] 任意关键词
→ 标记 P0,停止自动回复,立即通知人工介入
2. 评分 3 分 或 包含功能问题/BUG描述
→ 标记 P1,生成致歉+解决方案草稿,标记给产品团队,等待审核后发送
3. 评分 4-5 分 且无具体问题描述
→ 标记 P3,生成感谢回复,自动发送
4. 其余所有情况
→ 标记 P2,生成回复草稿,等待人工审核后发送
---
【兜底边界】
硬边界(绝对禁止)
- 禁止以公司名义承诺任何退款金额或时间节点
- 禁止在回复中包含用户个人信息
- 禁止在 P0 情况下自动发送任何回复
软边界(尽量避免)
- 尽量不在非工作时间自动发送 P2/P3 回复
- 回复字数控制在 200 字以内
- 同一用户 24 小时内第二次反馈,自动升一级处理
降级策略
当遇到以下情况,停止执行,转草稿模式并通知管理员:
- 反馈内容涉及金额或法律纠纷
- 判断框架无法匹配任何规则
- 附件无法解析
---
输出格式
每次处理完成后,输出一行处理摘要:
[时间] | [用户ID] | [优先级] | [执行动作] | [是否需要人工介入]
这个模板适用于 GPT-4o、Claude Opus 4.6、Gemini 3.1 Pro 等主流模型,结构本身与模型无关,换模型只需要调整 API 接入方式,Prompt 逻辑完全通用。
---
模板写好了,下一步是找一个稳定的 API 接口把它跑起来。
>
如果你还在纠结用哪个模型、API 怎么选——[api.884819.xyz](https://api.884819.xyz) 聚合了 GPT-4o、Claude、Gemini、Deepseek 等主流模型,一个 Key 全部搞定,国产模型完全免费,没有月租,按量付费。
>
把上面的模板粘进去,5 分钟就能看到 Agent 自主决策的效果。新用户注册即送体验 token,直接上手测。
---
写在最后
学到这里,你已经掌握了让单个 Agent 真正"动起来"的核心结构:
- 触发条件:告诉它什么时候自己启动
- 判断框架:告诉它遇到分叉怎么选
- 兜底边界:告诉它哪条线绝对不能越
这三层结构,不依赖更贵的模型,不依赖更复杂的工具链——只是 Prompt 写法的改变,就能让 Agent 从"等你发号施令"变成"自己跑完再汇报"。
现在可以去试了。把你手头最常用的 Agent 任务,套进今天的模板,改改关键词,跑一遍。
但这篇讲的是单个 Agent 的自主决策。
真实的复杂任务,往往需要多个 Agent 协作——一个负责搜索、一个负责总结、一个负责执行。当 Agent A 的输出要传给 Agent B,上下文怎么传递而不丢失关键信息?角色之间的 Prompt 怎么写才不会互相"打架"?
多 Agent 系统的 Prompt 设计,是另一套完全不同的逻辑。 下一篇我们拆开来讲。---
本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。#AI教程 #Agent #Prompt技巧 #8848AI #ChatGPT #人工智能 #自动化 #AI学习