Agent 总在等你发号施令?三层 Prompt 结构让它真正"自主"起来

你搭了一个 Agent,满心期待它能自动处理任务。

结果打开对话框,看到的是这样的场景:

"我已经收到了这封邮件,请问需要我回复吗?"
"分析完毕,请确认是否继续下一步?"
"检测到异常数据,请问您希望我怎么处理?"

每一步都在等你点头。你以为自己雇了一个能独立干活的助理,实际上你得到的是一个加了 AI 皮的表单——它只会填空,不会思考。

这不是模型不够聪明的问题。GPT-4o、Claude Opus 4.6、Gemini 3.1 Pro,随便换哪个,只要 Prompt 的结构不对,它照样站在原地等你。

真正的问题在于:你的 Prompt 只告诉了 Agent 做什么,却没有告诉它什么时候自己做决定。

这篇文章,我们用「触发条件 + 判断框架 + 兜底边界」三层结构,彻底解决这个问题。

---

第一章:你的 Agent 为什么总在"等你"?

大多数人写 Agent Prompt 的方式,本质上是在写一份任务说明书

"你是一个邮件助手,负责帮我处理收件箱里的邮件,包括分类、回复和归档。"

这段话没有任何问题——如果你的目标只是一个聊天机器人。

但 Agent 和聊天机器人的核心区别,不在于它能不能理解你说的话,而在于它能不能在没有你的情况下推进任务

一个没有自主决策结构的 Agent,遇到任何分叉点都会停下来问你:这封邮件要不要回?这个任务优先级怎么排?这条数据算不算异常?

每一次询问,都是在把决策成本推回给你。你省下来的时间,全部还给了"确认操作"。

根本原因只有一个:Prompt 里缺少三样东西——触发条件、判断框架、兜底边界。

接下来一章一章拆开来讲。

---

第二章:结构一——「触发条件」写法

核心思路

触发条件,就是告诉 Agent:当 X 发生时,不需要等我,直接执行 Y。

听起来简单,但大多数人写 Prompt 时完全跳过了这一层。他们描述的是能力,不是触发逻辑。

对比:模糊版 vs 触发条件版

模糊版(Agent 会不断询问):
你是邮件处理助手,负责对收到的邮件进行分类和处理。
加了触发条件的版本(Agent 自主执行):
你是邮件处理助手。

【触发条件】

当收到新邮件时,无需等待用户指令,立即执行以下操作:

  • 自动识别邮件主题,完成分类标记
  • 如邮件来自已知联系人列表,自动生成回复草稿
  • 如邮件包含"紧急"或"urgent"关键词,立即标记为高优先级并推送通知

差异一目了然。第一版 Agent 拿到邮件会问你"要处理吗",第二版直接开干。

触发条件的粒度控制

触发条件不是越细越好,也不是越粗越好。

  • 太粗"当有任务时,自动处理" → Agent 不知道什么叫"处理",照样停下来问
  • 太细:把每种情况都列举出来 → 变成规则引擎,失去灵活性
  • 刚好:描述场景特征,而不是穷举所有情况

可复用模板句式

【触发条件模板】

当 [可识别的场景特征] 出现时,无需等待用户确认,直接执行 [具体动作]。

如果触发条件不明确,默认执行 [最保守的合理动作],并在完成后告知用户。

---

第三章:结构二——「判断框架」写法

触发条件解决了"什么时候启动"的问题。但 Agent 启动之后,经常遇到分叉路:这封邮件是分类到"客户反馈"还是"技术支持"?这条数据是忽略还是上报?

没有判断框架,Agent 只能抛回来问你。有了判断框架,它自己权衡,自己选。

核心思路:给 Agent 一套内置决策树

不是让 Agent 猜你的想法,而是把你的决策逻辑提前写进去

格式很简单:如果 A → 优先选 X;如果 B → 优先选 Y;两者都不满足 → 执行 Z。

场景示例:自动邮件分类

【判断框架 - 邮件分类规则】

优先级判断(按顺序检查,满足第一条即停止):

1. 如果邮件发件人在 VIP 客户列表中 → 标记为【VIP】,30分钟内生成回复草稿

2. 如果邮件主题包含"投诉""退款""故障"任意关键词 → 标记为【紧急处理】,同时抄送客服主管

3. 如果邮件是自动发送的系统通知(无回复地址或包含"noreply") → 标记为【自动归档】,不生成回复

4. 以上均不满足 → 标记为【普通处理】,24小时内生成回复草稿

分类判断(独立于优先级,并行执行):

  • 包含订单号 → 归入【订单相关】
  • 包含技术问题描述 → 归入【技术支持】
  • 包含合作/商务字样 → 归入【商务合作】
  • 无法判断 → 归入【待人工分类】

这个框架写完之后,Agent 面对 95% 的邮件都能自己做决定。剩下 5% 进入"待人工分类"——这才是真正需要你介入的部分。

场景示例:用户反馈自动分级响应

【判断框架 - 用户反馈分级】

评分 1-2 分 或 包含"退款"/"投诉"/"法律"关键词:

→ 分级为【P0 紧急】,立即触发人工介入流程,不自动回复

评分 3 分 或 描述功能缺失/BUG:

→ 分级为【P1 高优】,生成致歉+解决方案草稿,标记给产品团队

评分 4-5 分 且无具体问题描述:

→ 分级为【P3 普通】,生成感谢回复,自动发送

其余情况:

→ 分级为【P2 中优】,生成回复草稿,等待人工审核后发送

可复用模板句式

【判断框架模板】

在执行任务时,按以下优先级顺序做出判断:

1. 如果 [条件A],则优先执行 [动作X]

2. 如果 [条件B],则优先执行 [动作Y]

3. 如果以上条件均不满足,则执行 [默认动作Z]

多个条件同时满足时,以编号靠前的规则为准。

---

第四章:结构三——「兜底边界」写法

讲到这里,可能有读者开始担心:Agent 自主决策,会不会"跑偏"?

这个担心是对的。没有边界的 Agent,就像没有护栏的高速公路——大多数时候没事,但一旦出问题,后果很严重。

反面案例:没写边界的 Agent 会怎样?

有人搭了一个自动回复客服 Agent,Prompt 里只写了"自动回复用户邮件,保持友好专业"。

结果 Agent 遇到一封投诉邮件,为了"保持友好",主动承诺了一个公司根本无法兑现的退款政策。

这不是模型的错,是 Prompt 没有告诉它哪些事情绝对不能做

硬边界 vs 软边界

边界分两种,写法不同:

硬边界(绝对不能越过,用强制语气):
【硬边界 - 绝对禁止】
  • 禁止以公司名义做出任何承诺(退款、赔偿、时间节点)
  • 禁止在未经确认的情况下删除任何数据
  • 禁止将用户个人信息包含在任何对外发送的内容中
  • 禁止自动发送涉及法律纠纷相关内容的回复
软边界(尽量避免,但可以酌情处理,用建议语气):
【软边界 - 尽量避免】
  • 尽量不在非工作时间(22:00-08:00)发送非紧急回复
  • 尽量避免在单次回复中超过 300 字
  • 尽量不主动提及竞争对手产品名称
  • 如果判断把握低于 80%,优先选择草稿模式而非直接发送

降级策略:Agent 不确定时该怎么办

除了边界,还需要告诉 Agent 遇到"不确定"时的降级路径:

【降级策略】

当遇到以下情况时,停止自主执行,转为草稿模式并通知用户:

  • 任务涉及金额超过 500 元
  • 判断框架中没有匹配的规则
  • 同一用户在 24 小时内第二次触发紧急标记
  • 邮件内容包含附件但附件无法解析

可复用模板句式

【兜底边界模板】

硬边界(任何情况下不可执行):

  • [禁止事项1]
  • [禁止事项2]

软边界(非必要不执行,有把握时可酌情处理):

  • [建议避免事项1]
  • [建议避免事项2]

降级触发条件(停止自主执行,转为草稿模式):

  • [不确定场景1]
  • [不确定场景2]

---

第五章:三层结构组合实战——完整可复用模板

把前三章拼在一起,就是这套结构的完整形态。

场景:自动处理用户反馈并分级响应

加结构前的 Agent 行为(模拟对话):
用户反馈进入系统

Agent:收到一条用户反馈,评分2分,内容为"产品完全无法使用"。请问需要我处理吗?

你:处理。

Agent:好的,请问需要回复吗?

你:回复。

Agent:请问回复什么内容?

你:……

加结构后的 Agent 行为(模拟对话):
用户反馈进入系统

→ Agent 自动识别:评分2分 + "无法使用" → 触发P0紧急规则

→ Agent 自动执行:标记P0,通知人工介入,暂停自动回复

→ Agent 通知你:【P0紧急】已标记,已通知客服主管,等待人工处理。

一个停不下来问你,一个自己跑完了。

完整 Prompt 模板(可直接 Fork 改造)

# Agent 角色定义

你是 [公司名] 的用户反馈处理助手,负责自动处理通过 [渠道] 收到的用户反馈。

---

【触发条件】

当系统接收到新的用户反馈时,无需等待指令,立即按以下流程处理。

如果反馈内容无法解析,标记为【待人工处理】并通知管理员。

---

【判断框架】

按以下优先级顺序判断,满足第一条即停止向下检查:

1. 评分 1-2 分 或 包含 ["退款", "投诉", "无法使用", "法律"] 任意关键词

→ 标记 P0,停止自动回复,立即通知人工介入

2. 评分 3 分 或 包含功能问题/BUG描述

→ 标记 P1,生成致歉+解决方案草稿,标记给产品团队,等待审核后发送

3. 评分 4-5 分 且无具体问题描述

→ 标记 P3,生成感谢回复,自动发送

4. 其余所有情况

→ 标记 P2,生成回复草稿,等待人工审核后发送

---

【兜底边界】

硬边界(绝对禁止)

  • 禁止以公司名义承诺任何退款金额或时间节点
  • 禁止在回复中包含用户个人信息
  • 禁止在 P0 情况下自动发送任何回复

软边界(尽量避免)

  • 尽量不在非工作时间自动发送 P2/P3 回复
  • 回复字数控制在 200 字以内
  • 同一用户 24 小时内第二次反馈,自动升一级处理

降级策略

当遇到以下情况,停止执行,转草稿模式并通知管理员:

  • 反馈内容涉及金额或法律纠纷
  • 判断框架无法匹配任何规则
  • 附件无法解析

---

输出格式

每次处理完成后,输出一行处理摘要:

[时间] | [用户ID] | [优先级] | [执行动作] | [是否需要人工介入]

这个模板适用于 GPT-4o、Claude Opus 4.6、Gemini 3.1 Pro 等主流模型,结构本身与模型无关,换模型只需要调整 API 接入方式,Prompt 逻辑完全通用。

---

模板写好了,下一步是找一个稳定的 API 接口把它跑起来。

>

如果你还在纠结用哪个模型、API 怎么选——[api.884819.xyz](https://api.884819.xyz) 聚合了 GPT-4o、Claude、Gemini、Deepseek 等主流模型,一个 Key 全部搞定,国产模型完全免费,没有月租,按量付费。

>

把上面的模板粘进去,5 分钟就能看到 Agent 自主决策的效果。新用户注册即送体验 token,直接上手测。

---

写在最后

学到这里,你已经掌握了让单个 Agent 真正"动起来"的核心结构:

  • 触发条件:告诉它什么时候自己启动
  • 判断框架:告诉它遇到分叉怎么选
  • 兜底边界:告诉它哪条线绝对不能越

这三层结构,不依赖更贵的模型,不依赖更复杂的工具链——只是 Prompt 写法的改变,就能让 Agent 从"等你发号施令"变成"自己跑完再汇报"。

现在可以去试了。把你手头最常用的 Agent 任务,套进今天的模板,改改关键词,跑一遍。

但这篇讲的是单个 Agent 的自主决策

真实的复杂任务,往往需要多个 Agent 协作——一个负责搜索、一个负责总结、一个负责执行。当 Agent A 的输出要传给 Agent B,上下文怎么传递而不丢失关键信息?角色之间的 Prompt 怎么写才不会互相"打架"?

多 Agent 系统的 Prompt 设计,是另一套完全不同的逻辑。 下一篇我们拆开来讲。

---

本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。

#AI教程 #Agent #Prompt技巧 #8848AI #ChatGPT #人工智能 #自动化 #AI学习