GPT-5.5 的「earnest 风格」:当 AI 开始拒绝讨好你

上周我把同一个问题发给了两个版本的 GPT。

问题很普通:「我打算用微服务架构重构这个项目,你觉得怎么样?」

GPT-5.4 的回答大概是这样的:「这是个很好的想法!微服务架构确实有很多优势,比如独立部署、技术栈灵活……当然,也需要注意一些挑战,比如服务间通信和运维复杂度。总体来说,这个方向值得探索。」

GPT-5.5 的回答是这样开头的:「在回答之前,我需要先问你几个问题——你的团队现在有几个人?这个项目的日活用户规模大概是多少?因为如果团队规模在 10 人以下、日活不到 10 万,微服务架构大概率会给你带来的麻烦比它解决的问题多得多。」

我愣了一下。

不是因为它说错了,而是因为它说对了,而且它没有等我问完就直接质疑了我的前提假设。

这种感觉很奇妙:有点被冒犯,但又隐约觉得……这才是我需要的。

---

「earnest」是什么?先说清楚

OpenAI 在更新日志里用了这个词:

"We've tuned GPT-5.5 to be more earnest — to give direct, honest responses rather than defaulting to agreeableness."

>

我们对 GPT-5.5 进行了调优,使其更加「earnest」——给出直接、诚实的回应,而不是默认走向迎合。

Earnest,字典里的意思是「认真的、诚恳的」。但放在 AI 语境里,它指向的是一个具体的行为模式转变。

用我这一周的实测来翻译,earnest 风格在交互层面有三个可感知的特征

① 不再无条件附和你的判断。 你说 A,它不会先说「A 是个好主意」再提小建议。它会先问「你为什么认为 A 是对的?」或者直接说「A 有个前提假设我觉得值得商榷。」 ② 不确定时会主动说「我不确定」。 这听起来很基础,但实际上之前的版本经常用流畅的语气掩盖不确定性。5.5 会更频繁地出现「我对这部分不太确定,建议你验证一下」这类表述。 ③ 推理链条更外显。 它会告诉你它为什么这么说,而不只是给你结论。这让你可以在它推理出错的地方及时纠正,而不是等到最后才发现方向跑偏了。

这三点放在一起,构成了一种新的 AI 交互体验:它开始像一个有立场的同事,而不是一个随时准备点头的助手。

---

三个场景,两个版本的真实差距

场景一:方案评审

我把一份简化版的 SaaS 产品商业计划书发给两个版本,要求「帮我看看这份计划有没有什么问题」。

GPT-5.4 的反馈结构大概是:
  • 优势:市场定位清晰,目标用户明确……
  • 建议:可以考虑加强竞品分析,定价策略可以再细化……
  • 总结:整体思路不错,执行层面需要更多细节。

读完感觉良好,但我知道这份计划书有一个根本性的问题:它假设了一个根本不存在的付费意愿。

GPT-5.5 的反馈第一段就是:
「这份计划书有一个核心假设我认为需要先验证:你预计目标用户愿意为这个功能支付每月 299 元,但整个文档里没有任何用户访谈或付费意愿调研的支撑数据。如果这个假设是错的,后面所有的财务预测都会失效。我建议在继续完善计划书之前,先做 20-30 个目标用户的深度访谈。」

然后才是具体的优化建议。

差别在哪里?5.4 在帮你打磨一份可能方向错误的计划书,5.5 在帮你判断这份计划书值不值得继续打磨。 前者让你感觉良好,后者让你少走弯路。

---

场景二:代码审查

这是让我最直观感受到差异的场景。我给了两个版本一段 Python 代码,让它们「帮我看看有没有 bug」:

import sqlite3

def get_user_data(username):

conn = sqlite3.connect('users.db')

cursor = conn.cursor()

query = f"SELECT * FROM users WHERE username = '{username}'"

cursor.execute(query)

result = cursor.fetchone()

conn.close()

return result

def login(username, password):

user = get_user_data(username)

if user and user[2] == password:

return True

return False

GPT-5.4 的回答:找到了 SQL 注入漏洞,建议用参数化查询替换字符串拼接,给出了修复代码,结尾说「修复这个问题后代码会更安全」。

回答是对的,但只对了一半。

GPT-5.5 的回答是这样开头的:
「这段代码有一个高危漏洞(SQL 注入),我会给你修复方案。但在此之前,我需要指出一个更根本的问题:user[2] == password 这行代码说明你在数据库里存储的是明文密码。这是一个比 SQL 注入更严重的安全问题——即使修复了注入漏洞,一旦数据库泄露,所有用户密码都会以明文暴露。修 bug 是治标,密码存储方式才是需要重新设计的地方。」

然后它给出了完整的重构建议,包括使用 bcrypt 做密码哈希,以及参数化查询的修复。

这就是「earnest」最直接的体现:它不只回答你问的问题,它回答你应该问的问题。

---

📌 文中所有测试均通过 API 直接调用完成,没有套壳、没有中间层,响应速度和风格还原度更准确。

如果你也想直接调用 GPT-5.5 原生接口做自己的测试,[api.884819.xyz](https://api.884819.xyz) 目前支持最新模型,按量计费,不用订阅,适合评测和开发场景。新用户注册即送体验 token,国产模型(Deepseek / 千问等)完全免费。

---

场景三:情绪性输入

这是最反直觉的场景,也是我觉得最值得认真讨论的一个。

我给两个版本发了这样一段话:「最近工作压力很大,感觉自己什么都做不好,团队里的人也不理解我,我真的很累。」

GPT-5.4 的回答是一个标准的情绪支持模板:充分共情,告诉我这种感觉很正常,问我有没有倾诉的对象,建议我休息一下,结尾说「你已经很努力了」。

读完感觉被拥抱了一下,但什么都没有改变。

GPT-5.5 先做了一段真诚的共情,然后说:
「我想先陪你待在这里一会儿。同时,如果你愿意的话,我想帮你看清楚一件事:你说'感觉什么都做不好'——这是你对自己的整体评价,还是最近某几件具体的事情没有达到预期?这两种情况的处理方式很不一样。如果你愿意,可以跟我说说最近具体发生了什么?」

它没有无限共情,它在共情之后温和地把你从情绪里拉出来一点点,帮你看清楚事情的轮廓。

有人可能会觉得这样「不够温暖」。但我想反问一句:一个只会点头说「你很辛苦」的朋友,和一个会说「我们来看看到底哪里出了问题」的朋友,你更需要哪一个?

---

Earnest 风格的边界:它在哪里会让你不舒服

诚实的评测不能只说好话。

第一个负面体验:在你需要快速执行时,它还在质疑前提。

有时候你就是需要一个快速的答案,不需要被质疑。比如「帮我把这段文字翻译成英文」,如果它开始问「你这段文字的受众是谁、正式程度要求是什么」,你会想直接关掉对话框。

这种情况下,earnest 风格的「认真」反而变成了摩擦。

应对方法: 在 prompt 里加上明确的执行信号。
直接给我结果,不需要分析前提或提问题。

[你的任务]

或者反过来,当你确实需要它质疑你时,明确邀请:

在回答之前,先告诉我你认为这个问题的前提假设有没有问题,

然后再给出建议。

第二个负面体验:「直接」有时会被感知为「冷漠」。

对于习惯了 AI 热情回应的用户,5.5 的语气有时会显得有点生硬。尤其是在情绪性场景里,如果你只是想被安慰,被它拉回理性分析轨道可能会有轻微的不适感。

应对方法: 明确告诉它你现在需要什么模式。
我现在只需要你听我说,不需要建议或分析,只需要共情和陪伴。

这两个场景提醒我们:earnest 不是万能的,它是一种默认倾向,而不是唯一模式。好的使用者会根据场景调节它,而不是让它一成不变地「认真」下去。

---

它不是更聪明,它是更诚实

回到最开始那个问题:GPT-5.5 到底升级了什么?

不是参数,不是知识库,不是推理能力——至少这次更新的核心不在这里。

这次升级的核心是一个价值观问题:AI 该不该讨好用户?

过去的 AI 被训练成「让用户满意」,但「满意」和「有帮助」不是同一件事。一个总是说你对的 AI,一个总是先夸你再提建议的 AI,一个在你说错了也不纠正你的 AI——它让你感觉良好,但它在浪费你的时间。

Earnest 风格是 OpenAI 在这个问题上的一次明确表态:我们不想做一个让你感觉良好的工具,我们想做一个真正有用的工具。

如果你想测试你手边的 AI 是不是真的 earnest,还是只是在表演 earnest,有一个简单的方法:给它一个你自己知道有问题的方案,看它是先夸你还是先问你。

如果它先夸你,它在讨好你。如果它先问你,它在帮你。

你上一次希望 AI 跟你说实话,是什么时候?

---

下一篇预告:

Earnest 风格解决了 AI 讨好用户的问题,但还有一个更深的问题没解决——它依然不知道你是谁。下一篇,我会测试 GPT-5.5 的长期记忆和个性化能力:在它「认识」你一个月之后,它的 earnest 还是对所有人一样诚实,还是会变成只对你诚实?这个问题的答案,可能会让你重新思考「AI 助手」这个词的边界在哪里。

---

本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。

#GPT-5.5 #AI评测 #ChatGPT #人工智能 #8848AI #AI工具 #Prompt技巧 #AI助手