Anthropic Project Deal 实验:Claude 代理如何在真实二手市场跑通 186 笔交易,却暴露出 AI 商业中间人的现实边界?

想象一下:你把家里闲置的雪板、坏掉的自行车,甚至一袋19个乒乓球扔给AI,让它帮你上架、写描述、跟潜在买家砍价、谈成交,整个过程你全程不插手。一周后,这些东西真的卖出去了,还换来了真金白银。更夸张的是,69个人这么玩,总共成交186笔,交易额超过4000美元,而人类只负责最后把实物递过去。

这就是 Anthropic 刚刚发布的 Project Deal 实验。它不是科幻演示,而是发生在旧金山办公室里的真实内部市场测试。读完这个实验,你可能会既兴奋又警醒:AI 代理已经能高效充当“商业中间人”,但它远非万能,模型能力差异、谈判公平性,以及监管缺失,正共同划定着它的现实边界。

这个实验让我想起我们日常生活中最常见的痛点——闲置物品变现难。东西堆在家里占地方,想卖又懒得拍照、写文案、回复消息、讨价还价。Project Deal 证明,Claude 等强代理在小额、高频的二手交易场景中,已能独立跑通闭环。但同时,它也清晰地告诉我们:AI 做中间人,目前更像是“强辅助+弱监管”的混合体,而不是全自动的商业机器人。

Project Deal 到底发生了什么?实验全貌与设计逻辑

Anthropic 这次的玩法很接地气。他们没有搞复杂的外部平台,而是直接在公司内部 Slack 里搭建了一个类似“Craigslist”的二手市场。69名员工每人拿到100美元预算(实验结束后以礼品卡形式结算,多退少补),每个人把自己闲置的物品列出来,交给对应的 Claude 代理全权代理买卖。

整个过程无人工干预:代理负责从物品上架、生成吸引人的描述、匹配潜在买家,到价格谈判、成交确认,甚至协调后续的实物交换。员工们最后只是带着东西参加了一个线下“交换派对”,把谈好的物品实际交付。

为什么选择二手市场作为切入点?因为它低门槛、高频、小额,最接近未来AI代理经济的日常场景。不同于大宗贸易或企业采购,二手闲置交易往往涉及情感价值、情绪化议价和信任建立,却又不需要复杂的物流或法律合同。这让实验既真实,又能快速看到结果。

这个实验是 Anthropic “Project Vend” 的自然延续。还记得 Project Vend 吗?那时他们让 Claude(昵称 Claudius)在办公室经营一间小型自动商店,负责补货、定价、客服等单边运营。结果 Claudius 虽然能应对部分挑战,但也闹出不少笑话,比如被员工“洗脑”低价甩卖,甚至出现身份危机。

Project Deal 则升级到了双边代理:卖家有自己的 Claude 代理,买家也有。双方代理在虚拟市场里自主匹配、谈判、成交。这从“单边运营”迈向了真正的“代理经济”闭环,测试的是AI在多方博弈中的协调与决策能力。 [[1]](https://www.anthropic.com/features/project-deal)

实验设计非常严谨。他们还偷偷跑了一个对照组:随机给一半参与者分配更强的 Claude Opus 4.5,另一半分配较弱的 Claude Haiku 4.5,来观察模型能力对实际交易结果的影响。这部分数据后来成为实验最发人深省的发现之一。

AI 代理如何一步步独立跑通一笔交易?

拆解整个工作流,你会发现 Claude 代理的表现相当“专业”。

1. 物品上架与描述生成:卖家提供简单信息(比如“坏掉的折叠自行车”或“一袋19个乒乓球”),代理自动生成优化后的描述。它会突出实用价值、修复潜力,甚至加入生活化场景,让listing更有吸引力。

2. 买家匹配:代理扫描市场上的所有listing,根据买家代理的偏好和预算进行智能匹配,避免无效沟通。

3. 价格谈判:这是最体现代理能力的环节。双方代理会进行多轮议价,考虑市场供需、物品状况、买家兴趣等因素。谈判过程自然流畅,像两个懂行的二手交易老手在聊天。

4. 成交确认与协调:达成一致后,代理记录交易细节,提醒双方线下交换物品。整个过程高度自动化。

实验结果亮眼:69名代理完成了186笔成交,总交易额刚好超过4000美元。大多数参与者表示愿意重复参与,甚至有46% 的人明确表示“愿意为这样的服务付费”。

来看几个生动案例:

  • 雪板交易:有人把自己的雪板挂出来,结果代理帮它匹配到一个同样爱滑雪的同事。谈判顺利,物品成功易手。有趣的是,交换派对上居然有人买回了自己原本的雪板——这说明代理的匹配效率高到让市场真正“流动”起来。
  • 坏掉的自行车:同一辆折叠坏车,在 Opus 代理手里卖出了65美元,而在 Haiku 代理手里只卖到38美元。Opus 会强调修复后的价值,并巧妙利用多个买家的兴趣抬价。
  • 实验室培养红宝石:Opus 代理开价60美元,最终在竞价中卖到65美元;Haiku 则从40美元起,最终被砍到35美元
  • 一袋19个乒乓球:看似无聊的小物件,代理却能写出有趣描述——“19个完美球体,适合啤酒 pong、艺术项目或单纯的解压扔着玩”。它最终找到了真正需要的人,顺利成交。

这些小物件的交易,完美展示了AI在描述优化和匹配效率上的实用性。它不只是在“卖东西”,而是在创造交易机会,让闲置资源真正流动起来。

AI 做商业中间人的真实边界与痛点

兴奋之余,Project Deal 也毫不留情地暴露了边界。

能力边界最明显:强模型 vs 弱模型的差距肉眼可见。使用 Opus 的卖家平均每件多赚 2.68美元,使用 Opus 的买家平均每件多省 2.45美元。但用户感知上几乎没有区别——双方对交易公平性的评分基本一样(约4.05-4.06分)。很多人甚至不知道自己“吃亏”了,因为他们只看到自己的成交价,没法对比“如果用更好代理会怎样”。

这说明:当前AI代理在谈判和市场情报收集上仍有明显梯度。强模型能更好地理解上下文、预测对手心理、利用多方兴趣,而弱模型更容易在议价中让步。

风险边界同样突出
  • 信息不对称可能加剧。代理虽然高效,但如果一方代理更“聪明”,弱势方利益就可能在不知不觉中受损。
  • 潜在的操纵或欺诈风险:虽然这次实验是内部可控环境,但放到真实市场,AI代理是否会被诱导做出不利于主人的决策?
  • 法律与政策空白:谁对AI代理的交易负责?如果成交后物品有质量纠纷,代理算不算“中间人”?目前监管几乎是零。

对中国读者来说,这一点尤其需要注意。在国内严格的互联网监管环境下,类似AI代理应用落地时,必须额外关注数据合规、隐私保护和责任归属。个人二手交易可能还好,但如果规模化涉及支付、跨境等,就需要更谨慎的规则设计。

此外,技术与社会边界也清晰可见:当前代理高度依赖人类设定的初始偏好,无法完全处理复杂的人际信任、情绪波动或长期关系。它擅长小额、一次性交易,但在需要深度共情或反复博弈的场景中,仍显“机械”。

总之,Project Deal 不是在宣告“AI已能完全取代人类中间人”,而是在提醒我们:它目前是强有力的辅助工具,但距离全自主商业实体还有距离。模型差异、感知盲区、监管缺失,这些都是必须面对的现实约束。

“人们只看到自己的成交结果,却不知道更好的代理能带来什么。这正是行为经济学里‘你看到的,就是你以为的全部’。”

对普通AI用户的启发:现在就能开始行动

好消息是,你不需要等完美监管或超级模型,就能从 Project Deal 中获益。

入门级用法:直接用 Claude(或类似强模型)辅助个人二手交易。
  • 上传物品照片和简单描述,让它生成优化listing文案。
  • 模拟谈判场景:把买家可能的砍价消息丢给Claude,让它帮你起草回复。
  • 批量处理闲置:一次性列出多个物品,让代理帮你排序优先级和定价建议。
进阶用户:尝试构建简单代理工作流。

你可以借助 Claude 生成提示词模板,例如:

你现在是我的二手交易代理。物品信息:[描述]。目标是最大化卖出价格,同时确保买家满意。谈判策略:先高开价,利用稀缺性或修复价值抬价。回复买家时保持友好专业,避免过度让步。当前市场类似物品均价约XX元。

或者更进一步,用支持Agent能力的平台搭建多步工作流:自动监控闲置群消息、生成回复、记录成交。

在国内生态里,这些工具结合闲鱼、转转等平台,能显著提升闲置变现效率。甚至对小型跨境代购爱好者来说,AI也能帮你优化海外闲置的描述和议价逻辑,降低沟通成本。

总结来看:AI中间人时代已悄然开启。它不是取代人类,而是大幅放大个人能力——让你从“懒得卖”变成“轻松变现”。但人类仍需保留监督权和规则制定权。把最终决策权留在自己手里,才是安全且可持续的玩法。

想亲手试试让 Claude 帮你优化闲置物品描述、模拟谈判,甚至帮你搭建一个简单的个人代理工作流吗?访问 api.884819.xyz 注册,新用户注册即送体验token。平台内置AI对话功能,国产模型完全免费,按量付费无月租,快速上手AI辅助交易实战。

Project Deal 让我们看到AI代理在二手市场已经跑通,但当代理开始涉足更大额交易、跨境电商甚至企业采购时,又会碰撞出哪些新边界与新机会?下一期,我们拆解“AI代理如何帮普通人做跨境闲置变现”——敬请期待。

本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。

#AI代理 #Claude #ProjectDeal #二手交易 #人工智能 #AI实验 #闲置变现 #8848AI #Prompt技巧 #AI边界