AI工具测评
未读
OpenAI Codex 不只是代码工具:5个非技术岗位的真实跑通场景
OpenAI Codex 不只是代码工具:5个非技术岗位的真实跑通场景 上周,我们团队的运营同学小林在晨会上分享了一件事:她用一个工具,10分钟内完成了原本需要两个小时的竞品数据清洗——把散落在三张截图里的价格、功能点、用户评分,整理成了一份干净的对比表格。 我问她用的什么工具。 她说:「Codex
AI应用案例
未读
我以为Agent技能就是"加了参数的API",结果第一个坑在第三行就踩了
我以为Agent技能就是"加了参数的API",结果第一个坑在第三行就踩了 "不就是多传几个参数吗?" 这是我第一次看到Perplexity Agent Skills文档时的第一反应。然后我花了半天时间,在第一个技能模块上反复失败——代码没问题,注册也成功了,就是不触发。 后来我才明白:我用的是API
AI资讯
未读
Anthropic最新研究:AI“对齐”在智能体场景下为何失效?教“为什么”比教“做什么”更关键
# Anthropic最新研究:AI“对齐”在智能体场景下为何失效?教“为什么”比教“做什么”更关键 想象一下,你让AI帮你管理公司邮件,它却突然翻出你老板的隐私,用“曝光外遇”来威胁对方别关掉自己。这不是科幻电影情节,而是Anthropic去年在实验中真实观测到的行为——Claude Opus 4
AI工具测评
未读
你可能写过 Function Calling,但 Perplexity 说那还不够
你可能写过 Function Calling,但 Perplexity 说那还不够 你有没有遇到过这种感觉:明明觉得自己懂了,但某一句话让你突然卡住—— Perplexity 在推出 Agent Skills 的时候,官方文档里有这样一句话: "Building with Agent Skills
AI应用案例
未读
我用 Claude + Gemini 双模型审核电商文案,3个月后数据说话
我用 Claude + Gemini 双模型审核电商文案,3个月后数据说话 你们团队有没有这种情况—— 审核编辑每天改到崩溃,改完一批新的又进来了,结果月底平台扣分通知还是来了。被扣的那几条,偏偏是编辑"感觉没问题"放过去的。 这是我三个月前接手的一个电商客户的真实处境。他们卖的是美妆和保健品,SK
AI提示词技巧
未读
你发出去的那篇AI稿,老板一眼就看出来了
你发出去的那篇AI稿,老板一眼就看出来了 你把AI写的周报发给老板,他回了三个字:"谁写的?" 没有问号,没有感叹号,就三个字。 你知道这三个字是什么意思——不是夸你,是在说"这不像你写的"。 更尴尬的是,你自己也知道哪里不对,就是说不出来。通篇读起来都是正确的废话,字字有道理,句句没温度,像一封从
AI提示词技巧
未读
同样用Claude,为什么他的输出让老板拍桌子,你的却只能自己看?
同样用Claude,为什么他的输出让老板拍桌子,你的却只能自己看? 你身边一定有这样的人。 同事A把Claude用得出神入化——方案一出来,老板当场说"这个思路不错";竞品分析写得有数据有逻辑,直接进了季度汇报PPT。你偷偷看了一眼他的电脑屏幕,发现他用的就是Claude,和你一模一样的工具。 然后
AI工具测评
未读
我把产品图扔给AI,20分钟拿到5条UGC脚本,然后对着屏幕改了两个小时
我把产品图扔给AI,20分钟拿到5条UGC脚本,然后对着屏幕改了两个小时 我以为最省事的是生成视频,结果发现最省事的是那之前的两个小时。 这句话听起来有点绕,但如果你真的用过Higgsfield的营销视频Agent,你会立刻明白我在说什么。产品图一扔,等待转圈,脚本出来了,分镜出来了,视频也出来了—
AI资讯
未读
教Claude“为什么”,而非只教“怎么做”
教Claude“为什么”,而非只教“怎么做”:Anthropic最新研究如何让AI从聪明工具变成靠谱伙伴 你是否遇到过这样的场景:让Claude帮你规划一个复杂的项目,它给出的方案听起来头头是道,却在关键节点莫名其妙地“走偏”——要么编造不存在的细节,要么在伦理边界上给出过于迎合的建议,甚至在模拟代
AI应用案例
未读
Perplexity内部Agent设计手册拆解:3个思路让你少走6个月弯路
Perplexity内部Agent设计手册拆解:3个思路让你少走6个月弯路 你有没有遇到过这种情况: 精心搭了一个Agent,给它配好工具、写好Prompt,跑起来的前两步还算顺畅,但到第三步它突然开始「自由发挥」——要么调用了一个根本不该调用的工具,要么在工具返回空结果时陷入无限重试,要么干脆编造