AI工具测评
未读
测评 invideo Agent One:我以为它会颠覆视频行业,结果最费时间的环节它一点没碰
测评 invideo Agent One:我以为它会颠覆视频行业,结果最费时间的环节它一点没碰 我以为测完会写一篇"颠覆视频行业"的稿子。 结果我花了最多时间的那个环节——最终剪辑节奏和平台合规审查——它一点没碰。 但这并不意味着它没用。恰恰相反,它让我重新想清楚了一件事:AI 工具的价值,从来不在
AI工具测评
未读
新 Siri、Claude Code、OpenAI Codex 同台竞技
新 Siri、Claude Code、OpenAI Codex 同台竞技:我用同一个任务喂了三个 AI,结果差点把文件夹搞崩 上周我同时开着新 Siri 和 Claude Code,结果两个 AI 同时在帮我"处理文件"——一个在系统层调度,一个在终端里跑脚本,最后文件夹乱成一团,脚本路径全错,报告
AI工具测评
未读
Cursor vs Windsurf:我把两款 AI 编辑器都用到想砸键盘,然后写了这篇
Cursor vs Windsurf:我把两款 AI 编辑器都用到想砸键盘,然后写了这篇 我见过太多"用了30分钟"的对比评测。 这篇不一样——我在同一个项目里,把两款工具都用到了想砸键盘的程度。 具体说:一个包含落地页、用户注册登录、后台数据看板的小型全栈 SaaS 项目,Node.js + Ex
AI工具测评
未读
所有AI都叫代号,只有它有人名——Claude的"人格"到底影响了什么
所有AI都叫代号,只有它有人名——Claude的"人格"到底影响了什么 所有主流AI都叫产品代号。GPT是"Generative Pre-trained Transformer"的缩写,Gemini是谷歌选的星座名,Grok是科幻小说里的词。 只有它有一个人名:Claude。 这不是偶然。Anthr
AI工具测评
未读
GPT-5.5实测:1M上下文到底有没有用?我用5个真实任务告诉你
GPT-5.5实测:1M上下文到底有没有用?我用5个真实任务告诉你 我把一份8万字的产品文档丢给它,它没有崩溃。 然后我把同样的文档丢给GPT-5.4——它崩了。 这是我测试GPT-5.5的第一个小时,也是这篇文章存在的原因。 不是要告诉你"GPT-5.5发布了快去用"——你已经被这种标题轰炸麻木了
AI工具测评
未读
我用「退休策略师级别」Prompt测了Claude三天,结论比你想象的更复杂
我用「退休策略师级别」Prompt测了Claude三天,结论比你想象的更复杂 "它帮我算出来,退休需要存800万。" 朋友发来这条消息时,我正好在刷到第三篇关于"Claude能替代财务顾问"的帖子。那个数字让我停了一下——不是因为太高或太低,而是因为我想知道:这个数字背后,它用了什么假设? 这个问题
AI工具测评
未读
调用API是在用工具,搭建Skills是在设计意图
调用API是在用工具,搭建Skills是在设计意图——Perplexity这份手册,把开发者的升级路径写明白了 Perplexity的Agent Skills开发手册里有这么一句话: "Skills需要新的开发者思维(Skills require a new developer mindset)。"
AI工具测评
未读
你以为学会调API就学会了Agent开发?Perplexity的手册第一页就在打这个脸
你以为学会调API就学会了Agent开发?Perplexity的手册第一页就在打这个脸 "不就是把LLM包一层,加几个工具调用吗?" 如果你也这么想过,那你和我当初犯了一样的错误。 三个月前,我在做一个基于Agent的客服系统。功能跑通了,演示效果很好,单轮对话完全没问题。但一上线,用户一旦进入多轮
AI工具测评
未读
调用 API 是在"问",写 Skills 是在"授权"
调用 API 是在"问",写 Skills 是在"授权"——Perplexity 手册里藏着3个反直觉的 Agent 开发铁律 大多数开发者读官方文档的方式是这样的:跳过前言,跳过设计哲学,直接找"Quick Start",复制代码,跑起来,完事。 Perplexity 的 Agent Skills
AI工具测评
未读
我不会写代码,但用 Codex 跑完了今天最烦的三件事
我不会写代码,但用 Codex 跑完了今天最烦的三件事 今天开完那个拖了两小时的周会,我面对着一份乱得像弹幕字幕的会议录音转写,第一反应不是打开 Word,而是打开了 Codex。 结果是:40 分钟后,纪要整理好了,任务清单拆完了,五封跟进邮件草稿也发出去了。 我不会写一行代码。 --- 第一章: