分类: AI工具测评

AI工具测评未读

测评 invideo Agent One：我以为它会颠覆视频行业，结果最费时间的环节它一点没碰

测评 invideo Agent One：我以为它会颠覆视频行业，结果最费时间的环节它一点没碰我以为测完会写一篇"颠覆视频行业"的稿子。结果我花了最多时间的那个环节——最终剪辑节奏和平台合规审查——它一点没碰。但这并不意味着它没用。恰恰相反，它让我重新想清楚了一件事：AI 工具的价值，从来不在

2026-05-11

AI工具测评未读

新 Siri、Claude Code、OpenAI Codex 同台竞技

新 Siri、Claude Code、OpenAI Codex 同台竞技：我用同一个任务喂了三个 AI，结果差点把文件夹搞崩上周我同时开着新 Siri 和 Claude Code，结果两个 AI 同时在帮我"处理文件"——一个在系统层调度，一个在终端里跑脚本，最后文件夹乱成一团，脚本路径全错，报告

2026-05-11

AI工具测评未读

Cursor vs Windsurf：我把两款 AI 编辑器都用到想砸键盘，然后写了这篇

Cursor vs Windsurf：我把两款 AI 编辑器都用到想砸键盘，然后写了这篇我见过太多"用了30分钟"的对比评测。这篇不一样——我在同一个项目里，把两款工具都用到了想砸键盘的程度。具体说：一个包含落地页、用户注册登录、后台数据看板的小型全栈 SaaS 项目，Node.js + Ex

2026-05-11

AI工具测评未读

所有AI都叫代号，只有它有人名——Claude的"人格"到底影响了什么

所有AI都叫代号，只有它有人名——Claude的"人格"到底影响了什么所有主流AI都叫产品代号。GPT是"Generative Pre-trained Transformer"的缩写，Gemini是谷歌选的星座名，Grok是科幻小说里的词。只有它有一个人名：Claude。这不是偶然。Anthr

2026-05-11

AI工具测评未读

GPT-5.5实测：1M上下文到底有没有用？我用5个真实任务告诉你

GPT-5.5实测：1M上下文到底有没有用？我用5个真实任务告诉你我把一份8万字的产品文档丢给它，它没有崩溃。然后我把同样的文档丢给GPT-5.4——它崩了。这是我测试GPT-5.5的第一个小时，也是这篇文章存在的原因。不是要告诉你"GPT-5.5发布了快去用"——你已经被这种标题轰炸麻木了

2026-05-11

AI工具测评未读

我用「退休策略师级别」Prompt测了Claude三天，结论比你想象的更复杂

我用「退休策略师级别」Prompt测了Claude三天，结论比你想象的更复杂 "它帮我算出来，退休需要存800万。" 朋友发来这条消息时，我正好在刷到第三篇关于"Claude能替代财务顾问"的帖子。那个数字让我停了一下——不是因为太高或太低，而是因为我想知道：这个数字背后，它用了什么假设？这个问题

2026-05-10

AI工具测评未读

调用API是在用工具，搭建Skills是在设计意图

调用API是在用工具，搭建Skills是在设计意图——Perplexity这份手册，把开发者的升级路径写明白了 Perplexity的Agent Skills开发手册里有这么一句话： "Skills需要新的开发者思维（Skills require a new developer mindset）。"

2026-05-10