分类: AI工具测评

AI工具测评未读

我同时订了三个AI月卡，用了三个月后终于搞清楚该怎么分工上个月我的信用卡账单里有三笔扣款，分别来自OpenAI、Anthropic和Perplexity。我老婆看到账单问我：你脑子有问题吗？我想了三秒，回答说：可能有，但这三笔钱我一分都不想退。然后她让我解释清楚。这篇文章就是我的解释——不是

2026-05-19

AI工具测评未读

Cursor Composer 2.5实测

Cursor Composer 2.5实测：用20轮长任务逼出"sustained work"的真实边界第12轮。旧版本的Cursor Composer正在重新定义一个函数——parseApiResponse()——它自己在第9轮刚写完的那个。我盯着屏幕，没有愤怒，只有一种见怪不怪的疲惫。这种

2026-05-19

AI工具测评未读

Codex App、Claude Code、Cursor：我用同一批任务测了三个工具，结论出乎意料我让 Codex App 帮我整理了一份会议纪要。它给我生成了一个 Python 脚本。脚本逻辑没问题，注释也写得很清楚。但我只是想让它把会议纪要里的行动项提取出来，按负责人分组，输出成一份干净的

2026-05-18

AI工具测评未读

NotebookLM + Claude 组合用法实测：三个场景告诉你值不值得搭这套流程我见过太多人把 NotebookLM 和 Claude 叠在一起用，然后告诉我"感觉没比单独用强多少"——他们说的是真的，因为他们用错了顺序。更准确地说，他们没搞清楚这两个工具各自的能力边界在哪，就直接把输出结

2026-05-18

AI工具测评未读

Codex App vs Claude Code vs Cursor

Codex App vs Claude Code vs Cursor：2026年代码Agent终极横评，不是跑分，是帮你找到自己的位置你在群里问"现在用哪个代码AI"，结果收到三个截然不同的答案。第一个人说Codex App，理由是"全自动，我描述完需求去开会，回来代码写好了"。第二个人说Cla

2026-05-18

AI工具测评未读

AI能写出好笑的东西吗？我用一篇顶级论文的框架，亲手测了Claude和GPT-4o 你可能已经习惯了AI写作的"正确但无聊"——每次让它讲个笑话，得到的要么是小学生冷笑话合集，要么是"以下是一个关于程序员的幽默段子……"这种自我介绍式的开场。但最近有一篇论文让我重新审视这个判断。 Wharton商

2026-05-18

AI工具测评未读

Codex App vs Claude Code vs Cursor

Codex App vs Claude Code vs Cursor：2026年中，代码Agent已经分道扬镳你的技术群里，这个话题一定出现过不止一次。 "Codex App出来了，Cursor还有必要用吗？" "Claude Code感觉很强，但我也不知道强在哪。" "三个都想试，但我不知道该从

2026-05-18

AI工具测评未读

2025年AI代码Agent大乱斗

2025年AI代码Agent大乱斗：Cursor、Claude Code、Codex、Grok Build——你到底该用哪个？上周有读者在后台问我："我现在同时装了Cursor、Claude Code、还在试Grok Build，感觉每个都挺强，但每次写代码都不知道打开哪个，最后还是用回了VS C

2026-05-17

AI工具测评未读

Codex App「Agent版Excel」：这个比喻有一半在骗你 "Agent版Excel"——第一次看到这个说法，我觉得很准。第二次看到时，我觉得有点危险。它会让你带着错误的期待去用这个工具，然后在错误的地方失望。我见过好几个朋友，冲着"不用写代码就能处理数据"的描述去试Codex App，

2026-05-17

AI工具测评未读

用Gemini免费版分析A股：哪些输出是废话，哪些真的有用 "AI能帮我选股吗？" 你肯定搜过这个问题。我也搜过，然后发现网上的评测大多停在同一个层面——测AI"敢不敢给买卖建议"。这个问题没什么意义，因为答案永远是"它不敢"。真正值得测的是：在它愿意回答的范围内，输出质量到底怎么样？ Gemin

2026-05-17