AI工具测评
未读
我同时订了三个AI月卡,用了三个月后终于搞清楚该怎么分工
我同时订了三个AI月卡,用了三个月后终于搞清楚该怎么分工 上个月我的信用卡账单里有三笔扣款,分别来自OpenAI、Anthropic和Perplexity。我老婆看到账单问我:你脑子有问题吗? 我想了三秒,回答说:可能有,但这三笔钱我一分都不想退。 然后她让我解释清楚。 这篇文章就是我的解释——不是
AI工具测评
未读
Cursor Composer 2.5实测
Cursor Composer 2.5实测:用20轮长任务逼出"sustained work"的真实边界 第12轮。 旧版本的Cursor Composer正在重新定义一个函数——parseApiResponse()——它自己在第9轮刚写完的那个。 我盯着屏幕,没有愤怒,只有一种见怪不怪的疲惫。这种
AI工具测评
未读
Codex App、Claude Code、Cursor:我用同一批任务测了三个工具,结论出乎意料
Codex App、Claude Code、Cursor:我用同一批任务测了三个工具,结论出乎意料 我让 Codex App 帮我整理了一份会议纪要。 它给我生成了一个 Python 脚本。 脚本逻辑没问题,注释也写得很清楚。但我只是想让它把会议纪要里的行动项提取出来,按负责人分组,输出成一份干净的
AI工具测评
未读
NotebookLM + Claude 组合用法实测:三个场景告诉你值不值得搭这套流程
NotebookLM + Claude 组合用法实测:三个场景告诉你值不值得搭这套流程 我见过太多人把 NotebookLM 和 Claude 叠在一起用,然后告诉我"感觉没比单独用强多少"——他们说的是真的,因为他们用错了顺序。 更准确地说,他们没搞清楚这两个工具各自的能力边界在哪,就直接把输出结
AI工具测评
未读
Codex App vs Claude Code vs Cursor
Codex App vs Claude Code vs Cursor:2026年代码Agent终极横评,不是跑分,是帮你找到自己的位置 你在群里问"现在用哪个代码AI",结果收到三个截然不同的答案。 第一个人说Codex App,理由是"全自动,我描述完需求去开会,回来代码写好了"。第二个人说Cla
AI工具测评
未读
AI能写出好笑的东西吗?我用一篇顶级论文的框架,亲手测了Claude和GPT-4o
AI能写出好笑的东西吗?我用一篇顶级论文的框架,亲手测了Claude和GPT-4o 你可能已经习惯了AI写作的"正确但无聊"——每次让它讲个笑话,得到的要么是小学生冷笑话合集,要么是"以下是一个关于程序员的幽默段子……"这种自我介绍式的开场。 但最近有一篇论文让我重新审视这个判断。 Wharton商
AI工具测评
未读
Codex App vs Claude Code vs Cursor
Codex App vs Claude Code vs Cursor:2026年中,代码Agent已经分道扬镳 你的技术群里,这个话题一定出现过不止一次。 "Codex App出来了,Cursor还有必要用吗?" "Claude Code感觉很强,但我也不知道强在哪。" "三个都想试,但我不知道该从
AI工具测评
未读
2025年AI代码Agent大乱斗
2025年AI代码Agent大乱斗:Cursor、Claude Code、Codex、Grok Build——你到底该用哪个? 上周有读者在后台问我:"我现在同时装了Cursor、Claude Code、还在试Grok Build,感觉每个都挺强,但每次写代码都不知道打开哪个,最后还是用回了VS C
AI工具测评
未读
Codex App「Agent版Excel」:这个比喻有一半在骗你
Codex App「Agent版Excel」:这个比喻有一半在骗你 "Agent版Excel"——第一次看到这个说法,我觉得很准。 第二次看到时,我觉得有点危险。 它会让你带着错误的期待去用这个工具,然后在错误的地方失望。我见过好几个朋友,冲着"不用写代码就能处理数据"的描述去试Codex App,
AI工具测评
未读
用Gemini免费版分析A股:哪些输出是废话,哪些真的有用
用Gemini免费版分析A股:哪些输出是废话,哪些真的有用 "AI能帮我选股吗?" 你肯定搜过这个问题。我也搜过,然后发现网上的评测大多停在同一个层面——测AI"敢不敢给买卖建议"。这个问题没什么意义,因为答案永远是"它不敢"。 真正值得测的是:在它愿意回答的范围内,输出质量到底怎么样? Gemin