分类: AI工具测评

AI工具测评未读

本地AI Agent实战评测：Codex CLI、Claude Code、Cursor、Aider，谁才是你的代码搭档？ ⚠️ 评测说明：本文评测于2025年7月，基于各工具当时的公开版本。本地AI Agent迭代极快，建议结合文章发布日期参考。你可能已经为Cursor付了订阅费，或者在ChatG

2026-05-14

AI工具测评未读

你让AI处理的那份合同，到底被存在哪里？你有没有认真想过这个问题：上周你让ChatGPT帮你分析的那份竞争对手报告，那份含着你公司季度营收数据的Excel，那张写满客户联系方式的表格——它们现在在哪里？存了多久？谁有权限看到？大多数人的回答是：不知道，也没想过。这不是在制造恐慌。只是当Per

2026-05-14

AI工具测评未读

Perplexity把最贵的GPU集群拿来跑最大的开源模型——你以为你会变快，但先别急着高兴 Perplexity把地球上最贵的GPU集群拿来跑全球最大的开源模型——你以为你会变快，但先别急着高兴。这不是在泼冷水。而是因为，技术报告里最闪亮的数字，和你实际等待第一个字出现的那几秒，中间隔着好几层没

2026-05-13

AI工具测评未读

一台300万美元的服务器在为你工作，但你感受到了吗？你在Perplexity上提了一个问题，0.8秒后第一个字出现在屏幕上。你可能觉得"还不错，挺快的"，然后继续往下读。但你不知道的是：那0.8秒背后，是一台价值约300-400万美元的服务器集群在为你的这个问题全力运转。一台服务器的成本，大约

2026-05-13

AI工具测评未读

Coursera和Udemy合并了，但这件事对中国AI学习者没你想的那么重要 Coursera和Udemy宣布合并，很多人第一反应是"好事啊，两个平台的课程合在一起，资源更多了"。我测了一圈中文区的AI课程之后，我的判断是：对大多数中国AI学习者来说，这件事没你想的那么重要。重要的是另一件事。 -

2026-05-12

AI工具测评未读

高强度模式不是万能药：我用20个真实PR测出了Cursor Bugbot的"最佳用法" 我以为高强度模式会全面碾压默认模式。结果有一类PR，它反而多报了3个不存在的Bug——全是幻觉，没有一个能复现。这是一个月前我在团队内部做Cursor Bugbot深度测试时遇到的第一个反直觉时刻。那天我盯着

2026-05-12

AI工具测评未读

你每天用的AI里，只有一个有人名——Claude的「人格化」设计值不值？你有没有注意到一件事：GPT、Gemini、Copilot、文心一言——这些AI的名字都是品牌名、产品名，或者功能描述。唯独Claude，是个人名。这不是起名偏好的问题。Anthropic不仅给它起了人名，还专门出版了一本

2026-05-12

AI工具测评未读

Cursor Bugbot「思考深度」实测：高强度模式真的值得开吗？同一个PR，默认模式给出的结论是「代码逻辑清晰，无明显问题」。高强度模式在同一份diff上，找出了一个在并发请求下会触发的竞态条件——两个异步操作共享同一个未加锁的状态变量，低并发下几乎不会复现，但一旦上线流量上来，就是一个难以

2026-05-12

AI工具测评未读

Cursor Bugbot 思考深度对比评测：高强度模式到底值不值？你有没有遇到过这种情况—— Bugbot 审完一个 PR，绿灯放行，信心满满合并进主分支。结果上线之后，一个边界条件没处理，线上报错，复盘时发现那段逻辑就在 Bugbot 扫过的文件里。你盯着那条 AI 审查评论看了半天，心想：

2026-05-12

AI工具测评未读

我以为「思考深度」是噱头，直到它在PR里挖出一个藏了三个月的Bug 我以为"思考深度"只是个营销词。直到某天下午，高强度模式在我们一个看起来"平平无奇"的PR里，揪出了一个边界case——那段代码在我们的代码库里已经静静躺了三个月，经过了至少四轮人工Review，没人发现。那一刻我盯着屏幕沉默了

2026-05-12