AI工具测评
未读
Codex CLI、Claude Code等本地Agent实测
本地AI Agent实战评测:Codex CLI、Claude Code、Cursor、Aider,谁才是你的代码搭档? ⚠️ 评测说明:本文评测于2025年7月,基于各工具当时的公开版本。本地AI Agent迭代极快,建议结合文章发布日期参考。 你可能已经为Cursor付了订阅费,或者在ChatG
AI工具测评
未读
你让AI处理的那份合同,到底被存在哪里?
你让AI处理的那份合同,到底被存在哪里? 你有没有认真想过这个问题: 上周你让ChatGPT帮你分析的那份竞争对手报告,那份含着你公司季度营收数据的Excel,那张写满客户联系方式的表格——它们现在在哪里?存了多久?谁有权限看到? 大多数人的回答是:不知道,也没想过。 这不是在制造恐慌。只是当Per
AI工具测评
未读
Perplexity把最贵的GPU集群拿来跑最大的开源模型——你以为你会变快,但先别急着高兴
Perplexity把最贵的GPU集群拿来跑最大的开源模型——你以为你会变快,但先别急着高兴 Perplexity把地球上最贵的GPU集群拿来跑全球最大的开源模型——你以为你会变快,但先别急着高兴。 这不是在泼冷水。而是因为,技术报告里最闪亮的数字,和你实际等待第一个字出现的那几秒,中间隔着好几层没
AI工具测评
未读
一台300万美元的服务器在为你工作,但你感受到了吗?
一台300万美元的服务器在为你工作,但你感受到了吗? 你在Perplexity上提了一个问题,0.8秒后第一个字出现在屏幕上。 你可能觉得"还不错,挺快的",然后继续往下读。 但你不知道的是:那0.8秒背后,是一台价值约300-400万美元的服务器集群在为你的这个问题全力运转。一台服务器的成本,大约
AI工具测评
未读
Coursera和Udemy合并了,但这件事对中国AI学习者没你想的那么重要
Coursera和Udemy合并了,但这件事对中国AI学习者没你想的那么重要 Coursera和Udemy宣布合并,很多人第一反应是"好事啊,两个平台的课程合在一起,资源更多了"。 我测了一圈中文区的AI课程之后,我的判断是:对大多数中国AI学习者来说,这件事没你想的那么重要。重要的是另一件事。 -
AI工具测评
未读
高强度模式不是万能药:我用20个真实PR测出了Cursor Bugbot的"最佳用法"
高强度模式不是万能药:我用20个真实PR测出了Cursor Bugbot的"最佳用法" 我以为高强度模式会全面碾压默认模式。 结果有一类PR,它反而多报了3个不存在的Bug——全是幻觉,没有一个能复现。 这是一个月前我在团队内部做Cursor Bugbot深度测试时遇到的第一个反直觉时刻。那天我盯着
AI工具测评
未读
你每天用的AI里,只有一个有人名——Claude的「人格化」设计值不值?
你每天用的AI里,只有一个有人名——Claude的「人格化」设计值不值? 你有没有注意到一件事:GPT、Gemini、Copilot、文心一言——这些AI的名字都是品牌名、产品名,或者功能描述。 唯独Claude,是个人名。 这不是起名偏好的问题。Anthropic不仅给它起了人名,还专门出版了一本
AI工具测评
未读
Cursor Bugbot「思考深度」实测:高强度模式真的值得开吗?
Cursor Bugbot「思考深度」实测:高强度模式真的值得开吗? 同一个PR,默认模式给出的结论是「代码逻辑清晰,无明显问题」。 高强度模式在同一份diff上,找出了一个在并发请求下会触发的竞态条件——两个异步操作共享同一个未加锁的状态变量,低并发下几乎不会复现,但一旦上线流量上来,就是一个难以
AI工具测评
未读
Cursor Bugbot 思考深度对比评测:高强度模式到底值不值?
Cursor Bugbot 思考深度对比评测:高强度模式到底值不值? 你有没有遇到过这种情况—— Bugbot 审完一个 PR,绿灯放行,信心满满合并进主分支。结果上线之后,一个边界条件没处理,线上报错,复盘时发现那段逻辑就在 Bugbot 扫过的文件里。 你盯着那条 AI 审查评论看了半天,心想:
AI工具测评
未读
我以为「思考深度」是噱头,直到它在PR里挖出一个藏了三个月的Bug
我以为「思考深度」是噱头,直到它在PR里挖出一个藏了三个月的Bug 我以为"思考深度"只是个营销词。 直到某天下午,高强度模式在我们一个看起来"平平无奇"的PR里,揪出了一个边界case——那段代码在我们的代码库里已经静静躺了三个月,经过了至少四轮人工Review,没人发现。 那一刻我盯着屏幕沉默了