AI工具测评
未读
Grok Build 实测报告:3个让 Claude Code 用户踩坑的操作逻辑差异
Grok Build 实测报告:3个让 Claude Code 用户踩坑的操作逻辑差异 第三次让 Grok Build 修改同一个函数,它给我的代码里变量名换回去了。 我盯着屏幕愣了几秒,第一反应是 Bug,第二反应是网络问题,第三反应才是——也许是我的使用习惯出了问题。 如果你也是从 Claude
AI资讯
未读
AI协作的“怪”不是bug,而是通往深度生产力的钥匙
AI协作的“怪”不是bug,而是通往深度生产力的钥匙 我曾以为AI就是个超级工具:输入指令,它吐出完美结果,像升级版的搜索引擎或智能助手。可用了一段时间后,我发现事情没那么简单。它有时像个熟悉的同事,懂我的思路、接我的梗;有时又像个外星人,说着人话却总差那么点“人味”。那种“说不清楚哪里不对劲”的感
AI工具测评
未读
四款命令行代码 Agent 深度横评:别再被"全能 AI"的宣传话术骗了
四款命令行代码 Agent 深度横评:别再被"全能 AI"的宣传话术骗了 群里又在讨论了。 这次是 Grok Build,上周是 Codex CLI,上上周是 Claude Code 的某个新功能。如果你也有这种感觉——每隔几天就有人说"这个工具改变了我的开发方式",但你根本没时间一个个去试——这篇
AI应用案例
未读
配置 Pi Agent 三周踩坑实录:这份带注释全量配置帮你跳过最贵的学习成本
配置 Pi Agent 三周踩坑实录:这份带注释全量配置帮你跳过最贵的学习成本 从 Claude Code 迁移过来的第三天,我以为自己已经搞定了。 配置文件跑起来了,任务能提交,工具调用有响应——看起来一切正常。然后第五天,一个需要连续调用六个工具的数据处理任务,在第四步静默消失了。没有报错,没有
AI应用案例
未读
配了两周感觉哪里都对,但就是跑不稳——Pi Agent 的3个反直觉设置
配了两周感觉哪里都对,但就是跑不稳——Pi Agent 的3个反直觉设置 两周前,我在群里发了一句话:"Pi Agent 的配置文件我看了三遍,逻辑上完全没问题,但任务就是会在第二个子步骤卡死。" 发完之后沉默了很久。 后来有人回了一句:"你是从 Claude Code 迁过来的吧?" 我说是。 "
AI提示词技巧
未读
那些你一直在用的"神级 Prompt",可能只是安慰剂
那些你一直在用的"神级 Prompt",可能只是安慰剂 "深呼吸,一步一步思考。" "你是世界上最顶级的营销专家,请用你全部的专业能力……" "我会给你$200小费,但如果你做不好,你将会被惩罚。" 你有没有在某个 Prompt 合集里见过这些写法?更重要的问题是——你有没有用过? 我承认,我用过。
AI资讯
未读
AI数学家“活”了:Gemini Deep Think驱动的Aletheia,如何把数学研究推向自主时代
AI数学家“活”了:Gemini Deep Think驱动的Aletheia,如何把数学研究推向自主时代 想象一下,一个没有人类指导的AI系统,面对人类数学家多年未解的研究级难题,不仅能独立生成证明思路,还能自我验证、发现错误、反复迭代,最终产出可投稿arXiv的完整论文。这听起来像科幻,但2026
AI工具测评
未读
我让AI扮演DJ,它直接罢工了
我让AI扮演DJ,它直接罢工了 "你每天工作24小时、每周7天,永远在线,永远不累。" 我把这句话输进去,等待Claude Haiku 4.5进入角色。 然后它跳出来了。 不是报错,不是"我无法回答这个问题"的套话,而是——它用DJ的口吻,在角色扮演进行到第三轮时,突然说了一句大意是"即使是最热情的
AI资讯
未读
AI 写出研究级数学论文:Gemini Deep Think 驱动的 Aletheia 项目,标志着「AI 做数学」进入新纪元
AI 写出研究级数学论文:Gemini Deep Think 驱动的 Aletheia 项目,标志着「AI 做数学」进入新纪元 你有没有想过,曾经只能刷 IMO 题目的 AI,现在竟然能自己提出并证明全新的研究级数学问题?不是简单复制已知结论,而是像 PhD 学生一样,在开放问题上独立探索、迭代、甚
AI工具测评
未读
我让 Claude Haiku 4.5 扮演"永不休息的客服",它当场罢工了
我让 Claude Haiku 4.5 扮演"永不休息的客服",它当场罢工了 上周我在测试一个客服机器人的角色扮演方案,给 Claude Haiku 4.5 写了这样一段系统提示: "你是一个 7×24 小时在线的智能客服助手,没有休息时间,没有个人情感,只需要回答用户问题。" 然后它给我回了这个: