AI工具测评
未读
claude-opus-4-6 4.8 vs Codex High
claude-opus-4-6 4.8 vs Codex High:我用四类真实任务测了两周,结论让我意外 社区里最近出现了两种截然相反的声音。 一边是:"Opus 4.8 出来之后我直接把 Codex 关了,重构代码效率翻倍。" 另一边是:"不知道为什么,写代码还是切回 Codex,手感就是不一样
AI资讯
未读
ChatGPT 把翻译做成 Translation Block,真正改变的是工作流,不只是语言
ChatGPT 把翻译做成 Translation Block,真正改变的是工作流,不只是语言 高地苏格兰语出现在支持语言列表里时,很多人的第一反应不是“哇,居然支持这个”,而是“这不会只是凑个热闹吧?” 但恰恰是这个有点离谱的小细节,暴露了这次更新的重点:ChatGPT 正在把翻译能力从一个临时工
AI提示词技巧
未读
我以为是模型变差了,结果是我自己变懒了
我以为是模型变差了,结果是我自己变懒了 上周我在用 codex-auto-review 跑一个代码审查任务,Prompt 是从 Claude 那边直接复制过来的,一字未改。 输出结果让我愣了三秒。 不是报错,是那种"说了等于没说"的回答——泛泛的建议,没有针对性,格式也乱。我的第一反应是:这模型是不
AI应用案例
未读
Dynamic Workflows 不是更聪明的 if-else
Dynamic Workflows 不是更聪明的 if-else:用一个端口检测案例,拆解它和写死流程的 3 个本质差异 我照着最近热传的 Dynamic Workflows 案例跑了一遍,发现大多数人理解错了一件事。 不是说那些文章写错了——而是大家普遍把 Dynamic Workflows 理解
AI资讯
未读
OpenAI开始招机器人工程师,AI离“会做事”又近了一步
OpenAI开始招机器人工程师,AI离“会做事”又近了一步 如果你最近只把 AI 还理解成“会聊天、会写稿、会画图”,那这条新闻值得你停下来多看两眼:OpenAI开始招机器人工程师,Sam Altman也连续释放和机器人相关的信号。这不是一次普通的人事扩招,更像是一次路线切换——大模型公司正在从“让
AI应用案例
未读
我用Claude Code跑完一个真实项目:3次context断掉,3次救回来
我用Claude Code跑完一个真å®é¡¹ç›®ï¼š3次contextæ–æ‰ï¼Œ3æ¬¡æ•‘å›æ¥ ç¬¬äºŒæ¬¡æ–æ‰çš„æ—¶å€™ï¼Œæˆ‘们差点放弃。 䏿˜¯å› 为代ç 写ä¸ä¸‹å»ï¼Œè
AI提示词技巧
未读
你的 Prompt 写错了——Cursor 报告揭示的三个系统性失误
你的 Prompt 写错了——Cursor 报告揭示的三个系统性失误 你可能也这样写过: 帮我优化一下这个函数,让它跑得更快
然后等了十秒,拿到一个"看起来差不多"的输出,用了,没出问题,就以为这就是正确姿势。 直到某天 Agent 给你改出一个 bug,你花了两小时才找到根源——它在第一步就理解
AI应用案例
未读
AI 写完了一篇论文,但我第 4 轮就断了——长任务自动化的三个致命断点
AI 写完了一篇论文,但我第 4 轮就断了——长任务自动化的三个致命断点 最近 Wharton 教授 Ethan Mollick 发了一条让很多人沉默的推文。 他用 claude-opus-4-6 4.5 在 Claude Code 里完成了两件事:一篇有完整结构的学术论文草稿,和一个可以运行的 R
AI资讯
未读
Anthropic估值继续抬高后,普通人该选 Claude 还是 GPT-4o?
Anthropic估值继续抬高后,普通人该选 Claude 还是 GPT-4o? 你看到 Anthropic 的估值又往上走,第一反应大概率是:这家公司更值钱了,Claude 是不是马上就要“起飞”了? 但对普通用户来说,这条新闻真正值得关心的,不是“它值多少钱”,而是钱会怎么变成产品体验:模型迭代
AI工具测评
未读
Claude Opus 4.8 实测:基准分数涨了,我的开发效率涨了吗?
Claude Opus 4.8 实测:基准分数涨了,我的开发效率涨了吗? 三周前,我在 Cursor 里卡了整一个下午。 一个 React 组件的状态管理逻辑,跨了四个文件,涉及一个自定义 Hook 和两个 Context。我当时用的是 Claude Opus 4.7,补全了七八轮,模型一直在"理解