AI工具测评
未读
Grok进了opencode,我测了60组任务后的真实结论
Grok进了opencode,我测了60组任务后的真实结论 我原本以为Grok只是Claude的平替——便宜一点、速度差不多、将就能用。 测完之后发现这个判断是错的。在某些场景,它不是平替,是降维打击。但也有场景,我宁愿多花钱用Claude,因为Grok"发挥过度"把我代码改坏了两次。 这篇文章不是
AI工具测评
未读
这周AI圈最重要的更新,不是某个模型变聪明了
这周AI圈最重要的更新,不是某个模型变聪明了 这周AI圈最重要的更新,不是某个模型变聪明了——而是AI开始知道自己花了你多少钱。 你可能没注意到,过去七天里,三件看起来毫不相关的事同时发生了: Claude Code在终端里上线了 /usage 命令 xAI把Grok推进了命令行工具(CLI)环境
AI应用案例
未读
一个人用AI批量处理5000条电商评论:流水线搭建全记录
一个人用AI批量处理5000条电商评论:流水线搭建全记录 "第87条评论,我已经不知道'还行吧'算好评还是中评了。" 这不是段子,这是我某个周三下午三点半的真实状态。屏幕上是一个Excel表格,左边一列是评论原文,右边几列是我要手动填的标签:情感倾向、问题类目、关键词。我的手指悬在键盘上,盯着"还行
AI提示词技巧
未读
低硬件跑大模型,你省下的显存可能被自己的Prompt吃掉了
低硬件跑大模型,你省下的显存可能被自己的Prompt吃掉了 Cohere Command A+发布的时候,大家都在讨论一件事:111B参数,只需要2张A100就能跑。 这个数字确实让人眼前一亮。同量级的模型,Llama 3 70B至少需要4张A100,Mixtral 8x22B更是动辄要6-8张——
AI提示词技巧
未读
我做了20组Prompt反例实验,有6组结果让我彻底傻眼
我做了20组Prompt反例实验,有6组结果让我彻底傻眼 "给Prompt加反例,AI就会更听话。" 这句话我信了将近半年。直到有一次,我在一个角色扮演任务的Prompt里认认真真写了三条反例——"不要用这种语气"、"不要出现这类措辞"——结果模型输出的对话,读起来像一个被反复纠正到神经质的客服机器
AI资讯
未读
一个 1946 年老数学题被 AI 推进后,我更关心的不是答案
一个 1946 年老数学题被 AI 推进后,我更关心的不是答案 你最近如果刷到这条新闻,第一反应大概率是:“数学题?和我有什么关系?” 但这恰恰是最值得追问的地方。 OpenAI 最近在一个 1946 年提出的老数学难题 上取得了进展。表面上看,这是学术圈的一次突破;往深一点看,它更像一次能力体检—
AI资讯
未读
GPT-5.5 和 DeepSeek V4 同日登场:别只看谁更强,先看谁更适合你的任务
GPT-5.5 和 DeepSeek V4 同日登场:别只看谁更强,先看谁更适合你的任务 同一天,两个顶级模型一起升级,表面上像是“新版本发布”,实际更像两条路线正面碰撞:一边更强调 Coding 落地、工具链和工程效率,一边更强调 通用智能、复杂推理和 AGI 的边界感。 但现实里,大多数人根本不
AI资讯
未读
Claude Code 开始给 AI 工作流记账:/usage 让隐形成本第一次可见
Claude Code 开始给 AI 工作流记账:/usage 让隐形成本第一次可见 很多人第一次认真算 AI 成本,往往不是在使用当下,而是在月底。 白天看起来只是“多用了几个 Agent”“又接了两个 MCP”“让模型顺手帮我查了点资料”,结果回头一看,真正烧钱的地方,可能根本不是主任务,而是那
AI工具测评
未读
我把同一段代码扔给两个顶级 AI,更贵的那个差点让我的服务器崩掉
我把同一段代码扔给两个顶级 AI,更贵的那个差点让我的服务器崩掉 那是一个周三下午,我在赶一个数据处理脚本的 deadline。 我把一段有 bug 的 Python 函数扔给了当时订阅的"旗舰模型",它给了我一个看起来无懈可击的修复方案——注释清晰、逻辑严密、格式漂亮。我没多想就跑进了测试环境。
AI资讯
未读
Gemini 接上 CapCut 之后,自媒体剪辑会发生什么变化?
Gemini 接上 CapCut 之后,自媒体剪辑会发生什么变化? 很多自媒体人最痛的,不是不会剪,而是剪辑这件事总被一堆“来回切换”拖慢:先写脚本,再找素材,打开剪辑软件,调字幕,改封面,最后还要反复回头修。真正耗时间的,往往不是某一个动作,而是动作之间那一长串断点。 所以,当 Gemini 和