AI提示词技巧
未读
同一条Prompt,GPT-4o满分,轻量模型翻车——问题不在模型,在你的写法
同一条Prompt,GPT-4o满分,轻量模型翻车——问题不在模型,在你的写法 上周我帮一个朋友排查一个奇怪的问题。 他用 Cohere Command A+ 搭了一套客服自动回复系统,测试阶段效果还不错,上线之后却频繁"答非所问"——用户问退款流程,模型给了一段产品介绍;用户说"我很生气",模型回
AI资讯
未读
一个1946年的数学难题被AI解开,普通人真正该学的不是“崇拜”,而是“拆题”
一个1946年的数学难题被AI解开,普通人真正该学的不是“崇拜”,而是“拆题” 如果你最近刷到这条新闻,第一反应大概率是:AI 又进化了。 但这件事最值得普通人关注的,不是“AI有多神”,而是它已经能在结构化推理、复杂拆解、证据整合上显著提效;与此同时,它依然不是“自动正确”,而是一个更强的思考助手
AI工具测评
未读
Cohere Command A+ 低硬件部署实测拆解
Cohere Command A+ 低硬件部署实测拆解:两张 4090 能跑,但你可能不是那个"能跑"的人 Cohere 说,Command A+ 只需要两张 4090 就能本地运行——这句话是真的。 但在这句话后面,藏着一个没人告诉你的前提:那个"能跑"的场景,比你想象的窄得多。 过去几个月,陆续
AI应用案例
未读
Claude Code /usage 命令:第一次真正「看见」你的 AI 成本
Claude Code /usage 命令:第一次真正「看见」你的 AI 成本 你上个月的 Claude 账单,你能说清楚每一笔吗? 大概率不能。 不是因为你不在乎钱,而是根本没有工具让你看清楚。你知道总数,但不知道结构。这种感觉不是「花多了」,而是失控——像在黑屋子里烧柴,只知道热,不知道烧的是什
AI工具测评
未读
CapCut × Gemini 集成深度评测:在对话框里剪视频,到底省了什么、又丢了什么?
CapCut × Gemini 集成深度评测:在对话框里剪视频,到底省了什么、又丢了什么? "把第3分钟到第5分钟的片段加个J-cut转场。" 我把这句话输进Gemini,等了三秒。 它给我剪了一个完全不同的地方。 这不是段子,这是我第一次认真测试CapCut × Gemini集成时的真实遭遇。那一
AI工具测评
未读
Grok进了opencode,我测了60组任务后的真实结论
Grok进了opencode,我测了60组任务后的真实结论 我原本以为Grok只是Claude的平替——便宜一点、速度差不多、将就能用。 测完之后发现这个判断是错的。在某些场景,它不是平替,是降维打击。但也有场景,我宁愿多花钱用Claude,因为Grok"发挥过度"把我代码改坏了两次。 这篇文章不是
AI工具测评
未读
这周AI圈最重要的更新,不是某个模型变聪明了
这周AI圈最重要的更新,不是某个模型变聪明了 这周AI圈最重要的更新,不是某个模型变聪明了——而是AI开始知道自己花了你多少钱。 你可能没注意到,过去七天里,三件看起来毫不相关的事同时发生了: Claude Code在终端里上线了 /usage 命令 xAI把Grok推进了命令行工具(CLI)环境
AI应用案例
未读
一个人用AI批量处理5000条电商评论:流水线搭建全记录
一个人用AI批量处理5000条电商评论:流水线搭建全记录 "第87条评论,我已经不知道'还行吧'算好评还是中评了。" 这不是段子,这是我某个周三下午三点半的真实状态。屏幕上是一个Excel表格,左边一列是评论原文,右边几列是我要手动填的标签:情感倾向、问题类目、关键词。我的手指悬在键盘上,盯着"还行
AI提示词技巧
未读
低硬件跑大模型,你省下的显存可能被自己的Prompt吃掉了
低硬件跑大模型,你省下的显存可能被自己的Prompt吃掉了 Cohere Command A+发布的时候,大家都在讨论一件事:111B参数,只需要2张A100就能跑。 这个数字确实让人眼前一亮。同量级的模型,Llama 3 70B至少需要4张A100,Mixtral 8x22B更是动辄要6-8张——
AI提示词技巧
未读
我做了20组Prompt反例实验,有6组结果让我彻底傻眼
我做了20组Prompt反例实验,有6组结果让我彻底傻眼 "给Prompt加反例,AI就会更听话。" 这句话我信了将近半年。直到有一次,我在一个角色扮演任务的Prompt里认认真真写了三条反例——"不要用这种语气"、"不要出现这类措辞"——结果模型输出的对话,读起来像一个被反复纠正到神经质的客服机器