分类: AI进阶

AI提示词技巧未读

同一条Prompt，GPT-4o满分，轻量模型翻车——问题不在模型，在你的写法上周我帮一个朋友排查一个奇怪的问题。他用 Cohere Command A+ 搭了一套客服自动回复系统，测试阶段效果还不错，上线之后却频繁"答非所问"——用户问退款流程，模型给了一段产品介绍；用户说"我很生气"，模型回

14天前

AI资讯未读

一个1946年的数学难题被AI解开，普通人真正该学的不是“崇拜”，而是“拆题”

一个1946年的数学难题被AI解开，普通人真正该学的不是“崇拜”，而是“拆题” 如果你最近刷到这条新闻，第一反应大概率是：AI 又进化了。但这件事最值得普通人关注的，不是“AI有多神”，而是它已经能在结构化推理、复杂拆解、证据整合上显著提效；与此同时，它依然不是“自动正确”，而是一个更强的思考助手

14天前

AI工具测评未读

Cohere Command A+ 低硬件部署实测拆解

Cohere Command A+ 低硬件部署实测拆解：两张 4090 能跑，但你可能不是那个"能跑"的人 Cohere 说，Command A+ 只需要两张 4090 就能本地运行——这句话是真的。但在这句话后面，藏着一个没人告诉你的前提：那个"能跑"的场景，比你想象的窄得多。过去几个月，陆续

14天前

AI应用案例未读

Claude Code /usage 命令：第一次真正「看见」你的 AI 成本

Claude Code /usage 命令：第一次真正「看见」你的 AI 成本你上个月的 Claude 账单，你能说清楚每一笔吗？大概率不能。不是因为你不在乎钱，而是根本没有工具让你看清楚。你知道总数，但不知道结构。这种感觉不是「花多了」，而是失控——像在黑屋子里烧柴，只知道热，不知道烧的是什

14天前

AI工具测评未读

CapCut × Gemini 集成深度评测：在对话框里剪视频，到底省了什么、又丢了什么？

CapCut × Gemini 集成深度评测：在对话框里剪视频，到底省了什么、又丢了什么？ "把第3分钟到第5分钟的片段加个J-cut转场。" 我把这句话输进Gemini，等了三秒。它给我剪了一个完全不同的地方。这不是段子，这是我第一次认真测试CapCut × Gemini集成时的真实遭遇。那一

14天前

AI工具测评未读

Grok进了opencode，我测了60组任务后的真实结论

Grok进了opencode，我测了60组任务后的真实结论我原本以为Grok只是Claude的平替——便宜一点、速度差不多、将就能用。测完之后发现这个判断是错的。在某些场景，它不是平替，是降维打击。但也有场景，我宁愿多花钱用Claude，因为Grok"发挥过度"把我代码改坏了两次。这篇文章不是

14天前

AI工具测评未读

这周AI圈最重要的更新，不是某个模型变聪明了

这周AI圈最重要的更新，不是某个模型变聪明了这周AI圈最重要的更新，不是某个模型变聪明了——而是AI开始知道自己花了你多少钱。你可能没注意到，过去七天里，三件看起来毫不相关的事同时发生了： Claude Code在终端里上线了 /usage 命令 xAI把Grok推进了命令行工具（CLI）环境

14天前

AI应用案例未读

一个人用AI批量处理5000条电商评论：流水线搭建全记录

一个人用AI批量处理5000条电商评论：流水线搭建全记录 "第87条评论，我已经不知道'还行吧'算好评还是中评了。" 这不是段子，这是我某个周三下午三点半的真实状态。屏幕上是一个Excel表格，左边一列是评论原文，右边几列是我要手动填的标签：情感倾向、问题类目、关键词。我的手指悬在键盘上，盯着"还行

14天前

AI提示词技巧未读

低硬件跑大模型，你省下的显存可能被自己的Prompt吃掉了

低硬件跑大模型，你省下的显存可能被自己的Prompt吃掉了 Cohere Command A+发布的时候，大家都在讨论一件事：111B参数，只需要2张A100就能跑。这个数字确实让人眼前一亮。同量级的模型，Llama 3 70B至少需要4张A100，Mixtral 8x22B更是动辄要6-8张——

14天前

AI提示词技巧未读

我做了20组Prompt反例实验，有6组结果让我彻底傻眼

我做了20组Prompt反例实验，有6组结果让我彻底傻眼 "给Prompt加反例，AI就会更听话。" 这句话我信了将近半年。直到有一次，我在一个角色扮演任务的Prompt里认认真真写了三条反例——"不要用这种语气"、"不要出现这类措辞"——结果模型输出的对话，读起来像一个被反复纠正到神经质的客服机器

14天前