AI工具测评
未读
Gemini真的能"看懂"视频?我用三个中文场景测了个底朝天
Gemini真的能"看懂"视频?我用三个中文场景测了个底朝天 emollick把一段会议视频扔进去,它分析出了每个人的情绪变化曲线。 我把家长会录屏扔进去——它先问我:这个视频是什么语言? 这不是在黑Gemini。这是在说:测评演示和真实使用之间,有一段没人告诉你的距离。这篇文章想把这段距离量清楚。
AI工具测评
未读
Codex Steer vs Queue 实战评测:长流程任务跑偏时,你该抓方向盘还是贴便利贴?
Codex Steer vs Queue 实战评测:长流程任务跑偏时,你该抓方向盘还是贴便利贴? 你有没有遇到过这种情况—— 让 Codex 跑一个几百个文件的批量重构任务,眼睁睁看着它跑了二十分钟,突然意识到:它在用错误的命名规范改代码。 你的第一反应是什么?停掉重来?还是硬着头皮等它跑完再人工修
AI应用案例
未读
我亲自跑了那个刷屏的 Grok swarm Prompt,说说和单 Agent 真正的区别
我亲自跑了那个刷屏的 Grok swarm Prompt,说说和单 Agent 真正的区别 带着怀疑去的,带着三个发现回来了。 --- 几周前,一个 Prompt 在 AI 圈子里悄悄传开。不是那种"100个超级指令"合集,而是一份结构相当克制的指令——它的目的只有一个:让 Grok 的 sub-a
AI应用案例
未读
3人团队如何用AI API把月产能从40篇干到200篇:完整踩坑实录
3人团队如何用AI API把月产能从40篇干到200篇:完整踩坑实录 凌晨1点,我盯着屏幕上那篇改了三遍还是不对劲的稿子,突然意识到一件事: 我们团队3个人,每个月的内容产能上限是40篇——这个数字不是懒出来的,是物理极限。 选题要开会讨论,资料要手动检索,初稿要从零写起,改完还要针对不同平台分别排
AI提示词技巧
未读
Prompt 写法不同,结果差一个数量级——5 个真实场景对比实测
Prompt 写法不同,结果差一个数量级——5 个真实场景对比实测 同一个需求,交给同一个模型,两种 Prompt 写法,输出结果判若云泥。 这不是夸张。上周我在帮一位产品经理朋友优化工作流时,亲眼看到这样一幕:她用"帮我写一封合作邀约邮件"丢给 GPT,得到一封中规中矩、像模板填空的邮件;我改了
AI工具测评
未读
你用 DALL·E 生的每一张图,现在都带着一个隐形身份证
你用 DALL·E 生的每一张图,现在都带着一个隐形身份证 你用 DALL·E 生了一张产品配图,发到小红书,收到了不错的数据。 然后有一天,你的甲方拿着一个网页链接找你谈话——他们查到了这张图的"出生证明":什么时候生成的、用的什么模型、是不是经过人工修改。 这不是科幻小说,这是 C2PA 水印正
AI应用案例
未读
用 Gemini 2.5 Flash 审 8 万字合同
用 Gemini 2.5 Flash 审 8 万字合同:我踩了三次坑,总结出这套「锚定式 Prompt」 你拿到一份 80 页的 SaaS 采购合同,律师事务所报价 8000 元起步,交付周期三个工作日。 你打开 Gemini,把合同文本粘进去,输入一句话:"帮我看看这份合同有没有坑。" 然后你得到
AI资讯
未读
当默认模型开始替你做选择,AI 的竞争逻辑已经变了
当默认模型开始替你做选择,AI 的竞争逻辑已经变了 你今天打开 ChatGPT,默认模型可能已经悄悄换了;另一边,一家新玩家正在尝试把大模型的“跑得快不快、贵不贵”这件事重新定义。 这周 AI 圈最值得记住的,不是两个名词本身,而是两个底层门槛同时被重写了:一边是入口层,用户打开 AI 的第一体验被
AI应用案例
未读
你花了 40 分钟生了 20 张图,最后只用了 1 张——AI 生图该这样用
你花了 40 分钟生了 20 张图,最后只用了 1 张——AI 生图该这样用 每次用 AI 生图,你是不是都在经历这样的循环: 输入一段描述 → 生成结果差强人意 → 稍微改几个词 → 又生成一批 → 还是不满意 → 继续改 → 最后在一堆"差不多"的图里勉强挑一张凑合用。 40 分钟过去了,你有
AI资讯
未读
Google 把 Project Genie 接进街景后,地图不只是更好看了,而是开始能“用”了
Google 把 Project Genie 接进街景后,地图不只是更好看了,而是开始能“用”了 你大概率已经习惯了地图的三种用法:找路、看店、算距离。 但这次 Google 展示的方向,明显不是“把地图做得更清楚一点”这么简单。它更像是在说一件事:真实地点,开始变成可以被 AI 直接读取、提问、分