分类: AI工具测评

AI工具测评未读

Grok Build公测实测：Plan Mode真的能帮你"想清楚"，但有一段路还得自己走

Grok Build公测实测：Plan Mode真的能帮你"想清楚"，但有一段路还得自己走我在Plan Mode里输入了一句话—— "帮我做一个可以追踪每日喝水量的小工具，支持提醒和历史记录查看。" 然后它给我返回了一张我自己都没想清楚的架构图：前端用React，本地存储用IndexedDB，提醒

2026-05-26

AI工具测评未读

你的开发机有多「透明」？我用 Bumblebee 扫了一遍，后背发凉

你的开发机有多「透明」？我用 Bumblebee 扫了一遍，后背发凉装了 Bumblebee，跑完第一次扫描，我盯着终端输出愣了大概十秒钟。 Ollama 的 API 端口，一直在对我整个局域网开放着。不是"可能"，是"一直在"。从我第一次 ollama serve 开始，到扫描结果出来的那一刻，

2026-05-25

AI工具测评未读

Gemini真的能"看懂"视频？我用三个中文场景测了个底朝天

Gemini真的能"看懂"视频？我用三个中文场景测了个底朝天 emollick把一段会议视频扔进去，它分析出了每个人的情绪变化曲线。我把家长会录屏扔进去——它先问我：这个视频是什么语言？这不是在黑Gemini。这是在说：测评演示和真实使用之间，有一段没人告诉你的距离。这篇文章想把这段距离量清楚。

2026-05-25

AI工具测评未读

Codex Steer vs Queue 实战评测：长流程任务跑偏时，你该抓方向盘还是贴便利贴？

Codex Steer vs Queue 实战评测：长流程任务跑偏时，你该抓方向盘还是贴便利贴？你有没有遇到过这种情况—— 让 Codex 跑一个几百个文件的批量重构任务，眼睁睁看着它跑了二十分钟，突然意识到：它在用错误的命名规范改代码。你的第一反应是什么？停掉重来？还是硬着头皮等它跑完再人工修

2026-05-25

AI工具测评未读

你用 DALL·E 生的每一张图，现在都带着一个隐形身份证

你用 DALL·E 生的每一张图，现在都带着一个隐形身份证你用 DALL·E 生了一张产品配图，发到小红书，收到了不错的数据。然后有一天，你的甲方拿着一个网页链接找你谈话——他们查到了这张图的"出生证明"：什么时候生成的、用的什么模型、是不是经过人工修改。这不是科幻小说，这是 C2PA 水印正

2026-05-25

AI工具测评未读

我跑了一下Perplexity开源的Mac安全扫描工具，然后默默关掉了咖啡馆的WiFi

我跑了一下Perplexity开源的Mac安全扫描工具，然后默默关掉了咖啡馆的WiFi 我知道你的Mac里是什么样的。 Ollama跑着本地模型，Jupyter Notebook开着，.env文件里散落着OpenAI、Claude、Gemini的API Key，SSH密钥连着三四个远程服务器，~/.

2026-05-23