AI工具测评
未读
Grok Build公测实测:Plan Mode真的能帮你"想清楚",但有一段路还得自己走
Grok Build公测实测:Plan Mode真的能帮你"想清楚",但有一段路还得自己走 我在Plan Mode里输入了一句话—— "帮我做一个可以追踪每日喝水量的小工具,支持提醒和历史记录查看。" 然后它给我返回了一张我自己都没想清楚的架构图:前端用React,本地存储用IndexedDB,提醒
AI工具测评
未读
你的开发机有多「透明」?我用 Bumblebee 扫了一遍,后背发凉
你的开发机有多「透明」?我用 Bumblebee 扫了一遍,后背发凉 装了 Bumblebee,跑完第一次扫描,我盯着终端输出愣了大概十秒钟。 Ollama 的 API 端口,一直在对我整个局域网开放着。不是"可能",是"一直在"。从我第一次 ollama serve 开始,到扫描结果出来的那一刻,
AI工具测评
未读
Gemini真的能"看懂"视频?我用三个中文场景测了个底朝天
Gemini真的能"看懂"视频?我用三个中文场景测了个底朝天 emollick把一段会议视频扔进去,它分析出了每个人的情绪变化曲线。 我把家长会录屏扔进去——它先问我:这个视频是什么语言? 这不是在黑Gemini。这是在说:测评演示和真实使用之间,有一段没人告诉你的距离。这篇文章想把这段距离量清楚。
AI工具测评
未读
Codex Steer vs Queue 实战评测:长流程任务跑偏时,你该抓方向盘还是贴便利贴?
Codex Steer vs Queue 实战评测:长流程任务跑偏时,你该抓方向盘还是贴便利贴? 你有没有遇到过这种情况—— 让 Codex 跑一个几百个文件的批量重构任务,眼睁睁看着它跑了二十分钟,突然意识到:它在用错误的命名规范改代码。 你的第一反应是什么?停掉重来?还是硬着头皮等它跑完再人工修
AI工具测评
未读
你用 DALL·E 生的每一张图,现在都带着一个隐形身份证
你用 DALL·E 生的每一张图,现在都带着一个隐形身份证 你用 DALL·E 生了一张产品配图,发到小红书,收到了不错的数据。 然后有一天,你的甲方拿着一个网页链接找你谈话——他们查到了这张图的"出生证明":什么时候生成的、用的什么模型、是不是经过人工修改。 这不是科幻小说,这是 C2PA 水印正
AI工具测评
未读
我跑了一下Perplexity开源的Mac安全扫描工具,然后默默关掉了咖啡馆的WiFi
我跑了一下Perplexity开源的Mac安全扫描工具,然后默默关掉了咖啡馆的WiFi 我知道你的Mac里是什么样的。 Ollama跑着本地模型,Jupyter Notebook开着,.env文件里散落着OpenAI、Claude、Gemini的API Key,SSH密钥连着三四个远程服务器,~/.
AI工具测评
未读
Gemini 视频理解实测:三个普通人真实会遇到的场景,摸清它的天花板
Gemini 视频理解实测:三个普通人真实会遇到的场景,摸清它的天花板 上周我把一段 15 分钟的会议录屏发给了 GPT-4o。 它回来给我一段总结,读起来非常流畅,逻辑清晰,格式规整。然后我对着原始录屏逐字核查,发现那个让整个团队沉默了三分钟的预算削减决定,在它的总结里完全不存在。 它没有说错什么
AI工具测评
未读
全模态 vs 多模态:我用三个日常任务测了一下,差距比我想象的更具体
全模态 vs 多模态:我用三个日常任务测了一下,差距比我想象的更具体 上周在一家云南菜馆,我把菜单拍给 AI 看,它回我一句:"请描述一下菜单上有什么。" 我当时就愣了。我拍给你,不就是因为我不想打字吗? 这件事让我开始认真想一个问题:"全模态"到底解决的是不是这个问题? 还是说,它只是一个更好听的
AI工具测评
未读
Cohere Command A+ 低硬件部署实测拆解
Cohere Command A+ 低硬件部署实测拆解:两张 4090 能跑,但你可能不是那个"能跑"的人 Cohere 说,Command A+ 只需要两张 4090 就能本地运行——这句话是真的。 但在这句话后面,藏着一个没人告诉你的前提:那个"能跑"的场景,比你想象的窄得多。 过去几个月,陆续
AI工具测评
未读
CapCut × Gemini 集成深度评测:在对话框里剪视频,到底省了什么、又丢了什么?
CapCut × Gemini 集成深度评测:在对话框里剪视频,到底省了什么、又丢了什么? "把第3分钟到第5分钟的片段加个J-cut转场。" 我把这句话输进Gemini,等了三秒。 它给我剪了一个完全不同的地方。 这不是段子,这是我第一次认真测试CapCut × Gemini集成时的真实遭遇。那一