AI工具测评
未读
我让三个AI同时帮我操控Mac桌面,账单差了6倍
我让三个AI同时帮我操控Mac桌面,账单差了6倍 我把同一件事交给三个AI做:整理桌面文件、写周报、发邮件。 Perplexity用了4分钟,磕磕绊绊地完成了前两步,在发邮件时卡住了。Codex在批量重命名文件夹这一步卡了将近20分钟,token像流水一样哗哗消耗。Claude悄悄问了我一个确认问题
AI工具测评
未读
我用Perplexity PC做了三个真实工作任务,结果喜忧参半
我用Perplexity PC做了三个真实工作任务,结果喜忧参半 周三下午三点,我同时收到了三条消息。 领导要整理好的项目文件,客户催的跟进邮件,财务要更新的报表。 我没有叫助理,我打开了Perplexity PC。 --- 在写这篇文章之前,我想先说清楚我的立场:我不是来替Perplexity P
AI工具测评
未读
AI帮你操控电脑?我用同一个任务测了 Perplexity PC 和 Codex Computer Use
AI帮你操控电脑?我用同一个任务测了 Perplexity PC 和 Codex Computer Use 你有没有想过,有一天你对电脑说一句话,它就自己把活干完了——不是语音助手那种"好的,已为您搜索",而是真的打开文件夹、移动文件、写文档、点确认。 这件事,2025年突然有两个产品同时在做了。
AI工具测评
未读
Perplexity PC 深度实测:它能帮你省掉鼠标,但别指望它帮你省掉脑子
Perplexity PC 深度实测:它能帮你省掉鼠标,但别指望它帮你省掉脑子 我让它把桌面上47个截图按日期归类。 它做到了——用了11分钟。我自己做大概要3分钟。 但它没有崩溃,没有乱删,没有把2024年的文件扔进2023年的文件夹。这件事本身,就值得我们认真聊一聊。 这篇文章不吹不黑。所有结论
AI工具测评
未读
GPT 全链路中文流式写稿实测:别只看“能回答”,要看“能不能交稿”
这次不是空谈模型能力,而是实测 GPT 在真实博客写稿链路里的稳定性:能回答,不等于能稳定交稿;能交稿,才算真生产力。
AI工具测评
未读
别再纠结 GPT 和 Claude 谁更会写代码:我用同一个待办应用,跑出一套“双模型协作”开发工作流
别再纠结 GPT 和 Claude 谁更强了。真正高效的 AI 编程,不是单模型站队,而是按任务分工,把不同模型放进同一套开发工作流。
AI工具测评
未读
Coding 神器大混战:GPT-5.4 vs Claude Opus 4.6,2026 年谁才是代码王?
GPT-5.4 和 Claude Opus 4.6 到底谁更适合写代码?这篇文章不讲空话,直接从原型、重构、debug 和真实开发节奏出发,讲清楚两者的核心差别。
AI工具测评
未读
AI出镜视频工具中文实测:HeyGen、Synthesia、D-ID,谁在说"人话"?
AI出镜视频工具中文实测:HeyGen、Synthesia、D-ID,谁在说"人话"? 你花了3小时做的AI出镜视频,观众看了3秒就划走了。 不是因为脚本写得差,不是因为数字人不好看——是因为那张嘴,根本没在说你写的字。 上个月,我帮一个做美妆的朋友测试AI出镜工具,用Synthesia生成了一段6
AI工具测评
未读
Codex 替你填表?我花两小时测了「多步骤表单」,结论比你想的更复杂
Codex 替你填表?我花两小时测了「多步骤表单」,结论比你想的更复杂 Codex 能帮你写代码这件事你已经知道了。 但它能不能替你填表?我花了两个小时测试,结论比我预期的更复杂。 不是"能",也不是"不能"——是"要看情况,而且情况比官网说的更苛刻"。 市面上关于 Codex 的评测,九成以上停在
AI工具测评
未读
我以为Gamma会赢——直到投资人在那页没有图表的PPT上停下来问问题
我以为Gamma会赢——直到投资人在那页没有图表的PPT上停下来问问题 我以为Gamma会赢。 做这个测试之前,我的预判是:Gamma视觉完成度更高,生成速度更快,对于融资Deck这种"颜值即正义"的场景,它应该碾压Claude Design。 结果最让投资人停下来追问的那一页,是Claude做的。