AI工具测评
未读
AI问数据库,我真的去试了——Perplexity Computer接Snowflake,非技术用户能用吗?
AI问数据库,我真的去试了——Perplexity Computer接Snowflake,非技术用户能用吗? 如果你是运营或产品,你有多少次想直接问数据库一个问题,却要等数据分析师排期? Perplexity说,现在你可以自己来。 我信了,然后我去试了。 --- 第一章:这不是小功能更新,是产品边界
AI工具测评
未读
我用一个「刁钻」的创意任务,把 Higgsfield 的「自学习 Agent」拆开看了看
我用一个「刁钻」的创意任务,把 Higgsfield 的「自学习 Agent」拆开看了看 测完之后,我最想说的不是它有多强,而是:「自学习」这三个字,你有没有想过怎么才算被证伪? 大多数 Agent 评测在验证「能不能用」,而这篇文章想验证「说法是否成立」。这个区别,值得你花 10 分钟读完。 --
AI工具测评
未读
Grok Voice Think Fast 1.0 中文实测
Grok Voice Think Fast 1.0 中文实测:3个真的不一样的地方,1个让我劝你别急着换 上周我用ChatGPT语音模式问了一句话:"帮我查一下明天北京有没有什么出行限制。" 它给了我一段很流畅的回答——但信息停在了将近两年前。语调自然,内容过期。就像一个说话很好听、但已经两年没看新
AI工具测评
未读
Grok Voice Think Fast 1.0 深度实测
Grok Voice Think Fast 1.0 深度实测:它真的比 ChatGPT 语音模式更聪明吗? 上周,我让语音 AI 帮我分析一份租房合同。 说到第二个问题——"第七条的违约金条款有没有问题"——它已经忘了房子在哪个城市,忘了我之前说的是整租还是合租,甚至开始用北京的法规给我解释上海的合
AI工具测评
未读
我用自然语言问了 Snowflake 一个问题,它给了我一个完美的错误答案
我用自然语言问了 Snowflake 一个问题,它给了我一个完美的错误答案 "上个季度哪个地区的退货率最高?" 我把这句话输进 Perplexity Computer,它几乎秒回:西南区,退货率 12.3%,比全国均值高出 4.1 个百分点,并附上了一张干净的柱状图。 看起来完美。直到我发现,它查的
AI工具测评
未读
用中文问数据库,我把 Perplexity + Snowflake 这条路走了一遍
用中文问数据库,我把 Perplexity + Snowflake 这条路走了一遍 "上个月哪个城市的用户留存最差?" 这句话,一个运营同学说出来,以前的标准流程是:提需求→等数据分析师排期→3天后拿到一张Excel→发现口径不对→再等2天。 Perplexity 最近推出的 Computer 功能
AI工具测评
未读
本地AI编程Agent横评:五款工具,哪个值得你现在就装上?
本地AI编程Agent横评:五款工具,哪个值得你现在就装上? Ethan Mollick最近发了一条让很多人沉默的推文,大意是:Gemini的长上下文能力本来应该在本地Agent赛道上形成碾压优势,但它还在观望,而其他工具已经在真实开发者的工作流里跑了好几个月了。 我看到这条推文的第一反应不是"Ge
AI工具测评
未读
你的同事把客户手机号拖进了ChatGPT——这件事到底有多严重?
你的同事把客户手机号拖进了ChatGPT——这件事到底有多严重? 你的同事把一份含有客户手机号的Excel,直接拖进了ChatGPT。 这个场景,你可能亲眼见过,或者自己就干过。 我们来看这件事到底有多严重,又有多被夸大——然后用三个可操作的测试场景,找到Perplexity Computer和Ch
AI工具测评
未读
我用渗透测试Prompt跑了Mythos和GPT-5.5一整轮——结论出乎意料
我用渗透测试Prompt跑了Mythos和GPT-5.5一整轮——结论出乎意料 上周,AI研究者emollick在X上发了一条让安全圈炸锅的帖子,大意是:Mythos在网络安全任务上的表现,已经让他感到"不安"。他没有给出详细的测试数据,但这句话足够引爆讨论——因为emollick不是那种随便说话的
AI工具测评
未读
Gemini 2.5 Pro vs Claude 4.6实测
Gemini 2.5 Pro vs Claude Sonnet 4.6:内容创作者的真实对比测评 你有没有试过,把同一篇稿子的需求分别发给两个 AI,结果一个给你写出了教科书,另一个给你写出了朋友圈? 这不是段子,这是我上周真实经历的事。同一个 Prompt,发给 Gemini 2.5 Pro,回来