我把 200 个乱七八糟的文件丢给两款 AI,结果差异大到让我重新理解了"AI 操作电脑"这件事
我把 200 个乱七八糟的文件丢给两款 AI,结果差异大到让我重新理解了"AI 操作电脑"这件事
我下载文件夹里躺着 200 多个文件。
文件名从 微信图片_20230916_143022.jpg 到 final_final_v3_真的最终版.docx,中间夹着几十个叫不出来源的 PDF、一堆截图、三四个同名但大小不同的压缩包,还有若干个我完全不记得为什么下载的 .exe。
这是一个真实存在的混乱现场。我把它丢给了两款最近被频繁讨论的 AI 产品:Perplexity Personal Computer 和 OpenAI Codex computer use。
结果差异大到让我重新思考一件事:"AI 操作电脑"这个词,其实描述的是两种完全不同的能力。
读完这篇文章,你会得到:一份对比清单、一次真实任务测试的完整记录、以及一个"你是谁就用谁"的决策框架。
---
第一章:先把概念说清楚——这两个根本不是同类产品
很多人看到 Perplexity PC 和 Codex computer use 的新闻,第一反应是"哦,又是两个 AI 帮你操作电脑的东西"。
这个理解是错的,而且错得很彻底。
Perplexity Personal Computer 的核心能力是"读懂你电脑里的内容"。 它本质上是一个 AI 原生的本地搜索和问答层——它会索引你的本地文件,理解文件内容的语义,然后以对话的方式回答你关于这些文件的问题。你可以问它"帮我找上个月所有和项目 A 相关的文档",它能给你一个语义级别的检索结果,而不是简单的文件名匹配。 OpenAI Codex computer use 的核心能力是"替你操作电脑"。 它是一个代理式执行系统——你给它一个任务描述,它会调用系统 API、执行终端命令、移动文件、创建文件夹、批量重命名,整个过程像一个会写代码的助手在你的电脑上实际动手干活。用一张表来把差异说清楚:
| 维度 | Perplexity Personal Computer | OpenAI Codex computer use | | 核心定位 | 本地内容理解 + 语义搜索 | 代理式任务执行 | | 技术路径 | 本地索引 + LLM 问答 | 代码生成 + 系统 API 调用 | | 执行方式 | 给建议,用户手动确认 | 直接执行,可设置自动化程度 | | 权限模型 | 读权限为主,写操作需确认 | 读写权限,可直接修改文件系统 | | 隐私风险 | 相对低,本地索引 | 相对高,操作链路更深 | | 适合人群 | 小白、隐私敏感用户、知识工作者 | 开发者、重度自动化需求用户 | | 最大优势 | 语义理解准确,操作安全 | 执行能力强,真正的"自动化" | | 最大短板 | 不能真正"动手",自动化程度低 | 黑盒操作,出错难回滚 |一句话总结:Perplexity PC 是一个懂你文件的聪明助理,Codex computer use 是一个会动手的执行机器人。它们解决的是同一个问题的两个不同子集。
---
第二章:实测任务设计——为什么选"整理本地文件"
我选这个任务是有意为之的,因为它对两款产品都构成真实压力。
整理本地文件这件事,需要同时具备两种能力:
1. 理解内容:你得知道这个 PDF 是合同还是发票,这张截图是产品图还是聊天记录,这个压缩包里装的是什么——光靠文件名根本不够。
2. 执行操作:理解完了还得真的动手,移动文件、新建文件夹、批量重命名,这些都是写入操作。
这两个能力,恰好对应 Perplexity PC 和 Codex 各自的强项和弱项。所以这个任务是个公平的压力测试,不偏向任何一方。
测试环境说明:- 文件夹:本地下载目录,共 217 个文件
- 文件类型:PDF(约 60 个)、图片(约 80 个,含截图和照片)、Word/Excel 文档(约 30 个)、代码文件(约 20 个)、压缩包(约 15 个)、其他(约 12 个)
- 混乱程度:文件名命名风格混乱,有中文有英文,有日期有无日期,有约 15 个明显重复文件(同名不同大小或内容相同但文件名不同)
- 任务目标:将文件夹整理成有逻辑的分类结构,清理重复文件,重命名命名混乱的文件
---
第三章:Perplexity PC 实测——它在哪里赢、在哪里输
索引过程
Perplexity PC 的第一步是建立本地索引。我把下载文件夹加入索引范围后,它开始扫描文件内容。217 个文件,索引完成大约用了不到 3 分钟——速度相当快,体感上比我预期的要轻量。
索引完成后,我用自然语言提问:"帮我分析这个文件夹里的文件,给我一个整理方案。"
理解结果
Perplexity PC 给出的分析结果让我有点意外——它真的在"读"文件内容,而不是只看文件名。
它识别出了:
- 那 60 个 PDF 里,有 23 个是合同类文件,14 个是技术文档,11 个是发票/收据,剩下的是各类报告
- 图片里,它区分出了产品截图、聊天记录截图、照片三个大类
- 它还标记出了 12 对疑似重复文件,其中有几对文件名完全不同,但内容高度相似
它给出的整理方案是这样的结构:
📁 下载文件夹(整理后)
├── 📁 合同与法律文件
├── 📁 发票与收据
├── 📁 技术文档
├── 📁 截图与素材
│ ├── 📁 产品截图
│ └── 📁 聊天记录
├── 📁 代码与项目文件
├── 📁 待确认(疑似重复)
└── 📁 其他
语义理解的准确率相当高——我抽查了 30 个文件的分类建议,只有 3 个明显分错(2 个把技术报告误归入"其他",1 个把一份设计稿的 PDF 归入了"合同类")。
明显短板
但问题来了:Perplexity PC 只能给建议,不能真的动手。
每一个移动操作,它都需要我手动确认。217 个文件,如果逐一确认,体验接近于"AI 帮你看,你自己动手搬"。它没有"批量执行"的能力,也没有提供一个"一键应用整理方案"的选项。
我最终花了大约 20 分钟,手动完成了它建议的操作。这个过程中,AI 的价值是真实的(分类建议准确),但执行效率并没有显著提升。
---
第四章:Codex computer use 的同类任务表现
执行方式完全不同
Codex computer use 的交互逻辑和 Perplexity PC 是两个世界。
你给它一个任务描述,它开始生成并执行代码。整理文件这个任务,它调用的是 Python 脚本 + 系统文件操作 API,大概长这样:
import os
import shutil
from pathlib import Path
定义分类规则
CATEGORIES = {
"PDF文档": [".pdf"],
"图片素材": [".jpg", ".jpeg", ".png", ".gif", ".webp"],
"代码文件": [".py", ".js", ".ts", ".sh", ".json"],
"压缩包": [".zip", ".rar", ".7z", ".tar", ".gz"],
"Office文档": [".doc", ".docx", ".xls", ".xlsx", ".ppt", ".pptx"],
}
source_dir = Path("/Users/username/Downloads")
for file in source_dir.iterdir():
if file.is_file():
for category, extensions in CATEGORIES.items():
if file.suffix.lower() in extensions:
target_dir = source_dir / category
target_dir.mkdir(exist_ok=True)
shutil.move(str(file), str(target_dir / file.name))
break
这段代码会直接执行。文件真的会被移动。
执行能力的优势
Codex 在执行速度上完全碾压 Perplexity PC。同样 217 个文件,它大约用了 40 秒完成了所有移动操作,期间几乎不需要我介入。
批量重命名也是它的强项——我让它把所有截图文件按"截图_YYYYMMDD_序号"的格式重命名,它用一段正则替换脚本,30 秒内完成了 80 个文件的重命名。
但代价是什么
Codex 的分类逻辑是规则驱动的,不是语义驱动的。它按文件扩展名分类,这意味着:
- 所有 PDF 都被丢进了同一个文件夹,不管是合同还是发票还是技术文档
- 它识别不出来哪些文件是重复的(内容相同但文件名不同的情况,它完全看不出来)
- 它不会读文件内容,所以那份被命名为
aaa.pdf的合同,和那份叫截图20230916.pdf的发票,在它眼里是完全一样的东西
更严重的是风险问题。Codex 执行操作是真实的写入操作,一旦出错,文件可能被移动到错误位置,甚至在某些边缘情况下被覆盖。它有操作日志,但回滚需要手动操作,对不熟悉命令行的用户来说心理压力很大。
我在测试中就遇到了一个典型翻车场景:有一批文件名里带中文括号的文件,Codex 生成的脚本在处理路径时出现了编码问题,导致这部分文件没有被正确移动,而是留在了原地,但日志里显示"已处理"——如果不仔细检查,根本发现不了。
---
第五章:选哪个?给不同用户的决策建议
不绕弯子,直接给结论:
你是这类用户 → 选 Perplexity PC:- 不太懂命令行,不想承担"AI 帮我误删文件"的风险
- 对隐私比较敏感,不希望操作链路太深
- 主要需求是"找到"和"理解",而不是"自动化执行"
- 知识工作者,文件内容的语义分类比扩展名分类更重要
- 有一定技术背景,能看懂操作日志,出了问题能自己排查
- 重复性任务多,真的需要"一次配置、批量执行"的自动化
- 文件类型规律性强(比如全是代码文件、全是图片),规则驱动分类够用
- 时间比安全感更值钱
这两条路现在还是两个不同阶段的产品。Perplexity PC 代表的是"AI 作为内容理解层"的路线,Codex 代表的是"AI 作为执行代理"的路线。它们目前各有明显的天花板,也各有明显的地板。
但这两条路最终会合并——真正成熟的"AI 操作电脑"产品,一定是既能读懂内容语义,又能安全可靠地执行操作。只是这个融合点,现在还没有出现。
---
💡 想自己动手试试这两款产品?
国内直连 Perplexity 和 OpenAI 的访问问题,可以通过 [api.884819.xyz](https://api.884819.xyz) 解决——它同时支持 Perplexity API 和 OpenAI API 的统一调用,不用为每个产品单独配环境,对想做横向测评的读者尤其省事。注册即送体验 token,国产模型(Deepseek/千问等)完全免费,没有月租,按量付费,直接上手。
---
尾声:如果把这两款产品的能力拼在一起
测完这两款产品,我开始认真想一件事:
如果把 Perplexity 的语义理解能力和 Codex 的执行能力拼在一起,会是什么?不是简单的"两个产品套壳",而是真正在底层融合——用语义理解来驱动执行决策,用执行能力来落地理解结果,同时保留合理的权限控制和回滚机制。
巧的是,最近确实有产品在往这个方向走。下一篇我会拆解它,看看"理解+执行"真正合体之后,体验是不是真的 1+1>2,还是又一个看起来很美的 PPT 产品。
关注专栏,下篇见。---
本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。#AI工具评测 #Perplexity #OpenAI #Codex #AI操作电脑 #本地文件整理 #8848AI #AI效率工具