我把 200 个乱七八糟的文件丢给两款 AI,结果差异大到让我重新理解了"AI 操作电脑"这件事

我下载文件夹里躺着 200 多个文件。

文件名从 微信图片_20230916_143022.jpgfinal_final_v3_真的最终版.docx,中间夹着几十个叫不出来源的 PDF、一堆截图、三四个同名但大小不同的压缩包,还有若干个我完全不记得为什么下载的 .exe

这是一个真实存在的混乱现场。我把它丢给了两款最近被频繁讨论的 AI 产品:Perplexity Personal ComputerOpenAI Codex computer use

结果差异大到让我重新思考一件事:"AI 操作电脑"这个词,其实描述的是两种完全不同的能力。

读完这篇文章,你会得到:一份对比清单、一次真实任务测试的完整记录、以及一个"你是谁就用谁"的决策框架。

---

第一章:先把概念说清楚——这两个根本不是同类产品

很多人看到 Perplexity PC 和 Codex computer use 的新闻,第一反应是"哦,又是两个 AI 帮你操作电脑的东西"。

这个理解是错的,而且错得很彻底。

Perplexity Personal Computer 的核心能力是"读懂你电脑里的内容"。 它本质上是一个 AI 原生的本地搜索和问答层——它会索引你的本地文件,理解文件内容的语义,然后以对话的方式回答你关于这些文件的问题。你可以问它"帮我找上个月所有和项目 A 相关的文档",它能给你一个语义级别的检索结果,而不是简单的文件名匹配。 OpenAI Codex computer use 的核心能力是"替你操作电脑"。 它是一个代理式执行系统——你给它一个任务描述,它会调用系统 API、执行终端命令、移动文件、创建文件夹、批量重命名,整个过程像一个会写代码的助手在你的电脑上实际动手干活。

用一张表来把差异说清楚:

| 维度 | Perplexity Personal Computer | OpenAI Codex computer use | | 核心定位 | 本地内容理解 + 语义搜索 | 代理式任务执行 | | 技术路径 | 本地索引 + LLM 问答 | 代码生成 + 系统 API 调用 | | 执行方式 | 给建议,用户手动确认 | 直接执行,可设置自动化程度 | | 权限模型 | 读权限为主,写操作需确认 | 读写权限,可直接修改文件系统 | | 隐私风险 | 相对低,本地索引 | 相对高,操作链路更深 | | 适合人群 | 小白、隐私敏感用户、知识工作者 | 开发者、重度自动化需求用户 | | 最大优势 | 语义理解准确,操作安全 | 执行能力强,真正的"自动化" | | 最大短板 | 不能真正"动手",自动化程度低 | 黑盒操作,出错难回滚 |
一句话总结:Perplexity PC 是一个懂你文件的聪明助理,Codex computer use 是一个会动手的执行机器人。它们解决的是同一个问题的两个不同子集。

---

第二章:实测任务设计——为什么选"整理本地文件"

我选这个任务是有意为之的,因为它对两款产品都构成真实压力。

整理本地文件这件事,需要同时具备两种能力:

1. 理解内容:你得知道这个 PDF 是合同还是发票,这张截图是产品图还是聊天记录,这个压缩包里装的是什么——光靠文件名根本不够。

2. 执行操作:理解完了还得真的动手,移动文件、新建文件夹、批量重命名,这些都是写入操作。

这两个能力,恰好对应 Perplexity PC 和 Codex 各自的强项和弱项。所以这个任务是个公平的压力测试,不偏向任何一方。

测试环境说明:
  • 文件夹:本地下载目录,共 217 个文件
  • 文件类型:PDF(约 60 个)、图片(约 80 个,含截图和照片)、Word/Excel 文档(约 30 个)、代码文件(约 20 个)、压缩包(约 15 个)、其他(约 12 个)
  • 混乱程度:文件名命名风格混乱,有中文有英文,有日期有无日期,有约 15 个明显重复文件(同名不同大小或内容相同但文件名不同)
  • 任务目标:将文件夹整理成有逻辑的分类结构,清理重复文件,重命名命名混乱的文件

---

第三章:Perplexity PC 实测——它在哪里赢、在哪里输

索引过程

Perplexity PC 的第一步是建立本地索引。我把下载文件夹加入索引范围后,它开始扫描文件内容。217 个文件,索引完成大约用了不到 3 分钟——速度相当快,体感上比我预期的要轻量。

索引完成后,我用自然语言提问:"帮我分析这个文件夹里的文件,给我一个整理方案。"

理解结果

Perplexity PC 给出的分析结果让我有点意外——它真的在"读"文件内容,而不是只看文件名。

它识别出了:

  • 那 60 个 PDF 里,有 23 个是合同类文件,14 个是技术文档,11 个是发票/收据,剩下的是各类报告
  • 图片里,它区分出了产品截图、聊天记录截图、照片三个大类
  • 它还标记出了 12 对疑似重复文件,其中有几对文件名完全不同,但内容高度相似

它给出的整理方案是这样的结构:

📁 下载文件夹(整理后)

├── 📁 合同与法律文件

├── 📁 发票与收据

├── 📁 技术文档

├── 📁 截图与素材

│ ├── 📁 产品截图

│ └── 📁 聊天记录

├── 📁 代码与项目文件

├── 📁 待确认(疑似重复)

└── 📁 其他

语义理解的准确率相当高——我抽查了 30 个文件的分类建议,只有 3 个明显分错(2 个把技术报告误归入"其他",1 个把一份设计稿的 PDF 归入了"合同类")。

明显短板

但问题来了:Perplexity PC 只能给建议,不能真的动手。

每一个移动操作,它都需要我手动确认。217 个文件,如果逐一确认,体验接近于"AI 帮你看,你自己动手搬"。它没有"批量执行"的能力,也没有提供一个"一键应用整理方案"的选项。

我最终花了大约 20 分钟,手动完成了它建议的操作。这个过程中,AI 的价值是真实的(分类建议准确),但执行效率并没有显著提升。

---

第四章:Codex computer use 的同类任务表现

执行方式完全不同

Codex computer use 的交互逻辑和 Perplexity PC 是两个世界。

你给它一个任务描述,它开始生成并执行代码。整理文件这个任务,它调用的是 Python 脚本 + 系统文件操作 API,大概长这样:

import os

import shutil

from pathlib import Path

定义分类规则

CATEGORIES = {

"PDF文档": [".pdf"],

"图片素材": [".jpg", ".jpeg", ".png", ".gif", ".webp"],

"代码文件": [".py", ".js", ".ts", ".sh", ".json"],

"压缩包": [".zip", ".rar", ".7z", ".tar", ".gz"],

"Office文档": [".doc", ".docx", ".xls", ".xlsx", ".ppt", ".pptx"],

}

source_dir = Path("/Users/username/Downloads")

for file in source_dir.iterdir():

if file.is_file():

for category, extensions in CATEGORIES.items():

if file.suffix.lower() in extensions:

target_dir = source_dir / category

target_dir.mkdir(exist_ok=True)

shutil.move(str(file), str(target_dir / file.name))

break

这段代码会直接执行。文件真的会被移动。

执行能力的优势

Codex 在执行速度上完全碾压 Perplexity PC。同样 217 个文件,它大约用了 40 秒完成了所有移动操作,期间几乎不需要我介入。

批量重命名也是它的强项——我让它把所有截图文件按"截图_YYYYMMDD_序号"的格式重命名,它用一段正则替换脚本,30 秒内完成了 80 个文件的重命名。

但代价是什么

Codex 的分类逻辑是规则驱动的,不是语义驱动的。

它按文件扩展名分类,这意味着:

  • 所有 PDF 都被丢进了同一个文件夹,不管是合同还是发票还是技术文档
  • 它识别不出来哪些文件是重复的(内容相同但文件名不同的情况,它完全看不出来)
  • 它不会读文件内容,所以那份被命名为 aaa.pdf 的合同,和那份叫 截图20230916.pdf 的发票,在它眼里是完全一样的东西

更严重的是风险问题。Codex 执行操作是真实的写入操作,一旦出错,文件可能被移动到错误位置,甚至在某些边缘情况下被覆盖。它有操作日志,但回滚需要手动操作,对不熟悉命令行的用户来说心理压力很大。

我在测试中就遇到了一个典型翻车场景:有一批文件名里带中文括号的文件,Codex 生成的脚本在处理路径时出现了编码问题,导致这部分文件没有被正确移动,而是留在了原地,但日志里显示"已处理"——如果不仔细检查,根本发现不了。

---

第五章:选哪个?给不同用户的决策建议

不绕弯子,直接给结论:

你是这类用户 → 选 Perplexity PC:
  • 不太懂命令行,不想承担"AI 帮我误删文件"的风险
  • 对隐私比较敏感,不希望操作链路太深
  • 主要需求是"找到"和"理解",而不是"自动化执行"
  • 知识工作者,文件内容的语义分类比扩展名分类更重要
你是这类用户 → 选 Codex computer use:
  • 有一定技术背景,能看懂操作日志,出了问题能自己排查
  • 重复性任务多,真的需要"一次配置、批量执行"的自动化
  • 文件类型规律性强(比如全是代码文件、全是图片),规则驱动分类够用
  • 时间比安全感更值钱
一个更大的判断:

这两条路现在还是两个不同阶段的产品。Perplexity PC 代表的是"AI 作为内容理解层"的路线,Codex 代表的是"AI 作为执行代理"的路线。它们目前各有明显的天花板,也各有明显的地板。

但这两条路最终会合并——真正成熟的"AI 操作电脑"产品,一定是既能读懂内容语义,又能安全可靠地执行操作。只是这个融合点,现在还没有出现。

---

💡 想自己动手试试这两款产品?

国内直连 Perplexity 和 OpenAI 的访问问题,可以通过 [api.884819.xyz](https://api.884819.xyz) 解决——它同时支持 Perplexity API 和 OpenAI API 的统一调用,不用为每个产品单独配环境,对想做横向测评的读者尤其省事。注册即送体验 token,国产模型(Deepseek/千问等)完全免费,没有月租,按量付费,直接上手。

---

尾声:如果把这两款产品的能力拼在一起

测完这两款产品,我开始认真想一件事:

如果把 Perplexity 的语义理解能力和 Codex 的执行能力拼在一起,会是什么?

不是简单的"两个产品套壳",而是真正在底层融合——用语义理解来驱动执行决策,用执行能力来落地理解结果,同时保留合理的权限控制和回滚机制。

巧的是,最近确实有产品在往这个方向走。下一篇我会拆解它,看看"理解+执行"真正合体之后,体验是不是真的 1+1>2,还是又一个看起来很美的 PPT 产品。

关注专栏,下篇见。

---

本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。

#AI工具评测 #Perplexity #OpenAI #Codex #AI操作电脑 #本地文件整理 #8848AI #AI效率工具