AI帮你操控电脑?我用同一个任务测了 Perplexity PC 和 Codex Computer Use

你有没有想过,有一天你对电脑说一句话,它就自己把活干完了——不是语音助手那种"好的,已为您搜索",而是真的打开文件夹、移动文件、写文档、点确认。

这件事,2025年突然有两个产品同时在做了。

一个是 Perplexity Personal Computer(简称 Perplexity PC),搜索引擎公司 Perplexity 推出的 AI 电脑操控工具,主打"对话即操作";另一个是 OpenAI Codex Computer Use,OpenAI 在 Codex 体系下推出的代码执行+界面操控能力,面向开发者场景。

两款工具几乎同期出现,都在做"让 AI 替你动鼠标键盘"这件事,但我用了几天之后发现:它们表面上像,骨子里完全是两个物种。

这篇文章不是新闻汇总。我选了一个真实任务,两款工具都跑了一遍,把过程、卡点、完成情况全部记录下来——目的只有一个:帮你省掉自己踩坑的时间。

---

一、测试设计:我选了一个"刁钻但真实"的任务

挑选测试任务的原则很简单:要足够日常,又要足够复杂,能充分暴露两款工具的差异。

最终选定的任务是:

"帮我在本地整理一批截图,按截图的创建日期重命名(格式:YYYYMMDD_序号.png),然后生成一份摘要文档,记录每张图的文件名和大小,最后把摘要文档移动到指定文件夹。"

为什么选这个?因为它同时涉及:

  • 文件系统操作(读取、重命名、移动)
  • 命名逻辑(日期格式化、序号递增)
  • 文档生成(写入结构化内容)
  • 多步骤串联(前一步的输出是后一步的输入)

任何一个环节出错,整个流程就断了。这种任务最能暴露工具的真实能力边界。

评测维度如下:
  • 上手门槛(从零到开始执行需要多久)
  • 完成率(任务最终完成了多少)
  • 干预次数(我需要手动介入几次)
  • 执行速度(从下达指令到任务结束)
  • 中文支持(指令和输出是否流畅)

---

二、实测过程:两款工具各自怎么表现的

Perplexity PC:流畅到让你忘了它在操控电脑

Perplexity PC 的上手体验出乎意料地顺滑。安装客户端、授权屏幕权限,整个过程大概 5 分钟就能跑起来。界面设计走的是极简路线:一个输入框,一个"开始执行"按钮,没有复杂配置。

我用中文输入了任务描述,它理解得相当准确,没有让我重新解释。

执行过程大致是这样的:

第一步,它自动打开了 Finder(我用的是 Mac),定位到我指定的截图文件夹,开始逐个读取文件的创建日期。这一步肉眼可见,鼠标在屏幕上移动,文件被依次点击——有一种奇妙的"被人远程操控"感。

第二步,重命名环节。它按照我要求的格式逐一重命名,速度不算快,大概 每秒处理 1-2 个文件,20 张截图花了将近 15 秒。

第三步,生成摘要文档。这里出现了第一个卡点:它默认用文本编辑器打开了一个新文件,但格式是 RTF,不是我期望的 Markdown 或纯文本。我没有干预,让它继续,最终生成的内容是可读的,但格式略乱。

第四步,移动文件。这一步顺利完成,文档被正确移动到了目标文件夹。

整体完成情况: 任务基本完成,但有两个小瑕疵——文档格式不是最优,以及有 2 张截图因为创建日期读取异常,被命名为了 19700101_XX.png(时间戳归零的经典 bug)。 我的干预次数:1 次(手动纠正了格式问题)。

---

Codex Computer Use:强大,但你得先学会"和它说话"

Codex Computer Use 的上手门槛明显更高。它目前主要通过 API 或 OpenAI 平台的 Playground 访问,没有独立客户端,需要你自己配置环境或调用接口。

对非开发者来说,这一步就可能劝退。

我通过 API 接入,写了一段简单的调用脚本。把同样的任务描述输入进去之后,Codex 的处理方式和 Perplexity PC 完全不同——它先生成了一段 Python 代码,然后在沙箱环境里执行这段代码来完成任务

import os

import shutil

from datetime import datetime

source_dir = "/path/to/screenshots"

target_dir = "/path/to/output"

files = sorted([f for f in os.listdir(source_dir) if f.endswith('.png')])

summary = []

for i, filename in enumerate(files):

filepath = os.path.join(source_dir, filename)

ctime = os.path.getctime(filepath)

date_str = datetime.fromtimestamp(ctime).strftime('%Y%m%d')

new_name = f"{date_str}_{i+1:02d}.png"

os.rename(filepath, os.path.join(source_dir, new_name))

size = os.path.getsize(os.path.join(source_dir, new_name))

summary.append(f"{new_name} - {size} bytes")

with open(os.path.join(target_dir, "summary.txt"), "w") as f:

f.write("\n".join(summary))

这段代码逻辑清晰,执行速度极快——20 张图的处理在 2 秒内完成,比 Perplexity PC 快了将近 10 倍。

但问题也来了:它在沙箱里跑,访问的是模拟的文件路径,不是我本地真实的文件夹。我需要手动把路径替换成本地路径,然后在本地 Python 环境里重新执行这段代码。

对开发者来说,这是小事;对普通用户来说,这是一道墙。

整体完成情况: 代码逻辑 100% 正确,文件命名格式完美,摘要文档结构清晰。但执行路径需要用户自己打通,干预次数达到 3 次(配置路径 + 本地执行 + 验证输出)。

---

三、对比表格:一眼看出差距在哪

| 评测维度 | Perplexity PC | Codex Computer Use | | 上手时间 | ~5 分钟 | ~30 分钟(含环境配置) | | 完成率 | ~90%(有格式瑕疵) | ~100%(代码逻辑完整) | | 干预次数 | 1 次 | 3 次 | | 执行速度 | 较慢(~15 秒/20文件) | 极快(~2 秒/20文件) | | 中文支持 | 流畅 | 一般(输出以英文为主) | | 访问门槛 | 需要客户端 + 授权 | 需要 API Key + 代码基础 | | 适合人群 | 普通用户 / 内容创作者 | 开发者 / 技术人员 | | 价格 | 目前限量测试,需申请 | 按 token 计费,与 GPT-4o 同价位 |

---

四、深挖差异:不是谁更强,是谁更适合你

看到这里你可能觉得:两个工具都差不多嘛,一个慢点一个快点。

但这个判断是错的。它们的底层逻辑是两种完全不同的自动化哲学。

Perplexity PC                    Codex Computer Use

│ │

▼ ▼

GUI 自动化 代码执行代理

(模拟人类操作界面) (生成代码 → 执行代码)

│ │

▼ ▼

可见、可中断 不可见、但可审计

适合一次性任务 适合可复用流程

出错难以溯源 出错有代码可查

Perplexity PC 的本质是消费级 GUI 自动化:它模拟人类的操作方式,看到什么就点什么,适合那些"我不知道怎么写脚本,但我知道我想要什么结果"的用户。它的最大价值是零代码门槛,最大弱点是稳定性依赖界面不变——一旦软件更新了 UI,它可能就懵了。 Codex Computer Use 的本质是开发者级代码执行代理:它把你的自然语言需求翻译成代码,然后执行这段代码。这意味着逻辑可复用、速度快、可审计,但前提是你得有能力理解和调试它生成的代码。

三类用户的选择建议

普通用户 / 数字懒人

选 Perplexity PC。你只需要说人话,它帮你干活。接受偶尔需要手动纠正的小瑕疵,整体体验是值得的。踩坑注意:不要用它处理重要文件,先在测试文件夹试跑,确认没问题再正式执行。

内容创作者

两个都可以试,但 Perplexity PC 更顺手。整理素材、批量重命名、生成归档文档——这类任务它完全能搞定,而且不需要你懂任何技术。

开发者 / 技术人员

Codex Computer Use 是你的菜。生成的代码可以直接存下来复用,下次跑同类任务直接执行,效率远超 GUI 自动化。而且代码可以二次修改,灵活性极高。

---

五、现实建议:现在上手值得吗?

直接说结论:两款工具都值得关注,但现在都不适合作为主力工具依赖。

Perplexity PC 的硬伤:
  • 目前仍在限量测试阶段,国内用户申请通道不稳定
  • 中文环境下偶尔会切换到英文操作逻辑
  • 对非标准软件(国产 App、定制界面)的识别率不稳定
Codex Computer Use 的硬伤:
  • 沙箱执行和本地文件系统之间的鸿沟,对非开发者几乎不可逾越
  • API 调用成本随任务复杂度线性增长,长任务费用可观
  • 中文输出质量参差不齐
如果你在国内访问这两款工具有障碍,或者想先用更稳定的方式体验同等级的 AI 能力(比如直接调 GPT-4o、Claude Opus 4.6 的原生 API 来跑类似任务),可以试试 [api.884819.xyz](https://api.884819.xyz)——国内直连,按量计费,无需订阅,新用户注册即送体验 token,我自己测评也在用这个。
💡 附:用 API 复现本文测试任务的简单思路

>

调用 GPT-4o 或 Claude,把任务描述作为 prompt 输入,让模型生成处理脚本,然后在本地 Python 环境执行。比 Codex Computer Use 的沙箱路径更直接,成本也更可控。感兴趣的可以先把环境搭起来,下周我把完整脚本发出来。

这两个工具都还在快速迭代,今天的结论三个月后可能要重写——但现在这个时间点,我的建议是:普通用户观望 Perplexity PC 的正式版,开发者现在就可以把 Codex Computer Use 的 API 集成进自己的工具链。

---

说到用 API 自己搭自动化流程,我最近在测一件更有意思的事:用 Claude 的 computer use 接口,自己写一个"私人版 Perplexity PC",成本不到官方订阅的十分之一,而且可以完全定制任务逻辑。

下周我把完整教程和踩坑记录发出来,感兴趣的先关注——这种内容算法不一定会主动推,错过了就是错过了。

---

本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。

#AI工具评测 #Perplexity #OpenAI #电脑自动化 #AI效率工具 #8848AI #Claude #GPT