Codex Desktop computer use 完全上手指南:30 分钟让 AI 在你 Mac 上真正「动手」写代码

上周我把一个 300 行的 bug 扔给 Codex,去倒了杯咖啡回来,它已经改完代码、跑完测试、写好 commit message 等我确认——这不是演示视频,这是 computer use 模式跑在我 Mac 上的真实记录。

但我必须说实话:配置过程踩了不少坑,网上中文资料几乎是空白。

这篇文章就是我踩坑之后整理出来的完整路径,从「它到底是什么」到「第一个 Task 跑通」,30 分钟内可以复现。

---

第一章:先搞清楚它到底是什么

很多人第一次听到「Codex Desktop」,脑子里会自动套上两个熟悉的框架:要么以为是 ChatGPT 的代码插件升级版,要么以为是 GitHub Copilot 的桌面端。这两个理解都不对,而且差距很大。

Codex Desktop 的真实定位

Codex Desktop 是 OpenAI 推出的具身 AI 编程 Agent。「具身」这个词的关键在于:它不是在对话框里给你建议,而是真的在操作你的计算机——移动鼠标、点击按钮、打开终端、执行命令、读写文件。

GitHub Copilot 是「副驾驶」,坐在旁边给建议,你来开车。Codex Desktop 的 computer use 模式是「代驾」,你告诉它目的地,它自己握方向盘。

这个区别在实际使用中非常显著:Copilot 帮你补全一行代码,Codex 帮你完成一个功能从写到测。

两种模式,必须分清楚

Codex Desktop 有两种完全不同的运行模式,很多人配完之后发现跑的不是自己想要的,就是因为没搞清楚这个:

| 对比维度 | Cloud Sandbox 模式 | Local Computer Use 模式 | | 运行环境 | OpenAI 云端隔离容器 | 你的本地 Mac 真实系统 | | 文件访问 | 只能访问上传的文件 | 可读写本地任意路径 | | 网络权限 | 受限的沙盒网络 | 继承你 Mac 的网络环境 | | 风险等级 | 低(隔离环境) | 高(操作真实文件系统) | | 适用场景 | 代码审查、快速原型 | 完整项目开发、自动化工作流 | | 需要特殊授权 | 否 | 是(辅助功能 + 屏幕录制) |

本文重点讲的是 Local Computer Use 模式——也就是让 Codex 真正在你 Mac 上「动手」的那个版本。Cloud Sandbox 开箱即用,没什么好讲的;computer use 才是真正有门槛、有价值的部分。

SWE-bench 数据说话

OpenAI 官方公布的数据:Codex 在 SWE-bench Verified 上的得分达到 72.1%,这是目前编程 Agent 里的顶级水准。对比来看,Claude Opus 4.6 在同一基准上约为 49%,Gemini 3.1 Pro 约为 44%。

当然,基准分数和实际体验之间永远有落差,但这个数字至少说明:它的代码能力是认真的,不是玩具。

---

第二章:动手之前,先看这份避坑清单

硬性前置条件

  • macOS 版本:最低要求 macOS 13 Ventura,推荐 macOS 14 Sonoma 及以上
  • 芯片:Apple Silicon(M1/M2/M3/M4)原生支持,Intel Mac 也可运行但性能体验有差距
  • OpenAI 账号必须是 Pro 或 Team 账号,普通免费账号无法使用 computer use 功能。这是最多人卡住的地方
⚠️ 重要提示:如果你用的是免费账号,Codex Desktop 可以安装,但 computer use 选项会显示灰色,无法开启。不要绕过这一步,账号升级是硬性要求。

国内用户最常踩的三个坑

坑一:网络环境

Codex Desktop 调用 OpenAI API,国内直连稳定性参差不齐,Task 执行到一半断连会导致整个任务失败,而且有时候不报错、只是静默挂起,很难排查。

解决方案:确保你的网络环境对 api.openai.com 有稳定连接,或者使用兼容 OpenAI 接口格式的中转服务。

📌 注意:如果你在配置过程中遇到连接超时或 API 响应慢的问题,可以通过 [api.884819.xyz](https://api.884819.xyz) 接入——兼容 OpenAI 原生接口格式,配置方式和官方完全一致,本文后续截图也基于该环境录制。新用户注册即送体验 token,按量付费,没有月租。

坑二:账号地区限制

OpenAI 对部分地区账号有功能限制,即使是 Pro 账号也可能无法使用 computer use。如果你的账号注册时 IP 在受限地区,升级后可能仍然看不到该功能。解决方案:联系 OpenAI 客服,或考虑通过 API 接入方式使用。

坑三:系统权限弹窗被误拒

这是最坑的一个,因为它不报明显的错误。当 Codex 第一次请求辅助功能权限时,系统会弹出授权对话框,很多人下意识点了「不允许」——之后 computer use 功能会静默失效,Agent 会假装在操作但实际上什么都没做。

解决方案:下一章我会给出具体的权限恢复路径。

---

第三章:30 分钟配置全流程

我们按时间轴来,每个阶段有明确的完成标志,你可以对照检查。

① 下载安装 + 登录(5 分钟)

前往 OpenAI 官网下载 Codex Desktop,安装包是标准的 .dmg 格式,拖入 Applications 文件夹即可。

首次启动后用你的 OpenAI Pro/Team 账号登录。登录成功后,左侧边栏应该能看到「New Task」按钮和模式切换选项。

完成标志:能看到 Task 创建界面,右上角显示你的账号头像。

② 开启 computer use 权限(10 分钟)

这是整个配置流程里最容易出错的环节,按步骤来:

Step 1:开启辅助功能权限
系统设置 → 隐私与安全性 → 辅助功能

在列表里找到 Codex,打开右侧开关。如果列表里没有 Codex,点击左下角「+」号手动添加。

Step 2:开启屏幕录制权限
系统设置 → 隐私与安全性 → 屏幕录制

同样找到 Codex 并开启。这个权限允许 Codex 「看到」你的屏幕内容,是 computer use 的视觉输入来源。

Step 3:在 Codex App 内切换模式

回到 Codex Desktop,在 Task 创建界面找到模式选择器,从「Cloud Sandbox」切换到「Local Computer Use」。

⚠️ 如果切换后提示「权限不足」,回到系统设置检查两项授权是否都已开启,有时候需要重启 Codex App 才能生效。
Step 4:权限被误拒后的恢复方法

如果之前误点了「不允许」,权限不会自动重新弹出。解决路径:

系统设置 → 隐私与安全性 → 辅助功能

→ 找到 Codex → 关闭再重新打开开关

如果 Codex 不在列表里,退出 App,重新打开,它会再次触发权限请求弹窗。

完成标志:Codex App 内模式显示为「Local Computer Use」,且没有警告提示。

③ 第一个 Task 跑通验证(10 分钟)

用这个 Prompt 做 Smoke Test,验证 computer use 是否真正工作:

请在我的桌面上新建一个名为 hello_codex 的文件夹,

在其中创建一个 hello.py 文件,内容是打印 "Hello from Codex!",

然后打开终端,cd 到该目录,运行这个脚本,

把终端输出截图给我看。

这个 Prompt 包含了 computer use 的核心能力链:创建文件 → 写代码 → 操作终端 → 执行命令 → 视觉反馈。如果全程跑通,说明你的配置是正确的。

你会看到屏幕上出现 Codex 控制的光标在移动,Finder 窗口自动打开,终端自动弹出——这个画面第一次看到会有点震撼。

完成标志:Codex 返回终端输出截图,显示 Hello from Codex!

④ 调整行为偏好与安全边界(5 分钟)

在 Codex 设置里,有几个选项建议在正式使用前调整:

  • Confirmation Mode:设为「Ask before each action」,初期使用必须开启,让你能看清楚每一步它在做什么
  • File Access Scope:限定 Codex 可以访问的目录范围,不要给全盘权限
  • Auto-commit:关闭,Git 提交让你手动确认
完成标志:30 分钟到,配置完毕,可以开始正式使用。

---

第四章:进阶用法与真实场景演示

配置完成之后,下面这三个场景能让你快速感受到 computer use 的真实上限。

场景一:自动 Debug + Git Commit

使用场景:你有一段报错的代码,想让 Codex 找到问题并提交修复。 Prompt 模板
我的项目在 ~/Projects/my-app 目录下。

运行 python main.py 会报错,错误信息是 [粘贴报错内容]。

请你:

1. 打开终端,进入项目目录,复现这个错误

2. 分析错误原因,修改相关文件

3. 再次运行确认错误消失

4. 执行 git add 和 git commit,commit message 格式:fix: [简短描述]

5. 完成后告诉我修改了哪些文件、改了什么

技巧说明:把步骤拆得越细,成功率越高。「帮我修 bug」这种模糊指令成功率很低;明确的步骤序列让 Agent 有清晰的执行路径。

场景二:读 README 自动配置项目依赖

使用场景:接手一个新项目,想让 Codex 读文档自动把环境配好。 Prompt 模板
我刚克隆了一个项目到 ~/Projects/new-project。

请打开终端,读取项目根目录的 README.md,

按照其中的安装步骤配置开发环境。

如果遇到需要我确认的步骤(比如安装系统级依赖),暂停并告诉我。

配置完成后运行项目,确认能正常启动。

这个场景的关键是加了「遇到需要确认的步骤暂停」——给 Agent 设置人工介入点,避免它在你不知情的情况下做了不可逆的操作。

场景三:写代码 → 跑单测 → 截图报告(全程无人值守)

这是 computer use 最有说服力的场景,也是最能体现「具身 Agent」价值的地方。

Prompt 模板
在 ~/Projects/my-app/utils 目录下新建一个 string_utils.py 文件,

实现以下函数:

  • reverse_string(s): 反转字符串
  • count_words(s): 统计单词数
  • is_palindrome(s): 判断是否是回文

同时在 tests/ 目录下新建 test_string_utils.py,

为每个函数写至少 3 个测试用例。

完成后在终端运行 pytest,截图测试结果给我,

并告诉我测试通过率。

跑这个 Task 的时候你可以去做别的事,回来看结果就好。这就是「无人值守」的真实含义。

---

第五章:风险边界与使用建议

说了这么多好处,必须说清楚风险。computer use 操作的是你的真实文件系统,不是沙盒,不是模拟环境。

Agent 误删文件、误提交代码、误修改配置——这些不是理论风险,是真实发生过的案例。

三条保命建议,缺一不可:

1. 开启 Git 版本控制:所有项目在让 Codex 操作之前,确保已经 git init 并有干净的 commit 记录。误操作之后至少能回滚。

2. 创建专用沙盒用户账号:在 Mac 上新建一个标准用户账号,专门给 Codex 使用,限制它能访问的资源范围。这是最彻底的隔离方案。

3. 初期必须开启「需确认」模式:前面提到的 Confirmation Mode,初期使用绝对不要关。看清楚每一步它在做什么,建立对 Agent 行为模式的理解之后,再考虑放权。

工具已就位,边界你来定。 Codex 的能力是真实的,但它能发挥多少价值、带来多少风险,取决于你给它划定的边界是否清晰。这个工具值得认真学,但值得在摸清边界之后再放权。

---

写在最后

跑通第一个 Task 的那一刻,你会有一种奇特的感觉:屏幕上有个东西在替你工作,但它不是人。

这种感觉值得细品——因为它会改变你对「编程效率」这件事的认知上限。

Codex 能在你的 Mac 上「动手」只是第一步。下一个问题是:如果你想让它在云端服务器上自动跑、24 小时不间断执行任务,而不是只能在你开着 Mac 的时候工作——那又该怎么配置?

下篇我们聊 Codex + GitHub Actions 的全自动工作流:提一个 Issue,Agent 自动接单、写代码、测试、发 PR,全程你不用碰键盘。关注专栏,更新会第一时间推送。

---

本文由8848AI原创,转载请注明出处。关注8848AI,带你从零开始学AI。

#AI编程 #Codex #OpenAI #computer use #自动化编程 #AI工具 #8848AI #开发者工具