本文最后更新于 2026-04-17，文章内容可能已经过时。

Codex Desktop computer use 完全上手指南：30 分钟让 AI 在你 Mac 上真正「动手」写代码

上周我把一个 300 行的 bug 扔给 Codex，去倒了杯咖啡回来，它已经改完代码、跑完测试、写好 commit message 等我确认——这不是演示视频，这是 computer use 模式跑在我 Mac 上的真实记录。

但我必须说实话：配置过程踩了不少坑，网上中文资料几乎是空白。

这篇文章就是我踩坑之后整理出来的完整路径，从「它到底是什么」到「第一个 Task 跑通」，30 分钟内可以复现。

---

第一章：先搞清楚它到底是什么

很多人第一次听到「Codex Desktop」，脑子里会自动套上两个熟悉的框架：要么以为是 ChatGPT 的代码插件升级版，要么以为是 GitHub Copilot 的桌面端。这两个理解都不对，而且差距很大。

Codex Desktop 的真实定位

Codex Desktop 是 OpenAI 推出的具身 AI 编程 Agent。「具身」这个词的关键在于：它不是在对话框里给你建议，而是真的在操作你的计算机——移动鼠标、点击按钮、打开终端、执行命令、读写文件。

GitHub Copilot 是「副驾驶」，坐在旁边给建议，你来开车。Codex Desktop 的 computer use 模式是「代驾」，你告诉它目的地，它自己握方向盘。

这个区别在实际使用中非常显著：Copilot 帮你补全一行代码，Codex 帮你完成一个功能从写到测。

两种模式，必须分清楚

Codex Desktop 有两种完全不同的运行模式，很多人配完之后发现跑的不是自己想要的，就是因为没搞清楚这个：

本文重点讲的是 Local Computer Use 模式——也就是让 Codex 真正在你 Mac 上「动手」的那个版本。Cloud Sandbox 开箱即用，没什么好讲的；computer use 才是真正有门槛、有价值的部分。

SWE-bench 数据说话

OpenAI 官方公布的数据：Codex 在 SWE-bench Verified 上的得分达到 72.1%，这是目前编程 Agent 里的顶级水准。对比来看，Claude Opus 4.6 在同一基准上约为 49%，Gemini 3.1 Pro 约为 44%。

当然，基准分数和实际体验之间永远有落差，但这个数字至少说明：它的代码能力是认真的，不是玩具。

---

第二章：动手之前，先看这份避坑清单

硬性前置条件

macOS 版本：最低要求 macOS 13 Ventura，推荐 macOS 14 Sonoma 及以上
芯片：Apple Silicon（M1/M2/M3/M4）原生支持，Intel Mac 也可运行但性能体验有差距
OpenAI 账号：必须是 Pro 或 Team 账号，普通免费账号无法使用 computer use 功能。这是最多人卡住的地方

⚠️ 重要提示：如果你用的是免费账号，Codex Desktop 可以安装，但 computer use 选项会显示灰色，无法开启。不要绕过这一步，账号升级是硬性要求。

国内用户最常踩的三个坑

坑一：网络环境

Codex Desktop 调用 OpenAI API，国内直连稳定性参差不齐，Task 执行到一半断连会导致整个任务失败，而且有时候不报错、只是静默挂起，很难排查。

解决方案：确保你的网络环境对 api.openai.com 有稳定连接，或者使用兼容 OpenAI 接口格式的中转服务。

📌 注意：如果你在配置过程中遇到连接超时或 API 响应慢的问题，可以通过 [api.884819.xyz](https://api.884819.xyz) 接入——兼容 OpenAI 原生接口格式，配置方式和官方完全一致，本文后续截图也基于该环境录制。新用户注册即送体验 token，按量付费，没有月租。

坑二：账号地区限制

OpenAI 对部分地区账号有功能限制，即使是 Pro 账号也可能无法使用 computer use。如果你的账号注册时 IP 在受限地区，升级后可能仍然看不到该功能。解决方案：联系 OpenAI 客服，或考虑通过 API 接入方式使用。

坑三：系统权限弹窗被误拒

这是最坑的一个，因为它不报明显的错误。当 Codex 第一次请求辅助功能权限时，系统会弹出授权对话框，很多人下意识点了「不允许」——之后 computer use 功能会静默失效，Agent 会假装在操作但实际上什么都没做。

解决方案：下一章我会给出具体的权限恢复路径。

---

第三章：30 分钟配置全流程

我们按时间轴来，每个阶段有明确的完成标志，你可以对照检查。

① 下载安装 + 登录（5 分钟）

前往 OpenAI 官网下载 Codex Desktop，安装包是标准的 .dmg 格式，拖入 Applications 文件夹即可。

首次启动后用你的 OpenAI Pro/Team 账号登录。登录成功后，左侧边栏应该能看到「New Task」按钮和模式切换选项。

完成标志：能看到 Task 创建界面，右上角显示你的账号头像。

② 开启 computer use 权限（10 分钟）

这是整个配置流程里最容易出错的环节，按步骤来：

Step 1：开启辅助功能权限

系统设置 → 隐私与安全性 → 辅助功能

在列表里找到 Codex，打开右侧开关。如果列表里没有 Codex，点击左下角「+」号手动添加。

Step 2：开启屏幕录制权限

系统设置 → 隐私与安全性 → 屏幕录制

同样找到 Codex 并开启。这个权限允许 Codex 「看到」你的屏幕内容，是 computer use 的视觉输入来源。

Step 3：在 Codex App 内切换模式

回到 Codex Desktop，在 Task 创建界面找到模式选择器，从「Cloud Sandbox」切换到「Local Computer Use」。

⚠️ 如果切换后提示「权限不足」，回到系统设置检查两项授权是否都已开启，有时候需要重启 Codex App 才能生效。

Step 4：权限被误拒后的恢复方法

如果之前误点了「不允许」，权限不会自动重新弹出。解决路径：

系统设置 → 隐私与安全性 → 辅助功能
→ 找到 Codex → 关闭再重新打开开关

如果 Codex 不在列表里，退出 App，重新打开，它会再次触发权限请求弹窗。

完成标志：Codex App 内模式显示为「Local Computer Use」，且没有警告提示。

③ 第一个 Task 跑通验证（10 分钟）

用这个 Prompt 做 Smoke Test，验证 computer use 是否真正工作：

请在我的桌面上新建一个名为 hello_codex 的文件夹，
在其中创建一个 hello.py 文件，内容是打印 "Hello from Codex!"，
然后打开终端，cd 到该目录，运行这个脚本，
把终端输出截图给我看。

这个 Prompt 包含了 computer use 的核心能力链：创建文件 → 写代码 → 操作终端 → 执行命令 → 视觉反馈。如果全程跑通，说明你的配置是正确的。

你会看到屏幕上出现 Codex 控制的光标在移动，Finder 窗口自动打开，终端自动弹出——这个画面第一次看到会有点震撼。

完成标志：Codex 返回终端输出截图，显示 Hello from Codex!。

④ 调整行为偏好与安全边界（5 分钟）

在 Codex 设置里，有几个选项建议在正式使用前调整：

Confirmation Mode：设为「Ask before each action」，初期使用必须开启，让你能看清楚每一步它在做什么
File Access Scope：限定 Codex 可以访问的目录范围，不要给全盘权限
Auto-commit：关闭，Git 提交让你手动确认

完成标志：30 分钟到，配置完毕，可以开始正式使用。

---

第四章：进阶用法与真实场景演示

配置完成之后，下面这三个场景能让你快速感受到 computer use 的真实上限。

场景一：自动 Debug + Git Commit

使用场景：你有一段报错的代码，想让 Codex 找到问题并提交修复。 Prompt 模板：

我的项目在 ~/Projects/my-app 目录下。
运行 python main.py 会报错，错误信息是 [粘贴报错内容]。

请你：
1. 打开终端，进入项目目录，复现这个错误
2. 分析错误原因，修改相关文件
3. 再次运行确认错误消失
4. 执行 git add 和 git commit，commit message 格式：fix: [简短描述]
5. 完成后告诉我修改了哪些文件、改了什么

技巧说明：把步骤拆得越细，成功率越高。「帮我修 bug」这种模糊指令成功率很低；明确的步骤序列让 Agent 有清晰的执行路径。

场景二：读 README 自动配置项目依赖

使用场景：接手一个新项目，想让 Codex 读文档自动把环境配好。 Prompt 模板：

我刚克隆了一个项目到 ~/Projects/new-project。
请打开终端，读取项目根目录的 README.md，
按照其中的安装步骤配置开发环境。
如果遇到需要我确认的步骤（比如安装系统级依赖），暂停并告诉我。
配置完成后运行项目，确认能正常启动。

这个场景的关键是加了「遇到需要确认的步骤暂停」——给 Agent 设置人工介入点，避免它在你不知情的情况下做了不可逆的操作。

场景三：写代码 → 跑单测 → 截图报告（全程无人值守）

这是 computer use 最有说服力的场景，也是最能体现「具身 Agent」价值的地方。

Prompt 模板：

在 ~/Projects/my-app/utils 目录下新建一个 string_utils.py 文件，
实现以下函数：
reverse_string(s): 反转字符串
count_words(s): 统计单词数
is_palindrome(s): 判断是否是回文

同时在 tests/ 目录下新建 test_string_utils.py，
为每个函数写至少 3 个测试用例。

完成后在终端运行 pytest，截图测试结果给我，
并告诉我测试通过率。

跑这个 Task 的时候你可以去做别的事，回来看结果就好。这就是「无人值守」的真实含义。

---

第五章：风险边界与使用建议

说了这么多好处，必须说清楚风险。computer use 操作的是你的真实文件系统，不是沙盒，不是模拟环境。

Agent 误删文件、误提交代码、误修改配置——这些不是理论风险，是真实发生过的案例。

三条保命建议，缺一不可：

1. 开启 Git 版本控制：所有项目在让 Codex 操作之前，确保已经 git init 并有干净的 commit 记录。误操作之后至少能回滚。

2. 创建专用沙盒用户账号：在 Mac 上新建一个标准用户账号，专门给 Codex 使用，限制它能访问的资源范围。这是最彻底的隔离方案。

3. 初期必须开启「需确认」模式：前面提到的 Confirmation Mode，初期使用绝对不要关。看清楚每一步它在做什么，建立对 Agent 行为模式的理解之后，再考虑放权。

工具已就位，边界你来定。 Codex 的能力是真实的，但它能发挥多少价值、带来多少风险，取决于你给它划定的边界是否清晰。这个工具值得认真学，但值得在摸清边界之后再放权。

---

写在最后

跑通第一个 Task 的那一刻，你会有一种奇特的感觉：屏幕上有个东西在替你工作，但它不是人。

这种感觉值得细品——因为它会改变你对「编程效率」这件事的认知上限。

Codex 能在你的 Mac 上「动手」只是第一步。下一个问题是：如果你想让它在云端服务器上自动跑、24 小时不间断执行任务，而不是只能在你开着 Mac 的时候工作——那又该怎么配置？

下篇我们聊 Codex + GitHub Actions 的全自动工作流：提一个 Issue，Agent 自动接单、写代码、测试、发 PR，全程你不用碰键盘。关注专栏，更新会第一时间推送。

---

本文由8848AI原创，转载请注明出处。关注8848AI，带你从零开始学AI。

#AI编程 #Codex #OpenAI #computer use #自动化编程 #AI工具 #8848AI #开发者工具