3.2 Codex 的操作模型¶
Codex 更适合作为工程执行型 Agent 来理解:给它明确目标、上下文指针、约束和完成标准,然后让它在仓库里执行。
它的强项不是替你“随便想想”,而是在约束清楚时把工程任务推进到可验证结果:读 repo、改文件、跑命令、解释失败、继续修复。
Codex 最重要的输入¶
Codex 任务最好包含四件事:
Goal
Context Pointers
Constraints
Done When
这也是 OpenAI Codex 课程中强调的委派方式。
AGENTS.md 的作用¶
AGENTS.md 是 Codex 的项目规范入口。它应该告诉 Codex:
- 项目如何运行。
- 如何测试。
- 哪些目录重要。
- 哪些规则必须遵守。
- 什么算完成。
- 哪些坑不要踩。
示例:
# AGENTS.md
## Commands
- Test: `pnpm test`
- Typecheck: `pnpm typecheck`
- Build: `pnpm build`
## Workflow
- Before editing, inspect existing implementations.
- For multi-file tasks, propose a plan first.
- Before completion, run relevant checks.
## Guardrails
- Do not change public API shape unless explicitly requested.
- Do not add dependencies without explaining why.
Codex 适合的任务¶
适合:
- 明确 feature。
- 后端逻辑。
- Bug 修复。
- 测试补齐。
- CLI / 脚本。
- 重构。
- 文档同步。
- 多 Agent / worktree 并行任务。
- 代码审查和安全/边界风险检查。
- 需要明确审批、沙盒或权限边界的任务。
不适合:
- 需求完全不清楚。
- 需要大量产品探索但没有边界。
- 没有验收标准的“优化一下”。
- 高风险生产操作。
- 需要切换非 OpenAI 模型的工作流。
- 主要诉求是本地模型或多供应商统一入口。
Codex 的典型优势和代价¶
| 维度 | 结论 |
|---|---|
| 代码质量 | 适合严谨实现、bugfix、测试补齐和 review |
| 速度 | 复杂任务上可能更慢,但通常更愿意走完整推理和验证 |
| 生态 | 和 OpenAI、ChatGPT、Codex App / IDE / CLI、AGENTS.md、MCP、skills、subagents 等能力形成一套生态 |
| 灵活性 | 官方主线绑定 OpenAI 模型,模型选择自由度不如 OpenCode |
| 安全 | 适合通过 sandbox、approval、最小权限和验证命令控制风险 |
你应该把 Codex 当成“工程执行同事”,而不是“灵感聊天对象”。任务越明确,它越有价值。
推荐操作流程¶
1. 用网页或人脑整理 Task Brief。
2. 让 Codex 先只读分析。
3. 要求 Codex 写计划和验证命令。
4. 确认计划。
5. 让 Codex 实现。
6. 让 Codex 运行验证。
7. 人审 diff。
8. 让 Codex 根据 review 修复。
Codex 使用提醒¶
- 不要省略
Done When。 - 不要让 Codex 在没有上下文指针时猜。
- 不要让多个 Agent 改同一个文件范围。
- 不要把高风险写入权限随便交给它。
- 不要把“运行失败但推测没问题”当完成。
- 不要用它替代代码审查。让它先自查,再由人审 diff。
- 如果你需要多供应商或本地模型,把 OpenCode 放到工具链里。