跳转至

4.4 按真实场景选择工具

阅读完本节后,你应该能根据任务类型选择 GPT / Claude / Gemini / Claude Code / Codex / OpenCode / Cursor / Trae / Windsurf / MCP / skills / harness,而不是凭感觉换工具。

工具选型的核心不是“哪个最强”,而是“哪个最适合当前任务的上下文形态”。

场景 1:想法还很模糊

推荐:

网页 GPT / Claude / Gemini

适合做:

  • 澄清目标。
  • 拆用户故事。
  • 列风险。
  • 生成 PRD 初稿。
  • 比较方案。

不要做:

  • 让网页模型猜 repo 结构。
  • 让网页模型给出大段不可验证代码。

结束条件:

产出 Task Handoff 或 PRD,而不是产出最终代码。

场景 2:已有 repo,要做一个小功能

推荐:

Claude Code / Codex / OpenCode

原因:

  • 能读文件。
  • 能看已有模式。
  • 能修改代码。
  • 能跑验证。
  • 能看 diff。

操作方式:

flowchart LR
  A[先只读分析] --> B[给计划]
  B --> C[小步实现]
  C --> D[跑测试]
  D --> E[review diff]

场景 3:你正在 IDE 里改一小段代码

推荐:

Cursor / Trae / Windsurf / IDE Copilot

适合:

  • 补全函数。
  • 局部解释。
  • 小范围重命名。
  • 当前文件内修补。
  • UI 细节调整。

不适合:

  • 多目录重构。
  • 长任务治理。
  • 需要独立跑完整验证的工作。

场景 4:复杂 bug,必须复现

推荐组合:

Claude Code / Codex
+ 测试命令
+ 浏览器 MCP 或 Playwright
+ 完整日志

流程:

flowchart LR
  A[复现] --> B[定位]
  B --> C[写最小失败测试]
  C --> D[修复]
  D --> E[验证回归]

不要一开始就让 Agent 猜根因。

场景 5:前端视觉和交互探索

推荐组合:

网页模型做风格探索
本地 Agent 落地代码
浏览器工具做截图验证

如果只是局部组件,可用 Cursor / Trae / Windsurf。
如果涉及路由、状态、数据流、构建验证,切到 Claude Code / Codex / OpenCode

场景 6:需要多模型或本地模型

推荐:

OpenCode

适合:

  • 用一个 TUI 接多个供应商。
  • 用本地模型做低风险探索。
  • 让不同模型分别做 plan、build、review。
  • 团队想降低单一供应商锁定。

不要做:

  • 用弱本地模型硬接复杂架构重构。
  • 同时开多个 agent 改同一批文件。
  • 忽略模型成本、上下文大小和隐私边界。

场景 7:需要最新框架或 API 文档

推荐:

文档 MCP / 官方文档

然后再让本地 Agent 改代码。不要依赖模型记忆判断最新 API。模型可能知道过期版本,也可能混用不同版本写法。

场景 8:重复流程已经出现三次

推荐:

skill

适合固化:

  • PR review 流程。
  • 发布检查。
  • bug root cause 分析。
  • 文档同步。
  • issue triage。
  • 测试生成规范。

判断标准:

如果你第三次复制同一段长提示词,就该考虑写 skill。

场景 9:需要连接外部系统

推荐:

MCP

适合查 GitHub issue / PR、Jira / Linear、数据库 schema、浏览器、内部文档和监控日志。

原则:

能只读就只读。
能低权限就低权限。
能限制输出就限制输出。
高风险写入必须人工确认。

场景 10:任务跨度超过一天

推荐:

Harness Engineering

需要 PRD、任务拆分、会话记录、验证清单、文档同步规则和恢复机制。

这时不要只靠“一个很长的 prompt”。长任务需要系统,不是更长的聊天。

场景矩阵

任务 首选 辅助
需求澄清 网页 Claude / GPT Gemini 做长上下文整理
小功能落地 Claude Code / Codex / OpenCode AGENTS.md / CLAUDE.md
当前文件局部修改 Cursor / Trae / Windsurf 本地 Agent review
多文件重构 Claude Code / Codex 测试 + worktree
UI 方案探索 网页模型 本地 Agent + 浏览器验证
查最新 API 文档 MCP 官方文档
复现浏览器 bug Playwright / Browser MCP 本地 Agent
多模型对照 OpenCode 强模型 + 低成本模型组合
重复工作流 skill MCP 提供数据
长任务 Trellis / OpenSpec / GSD Superpowers / 多 Agent
高风险变更 本地 Agent + harness 人工 review

最短决策规则

想清楚:网页模型。
做出来:Claude Code / Codex / OpenCode。
改局部:编辑器 Agent。
接外部:MCP。
固化流程:skill。
管长任务:harness。