4.4 按真实场景选择工具¶

阅读完本节后，你应该能根据任务类型选择 GPT / Claude / Gemini / Claude Code / Codex / OpenCode / Cursor / Trae / Windsurf / MCP / skills / harness，而不是凭感觉换工具。

工具选型的核心不是“哪个最强”，而是“哪个最适合当前任务的上下文形态”。

场景 1：想法还很模糊¶

推荐：

网页 GPT / Claude / Gemini

适合做：

澄清目标。
拆用户故事。
列风险。
生成 PRD 初稿。
比较方案。

不要做：

让网页模型猜 repo 结构。
让网页模型给出大段不可验证代码。

结束条件：

产出 Task Handoff 或 PRD，而不是产出最终代码。

场景 2：已有 repo，要做一个小功能¶

推荐：

Claude Code / Codex / OpenCode

原因：

能读文件。
能看已有模式。
能修改代码。
能跑验证。
能看 diff。

操作方式：

flowchart LR
  A[先只读分析] --> B[给计划]
  B --> C[小步实现]
  C --> D[跑测试]
  D --> E[review diff]

场景 3：你正在 IDE 里改一小段代码¶

推荐：

Cursor / Trae / Windsurf / IDE Copilot

适合：

补全函数。
局部解释。
小范围重命名。
当前文件内修补。
UI 细节调整。

不适合：

多目录重构。
长任务治理。
需要独立跑完整验证的工作。

场景 4：复杂 bug，必须复现¶

推荐组合：

Claude Code / Codex
+ 测试命令
+ 浏览器 MCP 或 Playwright
+ 完整日志

流程：

flowchart LR
  A[复现] --> B[定位]
  B --> C[写最小失败测试]
  C --> D[修复]
  D --> E[验证回归]

不要一开始就让 Agent 猜根因。

场景 5：前端视觉和交互探索¶

推荐组合：

网页模型做风格探索
本地 Agent 落地代码
浏览器工具做截图验证

如果只是局部组件，可用 Cursor / Trae / Windsurf。
如果涉及路由、状态、数据流、构建验证，切到 Claude Code / Codex / OpenCode。

场景 6：需要多模型或本地模型¶

推荐：

OpenCode

适合：

用一个 TUI 接多个供应商。
用本地模型做低风险探索。
让不同模型分别做 plan、build、review。
团队想降低单一供应商锁定。

不要做：

用弱本地模型硬接复杂架构重构。
同时开多个 agent 改同一批文件。
忽略模型成本、上下文大小和隐私边界。

场景 7：需要最新框架或 API 文档¶

推荐：

文档 MCP / 官方文档

然后再让本地 Agent 改代码。不要依赖模型记忆判断最新 API。模型可能知道过期版本，也可能混用不同版本写法。

场景 8：重复流程已经出现三次¶

推荐：

skill

适合固化：

PR review 流程。
发布检查。
bug root cause 分析。
文档同步。
issue triage。
测试生成规范。

判断标准：

如果你第三次复制同一段长提示词，就该考虑写 skill。

场景 9：需要连接外部系统¶

推荐：

MCP

适合查 GitHub issue / PR、Jira / Linear、数据库 schema、浏览器、内部文档和监控日志。

原则：

能只读就只读。
能低权限就低权限。
能限制输出就限制输出。
高风险写入必须人工确认。

场景 10：任务跨度超过一天¶

推荐：

Harness Engineering

需要 PRD、任务拆分、会话记录、验证清单、文档同步规则和恢复机制。

这时不要只靠“一个很长的 prompt”。长任务需要系统，不是更长的聊天。

场景矩阵¶

任务	首选	辅助
需求澄清	网页 Claude / GPT	Gemini 做长上下文整理
小功能落地	Claude Code / Codex / OpenCode	AGENTS.md / CLAUDE.md
当前文件局部修改	Cursor / Trae / Windsurf	本地 Agent review
多文件重构	Claude Code / Codex	测试 + worktree
UI 方案探索	网页模型	本地 Agent + 浏览器验证
查最新 API	文档 MCP	官方文档
复现浏览器 bug	Playwright / Browser MCP	本地 Agent
多模型对照	OpenCode	强模型 + 低成本模型组合
重复工作流	skill	MCP 提供数据
长任务	Trellis / OpenSpec / GSD	Superpowers / 多 Agent
高风险变更	本地 Agent + harness	人工 review

最短决策规则¶

想清楚：网页模型。
做出来：Claude Code / Codex / OpenCode。
改局部：编辑器 Agent。
接外部：MCP。
固化流程：skill。
管长任务：harness。