6.1 Harness 全景图¶
一个完整 harness 可以分成七层。
flowchart TD
A["1. Task Layer<br/>issue / PRD / task directory"] --> B["2. Context Layer<br/>AGENTS.md / CLAUDE.md / docs / specs"]
B --> C["3. Tool Layer<br/>shell / Git / MCP / browser / code search"]
C --> D["4. Agent Layer<br/>Claude Code / Codex / OpenCode / subagents<br/>Gemini CLI 辅助"]
D --> E["5. Verification Layer<br/>tests / lint / typecheck / build / e2e"]
E --> F["6. Review Layer<br/>diff review / code review / security review"]
F --> G["7. Memory Layer<br/>retrospectives / rules / skills / journal"]
每层解决什么¶
| 层 | 解决的问题 |
|---|---|
| Task | AI 到底要做什么 |
| Context | AI 需要知道什么 |
| Tool | AI 能调用什么 |
| Agent | 谁来执行 |
| Verification | 怎么证明完成 |
| Review | 谁来判断质量 |
| Memory | 经验如何进入下一次 |
框架通常补哪一层¶
下面不是排名,而是定位图:
flowchart TD
A[Task / Spec Layer] --> A1[OpenSpec]
B[Context / Phase Layer] --> B1[GSD]
C[Behavior / Skill Layer] --> C1[Superpowers]
D[Agent / Orchestration Layer] --> D1[OMC]
E[Verification / Memory / Safety Layer] --> E1[ECC]
F[Structure / Workspace Layer] --> F1[Trellis]
同一个项目可以组合多个层,但每一层只能有一个主要事实来源。否则任务、spec、memory、verification 会互相打架。
最容易缺的层¶
新手通常缺:
- Verification:不跑测试就相信输出。
- Memory:同样错误下一次继续发生。
- Task:需求不清楚就开工。
- Review:只看聊天总结,不看 diff。
高手不是 prompt 更花,而是这几层更完整。