0.4 核心术语和心智模型地图¶
这本手册会反复使用一些词。不要把它们当成圈内黑话,它们只是描述同一件事的不同层级:你如何把 AI 从“聊天对象”变成“可控执行者”。
一张总图¶
flowchart TD
A["网页对话<br/>想法、解释、方案比较"] --> B["Prompt Engineering<br/>把一次任务说清楚"]
B --> C["Context Engineering<br/>把项目事实组织好"]
C --> D["本地 TUI Agent<br/>读仓库、改文件、跑命令"]
D --> E["MCP / skills<br/>外部工具 + 可复用流程"]
E --> F["Harness Engineering<br/>任务、上下文、工具、权限、验证、记忆"]
F --> G["可验证、可复用、可恢复的开发系统<br/>不是抽卡,而是工作流"]
这条路径不是要求你一次全部掌握。更实际的做法是:先能把任务交给本地 Agent,再逐步补上下文、工具、验证和恢复机制。
Vibe Coding¶
本手册里的 Vibe Coding 指的是:开发者用自然语言、项目文档、工具接口和验证机制,指挥 AI 在真实代码仓库里完成软件开发任务。
它不是“不看代码”。你仍然要看 diff、看测试、看日志、看架构影响。变化在于,很多机械性的阅读、修改、补测试、整理文档,可以由 Agent 执行。
Agentic 是什么意思¶
Agentic 可以粗略理解成“具备代理式行动能力”。在编程场景里,它通常包含四件事:
- 能读取上下文,而不是只看你刚输入的一段话。
- 能调用工具,例如读文件、运行命令、搜索代码、打开浏览器。
- 能在目标、观察、行动、验证之间循环。
- 能把一个较大的任务拆成多个较小步骤。
本手册不把 Agentic 当标题,是因为它对初学者不够直观。你只需要记住:当 AI 能自己读 repo、改文件、跑检查、根据结果继续调整时,它就已经不是普通网页聊天了。
Prompt Engineering¶
Prompt Engineering 不是“神奇咒语”,而是任务定义能力。
一个可执行 prompt 至少要回答:
- 要改什么。
- 为什么要改。
- 相关文件或模块在哪里。
- 不要改什么。
- 完成后如何验证。
如果 prompt 里没有边界和完成标准,Agent 会把“看起来合理”当成完成。
Context Engineering¶
Context Engineering 是把正确的信息放在正确的位置。
它包括:
AGENTS.md/CLAUDE.md:让 Agent 进入仓库后知道先读什么、怎么工作。docs/:沉淀业务规则、架构约定、隐性契约。specs//tasks/:描述本次变更要做什么、做到哪里停。- 测试、日志、issue、PR 评论:作为事实来源,而不是聊天背景。
上下文不是越多越好。真正有用的上下文必须短、准、可定位、可维护。
本地 TUI Agent¶
本地 TUI Agent 指 Claude Code、Codex 这类在终端里运行、可以直接接触仓库的编码助手。
它们相对网页对话的关键差异是:
- 可以读取项目文件,不需要你复制粘贴。
- 可以修改多个文件,并展示 diff。
- 可以运行测试、lint、typecheck、build。
- 可以按项目规则执行,而不是只依赖当前聊天。
- 可以和 Git、shell、MCP、skills 结合。
这也是为什么真实开发任务更适合放到本地 Agent,而不是网页聊天。
MCP¶
MCP 是一种让 Agent 接入外部能力的协议。你可以把它理解成“给 Agent 装工具接口”。
常见 MCP 能力包括:
- 读取项目外的数据源:Notion、Linear、Jira、GitHub、数据库。
- 运行专门工具:浏览器自动化、Figma、文档检索、日志查询。
- 暴露团队内部系统:工单、配置、监控、发布平台。
MCP 的核心问题不是“能不能接”,而是“接进去以后权限是否可控、数据是否可信、调用结果是否可验证”。
Skills¶
Skills 是可复用的流程说明。它解决的不是“Agent 能调用什么”,而是“Agent 遇到某类任务时应该按什么流程做”。
适合做成 skill 的任务通常有三个特征:
- 经常重复。
- 步骤稳定。
- 有明确交付物或检查标准。
例如:修 bug、写 PR 描述、前端审美检查、安全审查、CI 失败定位、需求澄清、发布前检查。
Harness Engineering¶
Harness Engineering 是把 Agent 放进工程化运行系统。
一个可用 harness 至少包含:
- 任务入口:issue、PRD、spec、task 目录。
- 上下文入口:AGENTS/CLAUDE/GEMINI、docs、架构图。
- 执行边界:允许改哪些文件、哪些命令需要确认、哪些目录只读。
- 验证闭环:测试、lint、typecheck、build、E2E、人工 review。
- 恢复机制:Git checkpoint、worktree、任务日志、交接摘要。
- 记忆沉淀:复盘、规则更新、skills、模板。
这一步的目标不是让 AI 更自由,而是让 AI 更稳定。
三个升级信号¶
如果你遇到下面情况,就应该升级工作流:
- 同一个 prompt 反复调,但每次结果不同:升级到 Context Engineering。
- Agent 能写代码,但总忘测试、忘风格、忘边界:升级到 AGENTS/CLAUDE 和 skills。
- 任务跨多天、多模块、多 Agent:升级到 Harness Engineering。
最小记忆卡¶
Prompt: 这次要做什么。
Context: 这次做对需要知道什么。
Agent: 谁来执行。
MCP: 需要什么外部工具。
Skill: 这类任务按什么流程做。
Harness: 如何让任务可控、可验证、可恢复。
Human: 最终判断和责任边界。