0.4 核心术语和心智模型地图¶

这本手册会反复使用一些词。不要把它们当成圈内黑话，它们只是描述同一件事的不同层级：你如何把 AI 从“聊天对象”变成“可控执行者”。

一张总图¶

flowchart TD
  A["网页对话<br/>想法、解释、方案比较"] --> B["Prompt Engineering<br/>把一次任务说清楚"]
  B --> C["Context Engineering<br/>把项目事实组织好"]
  C --> D["本地 TUI Agent<br/>读仓库、改文件、跑命令"]
  D --> E["MCP / skills<br/>外部工具 + 可复用流程"]
  E --> F["Harness Engineering<br/>任务、上下文、工具、权限、验证、记忆"]
  F --> G["可验证、可复用、可恢复的开发系统<br/>不是抽卡，而是工作流"]

这条路径不是要求你一次全部掌握。更实际的做法是：先能把任务交给本地 Agent，再逐步补上下文、工具、验证和恢复机制。

Vibe Coding¶

本手册里的 Vibe Coding 指的是：开发者用自然语言、项目文档、工具接口和验证机制，指挥 AI 在真实代码仓库里完成软件开发任务。

它不是“不看代码”。你仍然要看 diff、看测试、看日志、看架构影响。变化在于，很多机械性的阅读、修改、补测试、整理文档，可以由 Agent 执行。

Agentic 是什么意思¶

Agentic 可以粗略理解成“具备代理式行动能力”。在编程场景里，它通常包含四件事：

能读取上下文，而不是只看你刚输入的一段话。
能调用工具，例如读文件、运行命令、搜索代码、打开浏览器。
能在目标、观察、行动、验证之间循环。
能把一个较大的任务拆成多个较小步骤。

本手册不把 Agentic 当标题，是因为它对初学者不够直观。你只需要记住：当 AI 能自己读 repo、改文件、跑检查、根据结果继续调整时，它就已经不是普通网页聊天了。

Prompt Engineering¶

Prompt Engineering 不是“神奇咒语”，而是任务定义能力。

一个可执行 prompt 至少要回答：

要改什么。
为什么要改。
相关文件或模块在哪里。
不要改什么。
完成后如何验证。

如果 prompt 里没有边界和完成标准，Agent 会把“看起来合理”当成完成。

Context Engineering¶

Context Engineering 是把正确的信息放在正确的位置。

它包括：

AGENTS.md / CLAUDE.md：让 Agent 进入仓库后知道先读什么、怎么工作。
docs/：沉淀业务规则、架构约定、隐性契约。
specs/ / tasks/：描述本次变更要做什么、做到哪里停。
测试、日志、issue、PR 评论：作为事实来源，而不是聊天背景。

上下文不是越多越好。真正有用的上下文必须短、准、可定位、可维护。

本地 TUI Agent¶

本地 TUI Agent 指 Claude Code、Codex 这类在终端里运行、可以直接接触仓库的编码助手。

它们相对网页对话的关键差异是：

可以读取项目文件，不需要你复制粘贴。
可以修改多个文件，并展示 diff。
可以运行测试、lint、typecheck、build。
可以按项目规则执行，而不是只依赖当前聊天。
可以和 Git、shell、MCP、skills 结合。

这也是为什么真实开发任务更适合放到本地 Agent，而不是网页聊天。

MCP¶

MCP 是一种让 Agent 接入外部能力的协议。你可以把它理解成“给 Agent 装工具接口”。

常见 MCP 能力包括：

读取项目外的数据源：Notion、Linear、Jira、GitHub、数据库。
运行专门工具：浏览器自动化、Figma、文档检索、日志查询。
暴露团队内部系统：工单、配置、监控、发布平台。

MCP 的核心问题不是“能不能接”，而是“接进去以后权限是否可控、数据是否可信、调用结果是否可验证”。

Skills¶

Skills 是可复用的流程说明。它解决的不是“Agent 能调用什么”，而是“Agent 遇到某类任务时应该按什么流程做”。

适合做成 skill 的任务通常有三个特征：

经常重复。
步骤稳定。
有明确交付物或检查标准。

例如：修 bug、写 PR 描述、前端审美检查、安全审查、CI 失败定位、需求澄清、发布前检查。

Harness Engineering¶

Harness Engineering 是把 Agent 放进工程化运行系统。

一个可用 harness 至少包含：

任务入口：issue、PRD、spec、task 目录。
上下文入口：AGENTS/CLAUDE/GEMINI、docs、架构图。
执行边界：允许改哪些文件、哪些命令需要确认、哪些目录只读。
验证闭环：测试、lint、typecheck、build、E2E、人工 review。
恢复机制：Git checkpoint、worktree、任务日志、交接摘要。
记忆沉淀：复盘、规则更新、skills、模板。

这一步的目标不是让 AI 更自由，而是让 AI 更稳定。

三个升级信号¶

如果你遇到下面情况，就应该升级工作流：

同一个 prompt 反复调，但每次结果不同：升级到 Context Engineering。
Agent 能写代码，但总忘测试、忘风格、忘边界：升级到 AGENTS/CLAUDE 和 skills。
任务跨多天、多模块、多 Agent：升级到 Harness Engineering。

最小记忆卡¶

Prompt: 这次要做什么。
Context: 这次做对需要知道什么。
Agent: 谁来执行。
MCP: 需要什么外部工具。
Skill: 这类任务按什么流程做。
Harness: 如何让任务可控、可验证、可恢复。
Human: 最终判断和责任边界。