跳转至

0.4 核心术语和心智模型地图

这本手册会反复使用一些词。不要把它们当成圈内黑话,它们只是描述同一件事的不同层级:你如何把 AI 从“聊天对象”变成“可控执行者”。

一张总图

flowchart TD
  A["网页对话<br/>想法、解释、方案比较"] --> B["Prompt Engineering<br/>把一次任务说清楚"]
  B --> C["Context Engineering<br/>把项目事实组织好"]
  C --> D["本地 TUI Agent<br/>读仓库、改文件、跑命令"]
  D --> E["MCP / skills<br/>外部工具 + 可复用流程"]
  E --> F["Harness Engineering<br/>任务、上下文、工具、权限、验证、记忆"]
  F --> G["可验证、可复用、可恢复的开发系统<br/>不是抽卡,而是工作流"]

这条路径不是要求你一次全部掌握。更实际的做法是:先能把任务交给本地 Agent,再逐步补上下文、工具、验证和恢复机制。

Vibe Coding

本手册里的 Vibe Coding 指的是:开发者用自然语言、项目文档、工具接口和验证机制,指挥 AI 在真实代码仓库里完成软件开发任务。

它不是“不看代码”。你仍然要看 diff、看测试、看日志、看架构影响。变化在于,很多机械性的阅读、修改、补测试、整理文档,可以由 Agent 执行。

Agentic 是什么意思

Agentic 可以粗略理解成“具备代理式行动能力”。在编程场景里,它通常包含四件事:

  • 能读取上下文,而不是只看你刚输入的一段话。
  • 能调用工具,例如读文件、运行命令、搜索代码、打开浏览器。
  • 能在目标、观察、行动、验证之间循环。
  • 能把一个较大的任务拆成多个较小步骤。

本手册不把 Agentic 当标题,是因为它对初学者不够直观。你只需要记住:当 AI 能自己读 repo、改文件、跑检查、根据结果继续调整时,它就已经不是普通网页聊天了。

Prompt Engineering

Prompt Engineering 不是“神奇咒语”,而是任务定义能力。

一个可执行 prompt 至少要回答:

  • 要改什么。
  • 为什么要改。
  • 相关文件或模块在哪里。
  • 不要改什么。
  • 完成后如何验证。

如果 prompt 里没有边界和完成标准,Agent 会把“看起来合理”当成完成。

Context Engineering

Context Engineering 是把正确的信息放在正确的位置。

它包括:

  • AGENTS.md / CLAUDE.md:让 Agent 进入仓库后知道先读什么、怎么工作。
  • docs/:沉淀业务规则、架构约定、隐性契约。
  • specs/ / tasks/:描述本次变更要做什么、做到哪里停。
  • 测试、日志、issue、PR 评论:作为事实来源,而不是聊天背景。

上下文不是越多越好。真正有用的上下文必须短、准、可定位、可维护。

本地 TUI Agent

本地 TUI Agent 指 Claude CodeCodex 这类在终端里运行、可以直接接触仓库的编码助手。

它们相对网页对话的关键差异是:

  • 可以读取项目文件,不需要你复制粘贴。
  • 可以修改多个文件,并展示 diff。
  • 可以运行测试、lint、typecheck、build。
  • 可以按项目规则执行,而不是只依赖当前聊天。
  • 可以和 Git、shell、MCP、skills 结合。

这也是为什么真实开发任务更适合放到本地 Agent,而不是网页聊天。

MCP

MCP 是一种让 Agent 接入外部能力的协议。你可以把它理解成“给 Agent 装工具接口”。

常见 MCP 能力包括:

  • 读取项目外的数据源:Notion、Linear、Jira、GitHub、数据库。
  • 运行专门工具:浏览器自动化、Figma、文档检索、日志查询。
  • 暴露团队内部系统:工单、配置、监控、发布平台。

MCP 的核心问题不是“能不能接”,而是“接进去以后权限是否可控、数据是否可信、调用结果是否可验证”。

Skills

Skills 是可复用的流程说明。它解决的不是“Agent 能调用什么”,而是“Agent 遇到某类任务时应该按什么流程做”。

适合做成 skill 的任务通常有三个特征:

  • 经常重复。
  • 步骤稳定。
  • 有明确交付物或检查标准。

例如:修 bug、写 PR 描述、前端审美检查、安全审查、CI 失败定位、需求澄清、发布前检查。

Harness Engineering

Harness Engineering 是把 Agent 放进工程化运行系统。

一个可用 harness 至少包含:

  • 任务入口:issue、PRD、spec、task 目录。
  • 上下文入口:AGENTS/CLAUDE/GEMINI、docs、架构图。
  • 执行边界:允许改哪些文件、哪些命令需要确认、哪些目录只读。
  • 验证闭环:测试、lint、typecheck、build、E2E、人工 review。
  • 恢复机制:Git checkpoint、worktree、任务日志、交接摘要。
  • 记忆沉淀:复盘、规则更新、skills、模板。

这一步的目标不是让 AI 更自由,而是让 AI 更稳定。

三个升级信号

如果你遇到下面情况,就应该升级工作流:

  • 同一个 prompt 反复调,但每次结果不同:升级到 Context Engineering。
  • Agent 能写代码,但总忘测试、忘风格、忘边界:升级到 AGENTS/CLAUDE 和 skills。
  • 任务跨多天、多模块、多 Agent:升级到 Harness Engineering。

最小记忆卡

Prompt: 这次要做什么。
Context: 这次做对需要知道什么。
Agent: 谁来执行。
MCP: 需要什么外部工具。
Skill: 这类任务按什么流程做。
Harness: 如何让任务可控、可验证、可恢复。
Human: 最终判断和责任边界。