← 思 HARNESS ENGINEERING · 外 ENJA

第三根柱 · Pillar III

Entropy.

与浑沌共处的驭熵之术

混乱必然累积,
怎么让它有地方去?

I · 核心问题

热力学第二定律说:在孤立系统中,熵只增不减。事物会自发地从有序走向无序。人会老、房间会乱、食物会腐败。

每一个 AI session,也是一种孤立系统。Context 会累积、规则会过时、文档会变得冗长、曾经重要的东西会变成噪声。

你不可能阻止熵增——这跟要求苹果不从树上掉下来一样荒谬。你能做的,是设计让熵有地方去的出口。

II · 运作机制:Retro 排放

什么是 Retro?

Retro(Sprint Retrospective)是敏捷开发中的回顾会议。在传统敏捷中,它是团队反思的时间。在 Harness Engineering 中,它是熵的排放口。

Retro 的本质

每个 Sprint 累积的混乱——模糊的记忆与决策、过时的规则或框架、未记录的学习或洞见——在 Retro 这个节点被强制处理:该留的→写进 KM 或其他流程文档;该删或改的→从 CLAUDE.md 到 Skill 再到文档随时修订;该归档的→移到 ARCHIVE 保持结构分明。

Retro 不只是「回顾」。Retro 是让系统从混乱中找回有序的出口。

III · 具体实践:Retro 七面向

每个 Sprint 结束,可以讨论的七个面向:

1Delivery Summary · 交付摘要

记录这个 Sprint 做了什么:交付了哪些项目;QC 通过率是多少。

对抗的熵 → 「忘记做过什么」

2What Went Well · 什么做得好

保留成功的经验:哪些流程或方法有效;哪些决策最后被证明是正确的。

对抗的熵 → 「好的做法散逸」

3What to Improve · 什么可以改进

辨识问题:哪里流程卡住了;哪些工具不好用;哪些问题一开始没注意最后成为阻碍。

对抗的熵 → 「问题被忽略,重复发生」

4Lessons Learned → 学到的教训

把经验外部化:踩到的坑,写进 KM;发现的洞见,写进 KM 或修订流程文档、Skill 甚至 CLAUDE.md,重要的是下次跑 Sprint 时还会被看见。

对抗的熵 → 「智慧留在 session 里消失」

5Velocity Metrics · 速度指标

量化进度:这个 Sprint 完成了多少;跟预期比如何。

对抗的熵 → 「感觉有进步但说不清楚」

6CLAUDE.md 与 Skills Review · 规则与工具审查

清理过时的规则:

# 先扫描 heading 结构 grep -n "^###" CLAUDE.md # 然后问自己: # 这条规则是因为踩过坑,还是没人删? # 移除不再适用的,合并重复的

增修 Skills 的精度:

# 先确认 Claude 对这一轮对 Skills 的利用以及观察 # 然后一起讨论: # 这些 Skills 哪里合手,哪里感到不足或冗余? # 修订 Skills 或新增 Skills

对抗的熵 → 「文档累积成噪声」

这一步特别重要——规则本身也会变成熵。如果不定期清理,CLAUDE.md 会变得越来越长、Skills 会变成花瓶,每一 Sprint 甚至每一回合都在用的协作宪法与工具都需要在 Retro 重新检视。

7Archive · 归档

把完成的 Story 移到归档:从活文档移到 ARCHIVE;Retro 结束的标志。

对抗的熵 → 「工作区被旧东西塞满」

Retro 七面向总览
面向做什么对抗的熵
Delivery Summary记录做了什么忘记做过什么
What Went Well保留成功经验好的做法散逸
What to Improve辨识问题问题重复发生
Lessons Learned经验写进 KM智慧随 session 消失
Velocity Metrics量化进度进步说不清楚
Key Document Review修订关键文档文档变成噪声
Archive归档完成的工作工作区被塞满

IV · 为什么不能跳过 Retro?

没有 Retro 会怎样?

如果跳过 Retro:KM 不会更新→下次还会踩同样的坑;CLAUDE.md 不会清理→规则越来越矛盾;完成的工作不会归档→SDD 越来越长;成功的经验不会记录→好的做法被遗忘。

熵会持续累积,直到系统变得无法运作。

Retro 是系统的「呼吸」

人需要呼吸——吸进氧气,排出二氧化碳。系统也需要呼吸——吸进新的学习,排出过时的东西。

Retro 就是系统的呼吸。没有 Retro 的系统,会窒息。

Retro 可以只让 AI 自己进行吗?

机械层可以,判断层不行——而 Retro 的核心价值恰好在判断层。

AI 做得好的部分 · 机械层

交付摘要、速度指标、扫描 CLAUDE.md 的结构、找出规则之间的矛盾、草拟候选的 lessons——这些是排放的机械动作,AI 做起来比人快也比人完整。甚至「借一双干净的眼睛」也部分可行:开一个干净 context 的新 session 来审旧 session 的产物(系统的 verifier 就是这个原理),它能抓到漂移。

AI 自己做不到的部分 · 判断层

盲点需要外部视角来打破框架。Sprint 中累积的偏差,在当时看来都是合理的,正因为合理它们才累积得下来。让生产熵的同一套滤镜来审熵,滤镜本身的缺口会原封不动地通过,Retro 是让外部视角照见灯下黑的动作。

吐气需要一个系统外的开口。热力学的讲法:孤立系统熵只增不减——排熵的前提是系统不孤立。AI 自审是封闭系统在自己内部搬动熵,不是排出。人在 Retro 里的角色,物理上就是系统的不孤立要件:「这条值得进 KM 吗」「这条规则该死了吗」这种价值判断,编码的是方向感——而方向从来就是人的工作。

最大效果的 Retro 是两个视角的对焦——AI 带着完整的内部记录(它做的事都有记录),人带着系统外的方向感(他知道哪里重要,哪里看到了问题)。单边进行都只拿到一半:AI 独自做会漏掉自己的滤镜缺口,人独自做会漏掉大量事实细节。

V · 隐喻:呼吸的出口

为什么是呼吸?

容器不能完全密封。如果能量只进不出,容器会爆炸。如果信息只累积不清理,系统会崩溃。Retro 是让系统吐气的机制。

吸与吐的循环

阶段动作对应的流程
吸收新的Sprint 执行,累积经验
排出旧的Retro,清理过时的东西

这个循环必须持续进行。只吸不吐会窒息。只吐不吸会枯竭。

健康的系统,是会呼吸的系统。

VI · 熵的哲学

接受混乱必然发生

Harness Engineering 的第一个智慧是:不要试图阻止混乱。

混乱会发生。Session 会断。规则会过时。人会忘记。AI 会失忆。这些不是 bug,是物理。你能做的不是阻止混乱,而是设计让混乱可以被处理的机制。

驯化熵,而非消灭熵

第二个智慧是:熵不是敌人,是需要被驯化的能量。

Retro 不是「消灭」熵——那不可能。Retro 是把熵转化成有用的东西:踩过的坑→变成 KM,保护未来的自己;过时的规则→被清理,让系统保持干净;完成的工作→被归档,成为历史记录。

熵不是被消灭了,是被转化了。

容器持续被建造

第三个智慧是:系统没有「完成」的一天。

熵一直在增,session 一直会结束,新的坑一直会出现。容器不是建完就好的东西——它是一个持续被建造的系统。每一条新的 KM,就是容器又长出了一块新的壁。每一次 Retro,就是容器在呼吸、在调整、在进化。

这就是为什么 Harness Engineering 没有终点——因为熵永远不会停。

VII · 与其他两柱的关系

Context 决定什么进来(过滤)。Constraints 决定怎么流动(引导)。Entropy 决定怎么出去(排放)。

输入 → [ Context 过滤 ] → 进入系统 → [ Constraints 引导 ] → 产出 → [ Entropy 排放 ] → 回到输入

Entropy 是这个循环的出口守门员。它确保:累积的混乱会被定期清理,系统不会窒息。

三根柱的统一

核心问题运作机制隐喻哲学
Context什么该留?傅里叶变换网的缝隙直觉引领检索
Constraints怎么流动?工作流轨道河道服务型领导
Entropy怎么出去?Retro 排放呼吸与混乱共处

三者形成一个完整的生命系统:Context 是消化系统——选择吸收什么营养;Constraints 是循环系统——让能量流向该去的地方;Entropy 是呼吸系统——排出代谢的废物。

缺少任何一个,系统都无法存活。

VIII · 小结

Entropy 管理的核心是共处。

不是消灭混乱,是设计让混乱有地方去。Retro 提供了排放的机制:七个面向,定期清理。呼吸提供了排放的隐喻:系统需要吐气,才不会窒息。

这是 Harness Engineering 的第三根柱。

IX · 系统的边界条件

人类 RAG 的弱点

在 Context 那根柱中,我们谈到「直觉引领检索」——人作为 RAG 的核心机制。但人类 RAG 有一个根本的弱点:

你不知道自己不知道的东西。

AI 的 RAG 很清楚自己的边界——数据库里有的才捞得到,没有的就是没有。但人类的直觉会说:「我觉得我知道这件事。」然后捞出一个不完整的、甚至是错的东西——而你不知道它是错的。

这就是为什么人类 RAG 需要外部系统来补足:KM 补足「你不知道自己不知道」的盲区;SDD 确保「你以为你知道的」有被写下来验证;Retro 定期让你发现「原来我之前不知道这个」。

系统的天花板是人

但还有一个更根本的边界条件:这个系统能有多强大,全操之在你自己对世界的理解有多深。

直觉引领检索。但直觉能捞到什么,取决于你里面有什么。如果你从没听过傅里叶变换,那天看到那个 IG Reels,你会滑过去,不会意识到「这就是我在做的事」。如果你没有读过荣格、没有碰过敏捷、没有经历过那些项目、没有踩过那些坑——你脑中就不会有那些节点。直觉没有东西可以连。

你是 RAG 的数据库。你读过的书、走过的路、踩过的坑、爱过的人——全部都是你的训练数据。

直觉从这里面捞东西。

为什么这套方法论「不可转让」

这也解释了为什么 Harness Engineering 无法被直接复制。不是因为写不出来——你现在正在读的就是完整的框架。而是因为每个人的数据库不一样。

同样的框架,不同的人会长出不同的系统:你的直觉能连结傅里叶和 RAG,因为你里面有这两个东西;换一个人,他的直觉会连结别的东西;他会长出他自己的隐喻、他自己的工作流、他自己的节奏。

这不是 bug,这是 feature。Harness Engineering 是一个框架,不是一个模板。框架告诉你「要有 Context、Constraints、Entropy」。但这三根柱具体长什么样子,取决于你是谁。

最终的边界条件

边界说明
人类 RAG 的盲区你不知道自己不知道的东西
人的深度系统的天花板是你对世界的理解
不可转让性每个人会长出自己的版本

Harness Engineering 是活的。而让它活着的,是人。你有多深,它就有多深。

X · 结语

Harness Engineering 就是接住混乱的网。

Context 设计网的缝隙——让该留的留,该走的走。Constraints 设计网的结构——让能量沿着轨道流动。Entropy 设计网的呼吸——让系统不会窒息。

三根柱合在一起,形成一个活的、会呼吸的、持续进化的系统。这个系统不依赖 AI 的记忆,不依赖人的记忆。它依赖的是结构——让记不住也没关系的结构。

河流不会停。容器继续被建造。下一个 session,从这里继续。