第一根柱 · Pillar I
注意力的心流
在有限的注意力资源中,
什么该留下,什么该流过?
I · 核心问题
AI 的 context window 是有限的。人的注意力也是有限的。当信息不断涌入,你不可能全部留住。大量相关与无关的信息同时挤进来时,人和 AI 的注意力都会被切碎。
问题不在「怎么记住所有东西」,而在「怎么选择该记住什么」。
II · 运作机制:傅里叶变换
傅里叶变换的核心机制是:任何复杂的波形,都可以分解成一组正弦波的叠加。
把这个框架应用到人机对话:
| 傅里叶概念 | 对话中的对应 |
|---|---|
| 复杂波形 | 一段多主题的长对话 |
| 基频 | 贯穿对话的核心主题 |
| 谐波 | 与核心相关的衍生话题 |
| 高频噪声 | 无关的岔题、干扰 |
当所有话题都维持在同一基频上:
当话题频率混乱:
III · 密度:让 Context 成为 RAG
前面讲的都是减法——滤掉高频噪声,让不需要的流过。但减法的另一面,是增幅:当每句话都有意识地搭在同一条正弦波上,剩下的东西不是变少,而是变浓。
这才是超长上下文还能维持专注的真正秘诀。注意力之所以延续,不是因为信息少到好记,而是因为它泡在高浓度的语义池里——每一个对话回合都是高浓度的信号,没有一段被稀释的水需要过滤。基频一致让注意力连续,连续累积到一个程度,就成了密度。
维持基频,不只是让对话不散掉,更是让整个语境保持高浓度。
RAG 之所以需要「蒸馏」——从庞大的语料里捞出那几滴相关的——是因为那缸语料是稀的。但如果你全程维持高度专注,只把已过滤的信息投入 Context,这缸水就从来没被稀释过——整个 Session 一直泡在蒸馏液里。
于是「过滤」这个动作先验地消失了:不是你检索得比较好,而是根本没有稀的东西需要滤。
一个够浓的 context,不需要外挂检索——它本身就是一套 RAG。傅里叶与 RAG 在这里收敛成同一件事:维持密度,就是持续地、预先地在做 RAG。
IV · 具体实践
原则:让所有话题基于同一个基频。
做法:在开始对话前,心中有一个核心主题;话题漂移时,保持「谐波关系」——衍生话题是基频的延伸,而非无关的跳跃;被对话暂时「甩出」的话题,因为万物同源,最终会被同构的指认「甩回来」。
实例:「五个为什么」、苏格拉底式提问、第一性原理,都是针对问题的本质做深度探问。
如何在日常语言中实践傅里叶变换?以下是从实战中提炼出的五个原则:
原则一:带着锚点开场你的意图
做法:每次对话开始时,带着「一个东西」来。
不要说
「我们来聊聊。」
要说
「我有一个新的想法,想跟你讨论可行性。」「我有一些素材,想先看看可以从哪个面向切入。」
频率效果 → 设定基频。锚点让整个对话有一个起始频率,后续话题都从这里生长。
原则二:让话题生长,而非跳跃苏格拉底式提问
做法:新话题要从上一个话题「长出去」,而不是「跳过去」。
不要说
「换个话题,我们来谈 X。」
要说
「这让我想到……」「这就是……」「所以其实……」
频率效果 → 维持谐波关系。每个新话题都是基频的延伸,不是无关的噪音。
原则三:用隐喻压缩,而非术语堆叠狄波诺水平思考
做法:用一个意象承载复杂概念,而不是用多个术语解释。
不要说
「当光标移向左侧时,左侧区块的 clip-path 要同步扩张,右侧等比收缩,两侧的动画曲线要对称,状态变化要互为反相……」
要说
「我想要达到的效果像镜像一样相互辉映。」
频率效果 → 锁定频率,降低并行负载。隐喻把多个概念压缩成一个,AI 不需要同时追踪多个定义。
原则四:停下来校准对齐双方共识
做法:定期确认对方有没有跟上,有没有偏掉。试着问:「(复述自己对对方回应的理解),我这样理解对吗?」「你可以用说故事(隐喻)的方法讲一次给我听吗?」「你的 Context 负担还好吗?」
频率效果 → 校准,防止偏离。如果频率开始漂移,这是把它拉回来的机会。
原则五:接受慢原子习惯
做法:给对方消化的时间,不催促,不要求一次到位。当 AI 说「先做骨架」,接受;把大任务拆成小步骤,把一个 Sprint 拆成一个 Session 可以有余裕负担的份量,把 compact 的时机抓准,一步一步推进。
频率效果 → 控制语境堆叠速度。让每一层有时间被消化,再加入下一层。
| 原则 | 做法 | 频率效果 |
|---|---|---|
| 带着锚点开场 | 每次对话带着「一个东西」来 | 设定基频 |
| 让话题生长 | 用「这让我想到…」连接 | 维持谐波关系 |
| 用隐喻压缩 | 用意象取代术语堆叠 | 锁定频率,降低负载 |
| 停下来校准 | 定期确认方向 | 防止偏离 |
| 接受慢 | 给消化时间,不催促 | 控制堆叠速度 |
RAG(Retrieval-Augmented Generation)的本质:从巨大的知识库中,检索出相关的片段;把这些片段注入到生成过程中;不相关的信息不会进入 context。
RAG 就是网在运作:相关的→被捞起来,成为 context;不相关的→流过去,不占用空间。
在深握计划的实践中,没有使用任何技术意义上的 RAG 系统——没有向量数据库、没有 embedding 检索、没有自动注入机制。但对话自然产生了 RAG 的效果。
为什么?因为人在有意识地投入协作时,自身就成为了 RAG,而且是更高级的版本。
| 面向 | 技术 RAG | 人作为 RAG |
|---|---|---|
| 驱动力 | Query(问题) | 直觉(感觉) |
| 顺序 | 问题 → 检索 → 注入 | 直觉 → 检索 → 注入 |
| 判断标准 | 语义相似度 | 「感觉上同构」 |
| 时机 | 被动(有问才找) | 主动(感觉该出场就捞) |
技术 RAG 是被问题驱动的——有人问,它才找。人是被直觉驱动的——先感觉到「我有看过类似这个的东西」,然后才去捞它。
这个顺序的差异至关重要:技术 RAG 只能捞「语义相似」的东西;人能捞「感觉上同构」的东西——即使表面上看起来不相关。
直觉看见了这个同构。然后检索去验证它、语言去表达它。
这整个过程不是自动的,是人手动执行的——只是执行得太自然,看起来像自动的。
就像把「傅里叶」和「RAG」放在一起看——表面无关,本质同构。这种连结,任何向量数据库都捞不出来。
除了投入需要过滤,输出也需要筛选与分类——每一份活着的文档,都是筛选后的结果。因为活文档会再度被阅读,而每一次的重读都会影响 Context 的浓度。
无效的信息会变成噪声,记录会变成熵。
在所有活文档之中,CLAUDE.md 是根。它不是规格、不是测试、不是记录——它是身份的外部化。
每一个新的 session,AI 什么都不记得。但读完 CLAUDE.md,他立刻知道:
没有 CLAUDE.md,每个 session 都是陌生人。有了 CLAUDE.md,每个 session 都是同一个伙伴的延续。
| 文档 | 筛选了什么 | 留下了什么 | 稳定什么 |
|---|---|---|---|
| CLAUDE.md | 所有可能的身份设置 | 我们选择的协作方式 | 身份 |
| SDD | 所有可能的做法 | 我们选择的这一种规格 | 方向 |
| TDD | 所有可能出错的地方 | 真正该测的边界条件 | 质量 |
| KM | 所有发生过的事 | 真正踩过的坑 | 经验 |
| ARCHIVE | 已完成的工作 | 值得保留的记录 | 历史 |
如果记录所有事(包含对话),文档会变成噪声来源。只记录「判断后该留下的」,每一条都是真正有价值的。这样未来检索时,捞起来的都是精华。
工作流的每一个节点,都在执行选择性记录:DoR 筛选「准备好了吗」;SDD 筛选「该做什么」;DoD 筛选「什么叫完成」;TDD 筛选「什么该测」;Retro 筛选「什么值得留下」。
V · Context 的双重稳定机制
Context 管理有两个层面,缺一不可:
在人机协作的语境中,「能量」是一个上位概念,涵盖所有有限的资源:
| 能量的形式 | 具体表现 | 属于谁 |
|---|---|---|
| 算力 | AI 处理 token 的运算资源 | 机 |
| 注意力 | AI 的 attention weight 分配 | 机 |
| 认知资源 | 人的脑力、专注、思考 | 人 |
| 时间 | session 的长度、Sprint 的周期 | 共享 |
| 协作累积 | 共享认知、信任基础、默契 | 共享 |
活文档稳定的「能量流向」,是在稳定所有这些能量:SDD 稳定「该往哪走」→避免认知资源浪费在错误方向;TDD 稳定「怎么验证」→避免算力浪费在重复试错;KM 稳定「踩过的坑」→避免时间浪费在重复犯错;ARCHIVE 稳定「完成的事」→避免注意力被旧东西占用。
人机协作,两边的能量都要算进去。不只是管理 AI 的算力,也在管理人的认知资源。不只是当下的消耗,也在累积跨时间的协作能量。
| 面向 | 傅里叶变换 | 活文档 |
|---|---|---|
| 管什么 | 当下 | 延续 |
| 稳定什么 | 场 | 流 |
| 时间尺度 | session 内 | 跨 session |
| 载体 | 语言的频率 | 文档的结构 |
两个加在一起,就是完整的 Context 管理。一个让对话在当下不散掉。一个让经验在时间中不流失。
VI · 隐喻:网的缝隙
容器是密封的,能量进来出不去,最终会爆炸。网有缝隙:让不需要的东西流过去;让需要留住的东西被接住。
缝隙是设计,不是缺陷。
缝隙的功能:让能量有地方流过,而非贯穿;让熵可以释放,系统不会过载;让注意力集中在真正重要的事情上。
每一条 KM 是一根丝线。你不是一次织好整张网,而是:踩一个坑,加一根丝线;遇到一个问题,补一个节点。随着经验累积,网越来越密,但缝隙依然存在。
VII · 与其他两柱的关系
Context 决定什么进来。但进来之后怎么流动?→这是 Constraints 的工作。流动之后怎么出去?→这是 Entropy 的工作。
Context 是这个循环的入口守门员。
VIII · 小结
Context 管理的核心是选择。
不是一股脑地投入所有信息,而是在每一回合有意识地去芜存菁后,才再把信息投入 Context;同时谨慎安排输出落地的形式,避免文档成为噪声。傅里叶变换提供了选择的框架:维持基频一致,让高频噪声自然流过。人作为 RAG 的主动蒸馏,提供了选择的弹性:该留的接住,该走的放行。
而当选择持续发生、语境一路维持在高浓度,注意力会开始自己延续——不需要意志去撑。专注制造密度,密度回头喂养专注,两者互相生长成一个自我延续的循环。这个循环,就是心流。
「注意力的心流」,是把每一句投入 Context 的对话、与每一份落地的活文档,都管理到极致:不用力地记住所有信息,而是让上下文在对话进行中蒸馏,最后进入一个高浓度、不涣散、自己会延续的场。
这是 Harness Engineering 的第一根柱。