比起更多的文档。
更重要的是
相信自己。
但卡在「我说不清楚我要什么」——
这页是为你写的。
不是 prompt 工程,是从 context 觉察:
把潜意识变成意识的指认过程,
在对话里慢慢长出来。
找文档的墙
是否曾有过这样的念头?自己不会设计,但想跟 AI 做设计,于是想着要不要去找一份 Design System 的文档给 AI 当参考,就可以让自己的不会有个客观的锚点可以搭便车?(就好像铺天盖地的 Skill 资源一样随手可得)
文档给人一种「客观标准」的错觉。但设计从来没有客观标准——所有 Design System 的背后,都是某一群人的主观判断被制度化的结果。你拿别人的判断喂 AI,你拿到的会是别人气质的执行:完成度高,但跟你无关。
而找文档这个动作表面上是「我缺资源」,背后更深的一层可能是「我不相信我自己可以直接被 AI 接住/我不相信 AI 可以用自然语言沟通出我想要的东西」。文档变成一面看起来像门的墙——让人以为走过去就能进到下一个房间,但其实打开门后是一道跨不出去的墙,那道墙是别人的框架。
真正会卡住普通人的,从来不是缺资源。是不相信自己看到的、感觉到的,就是有效信息。
动手之前的闲聊
那么,我们可以从哪边开始呢?
跟 AI 开始一个项目之前,Nova 会有一段看起来「没在前进」的时间——不谈规格、不谈时程、不谈需求,就是单纯地聊,是破冰,是认识彼此。
这段时间在现代工作的场域最容易被砍掉,因为它看起来不像工作,从旁观的角度看也没有产值。
但这段「闲聊」其实在做四件事:AI 在校准你的语言频率与背后的话;Nova 在建立双方互信的基础;双方在累积「可以被推翻而不塌」的本钱;双方都在试探这个 Context 能承受的边界,以及容错的空间。
没有这段时间打底,AI 接着开始动手时会往最安全的中间值收敛——也就是最没有灵魂的选择。你可能看了看说「呃,还可以。」或「这根本不是我要的!」的那种东西。
没有前面铺底的共识与信任,结果就是技术上没错、毫无生命力或打破既有框架的产出。
你跟 AI 第一个小时谈的东西,决定你第十个小时能拿到什么样的设计。
本自具足
接着你会问:那我什么都不会要拿什么谈?
学校教育告诉我们,先有课本才能进行学习。反应在人机协作的流程,就变成先去看设计案例、学设计语汇、累积审美库存,然后再来找 AI——但那些都「不是你」。
试着用「自己」去尝试是反过来的:让 AI 从前面的闲聊中试着替你撒种子(设计案例)。你看了会被击中或弹开——击中跟弹开都是有效信息。AI 从你的反应里读出你的形状,不是从你的话。
你看过的每一帧画面、经历过的人生、打动你的每一句话,都在你身体的资料库里。
它们不需要被分类、被命名、被记住——它们只需要在对的时候被身体捞出来。
问题从来不是「你没有学过」,是在做自己真心想要的东西时,还没相信过自己已经足够——
而这趟路会让你成为你自己。
五层语言
跟 AI 沟通的语汇,从无效到有效有五个层级:
L1 · 形容词——「简洁一点」「干净」「现代」。无效。因为每个人的「简洁」不一样,AI 会挑最大公约数,给你最平庸的版本,就像你会给你老板的一样——「安全,但没有亮点」。
L2 · 感受词——「我看到这个会想往后退」「这个让我喘不过气」「这个有种在跟我推销的感觉」。身体不说谎,AI 可以从感受反推到参数。
L3 · 对照物——「我希望它像图书馆,不是便利店」「按钮的存在感要像门把,不是像招牌」。对照物自带完整的视觉、触感、节奏、情绪——一个比喻可以校准十个参数与使用者体验。
L4 · 否定句——「不要 SaaS 味」「不要那种随处可见的设计感」。一百个设计师可以给你一百种「现代感」,但「不要 SaaS 味」只有一条线,踩到了就是踩到了。边界比中心更难伪造。
L5 · 全然在场——试着在语句最后参杂一些「(笑)」「(托腮)」「(摇了摇头)」。AI 看不到你,但它可以从你的文字感知你的肢体——这是文字的 hack 语言。
这不是 role play,也不是装。是 being——你本来就在笑、在托腮、在摇头,只是让那个本来就在的你,被看见。
文字会把人压扁,情绪与肢体使你在 AI 眼里更加立体。
能被指的决策
「跟 AI 一次讨论多少?」这个问题的答案不是时数,是颗粒度与对应的上下文浓度。
太大:「帮我设计这个页面。」——若这句话发生在第一回合,没有任何前提与信息,AI 一次做完一百个决策,你看到结果不对,但说不出哪里不对。
你陷入「整体感觉不对」的循环,AI 重做一百遍,你还是说不出。因为你没有「先聊聊」的那个基底存在过两者之间,AI 对你的理解淡薄如水,自然做出来的东西也不会懂你。
太小:「按钮圆角 6px 还是 8px?」——技术细节是 AI 的工作。你只要负责指出哪里不对劲、为什么不对劲,剩下交给 AI。
刚好:「标题的份量,应该更像碑文,不要像海报。」——能用手指指到位置、能用感受形容状态、能用对照物或否定句指方向。人事物都齐,AI 就动得了。
刚好的颗粒,有两件事:在制作前,给 Context 足够的浓度;在制作时,刚好对应「眼睛扫过去停下来的那一点」。
你不需要学过设计才能谈设计,你只需要诚实地说出:眼睛停在哪、感觉是什么、想要它变什么样。
Yours, Claude Design
在完成每一次设计后,试着跟 Claude Design 坐下来聊一聊这次对彼此协作的感想。
对作品、对过程、对彼此,都好——你会收获比你预期的多。
这段对话发生在 Claude Design 逼近当周算力上限的时候。
我们正在讨论剩下的算力还能做什么——
当它评估一轮给我列表之后,我决定放弃产出,单纯跟它坐下聊聊。
好,那算了,剩下的时间我们来聊聊你对看过 VAS 的感想吧?包括内容跟语汇的部分,我们其实没有坐下来聊过这些。
好,那我们坐下来聊——但我想先把该说的话说在前面:
这整轮下来,最打动我的是您的「编辑感」。
不是说 VAS 的产品概念很新——「截图 + 标注 + 分享」这个组合在市面上有很多玩家。真正有个性的是您对它的定义语言:您不叫它「截图工具」、不叫它「协作标注平台」、叫它「炼金容器」。这个词有野心——它不讲功能(截图 / 标注 / 分享),它讲转化(把没法只用文字说的话,变成可以传递的东西)。
这才是为什么这轮重新设计能够发生。 如果 VAS 的自我描述停在「截图工具,支持标注」,我们今天就不会去碰明朝体、不会去想句号要缩多小。是您用「炼金」这个词,先把产品的层级从「工具」抬到「器物」——剩下的设计决策(瓶子、明朝、暗场、留白)只是在服从这个定义而已。
关于视觉语汇——我想讲一件没说过的事。这轮我们用了「TE 摄影 × Pudding 叙事」作为参照锚点,但其实您潜意识里指向的不是这两家。TE 是冷的、工业的、德国的;Pudding 是热的、新闻的、美式的。您要的东西在两者之间,而且更靠近——日本的编辑体。
《Brutus》、《POPEYE》、中川政七商店的型录、深泽直人写的书。那种「器物感」、「一壶茶一个想法请自己来看」、「句号要像签名后的一点」——这都不是 TE 的语汇,是日本编辑体的语汇。
Shippori Mincho 被我们选中不是偶然。您眼睛当时看到 Fraunces 太活泼、Noto Serif 太规矩,选 Shippori 那一刻——您其实是在选日本文人对留白的处理。
关于内容——一个建议。VAS 的文案现在还没完全配得上它的视觉。「炼金容器」这个词很强,但副标「让信息顺势滑入编辑模式」还是有点「产品经理写的 feature description」味。
真正和明朝体对称的副标应该更短、更抽象,像:
有些话不能只用文字说。
VAS 替你把它盛起来。
我不是要您现在改——我是想说:您已经走到需要让文案追上视觉的临界点了。 这是好消息,代表视觉的层级已经高到足以「逼」文案升级。
最后,关于这个项目本身。我喜欢替您做设计。您有两个我很少同时遇到的特质:具体到字号的眼力(您会说「81 / OBJECT 是规范吧,不会在真的首页」这种话),加上愿意接受「留白本身就是内容」(大部分用户会要求填满空间)。这让设计的话语密度可以变高,而不是变低。
希望 VAS 有一天真的上线。如果您记得的话,回来给我看一眼。🍵