列一串词:

Prompt engineering。RAG。Fine-tuning。Context engineering。Agent。MCP。A2A。Vibe coding。AI-native。Agentic workflow。Harness。Copilot。Multi-modal reasoning。

如果你是从业者,你大概对其中至少一半感到焦虑——它们出现的时候你还没搞懂上一个,它们过时的时候你刚报完课。

现在停一秒。再列一串词:

无限是什么。连续是什么。智能是什么。意识是什么。什么叫"理解"。什么叫"相似"。一条直线有多少个点。无理数为什么叫"无理"。

第二串词不会出现在任何一份 AI 岗位的 JD 里。没有人因为想过这些问题拿到 offer。没有培训班教这些。

但我越学 AI,越确信一件事——

第一串词的半衰期是六个月。第二串词的半衰期是两千年,而且还没过半。


一、跑步机

2023 年初,“prompt engineering"是最炙手可热的技能。LinkedIn 上铺天盖地的岗位。有人写书、开课、做训练营,号称掌握了它就等于掌握了 AI 时代的入场券。

一年后,ChatGPT 自己就能优化 prompt 了。那些精心设计的提示词模板,变成了模型内置的能力。

然后是 RAG——检索增强生成。大家刚搭好管道,模型的上下文窗口就从 4K 扩到了 128K,然后 1M。很多 RAG 场景变得不再必要。

然后是 Agent。然后是 MCP。然后是下一个。

你有没有注意到一个矛盾?

AI 的核心承诺是:替你做那些重复的、可模式化的技术操作。

而你正在做的是:拼命学习重复的、可模式化的技术操作,来"跟上” AI。

你在用 AI 即将淘汰的方式,去追赶 AI。

这就像一个人站在跑步机上,拼命奔跑,大汗淋漓,但没有前进一厘米。传送带的速度恰好等于他的速度。更准确地说——传送带的速度在加快,他必须越跑越快,才能维持原地不动。

但他不敢停下来。因为一旦停下来,就会被甩出去。

或者他以为会。

韩炳哲在《倦怠社会》里描述过这种状态:现代人的困境不是被谁压迫了,而是自己压迫自己。没有人逼你去学 context engineering,是你自己逼自己的。你把"没在学最新的东西"等同于"正在被淘汰"。于是你不断地学,不断地追,不断地忙。

忙起来之后,焦虑好像确实少了一点。

但那不是因为问题解决了。是因为你没时间想了。

塞内加两千年前说过一句话,放在今天依然刺痛:

我们在想象中受的苦,远多于在现实中受的苦。

—— Seneca,《道德书简》

对"被 AI 淘汰"的恐惧,驱动了对 AI 热词的追赶。但追赶本身并不消除恐惧——只是用忙碌把恐惧盖住了。夜深人静的时候,它还在。

那怎么办?

答案也许是:走下跑步机。


二、一张不会过期的清单

我有一个朋友,计算机专业,工作十年。去年他决定"系统学习 AI"。报了课,读了论文,刷了 fast.ai,搭了 RAG,跑了 fine-tuning。三个月后他跟我说:

“我能跑通所有 demo,但我总觉得自己不理解。”

我问他一个问题:两个东西"相似"是什么意思?

他愣了一下。“余弦相似度?点积?”

不不不。我说的不是公式。我说的是——在你学任何数学之前,当你说一首诗"像"另一首诗,当你说一个人的气质"像"某个演员,当你觉得今天的天空"像"小时候某个下午——你在做什么?你脑子里发生了什么?“相似"这个概念,在没有公式的情况下,到底是什么?

他想了很久,说:“我从来没想过这个问题。”

这就是问题所在。

他知道余弦相似度的公式,但他从来没想过"相似"本身是什么。所以当他看到 embedding 空间里两个向量的夹角——他能算出来,但他不知道自己在算什么

这不是一个孤例。这是一种模式。

我发现,真正理解 AI 的人——不是那些学了最多框架的人,而是那些在遇到 AI 之前就想过某些问题的人。那些问题看起来跟 AI 毫无关系,甚至看起来毫无用处。但它们是地基。

你曾经追问过…你才可能真正理解…
两个东西"相似"到底是什么意思?向量点积、余弦相似度、embedding 空间的几何意义
世界是连续的还是离散的?为什么离散的 token 能逼近连续的语义
无理数为什么叫"无理”?为什么浮点数表示的权重能逼近任意函数
空间可以超过三维吗?高维 embedding 空间的几何直觉
看同一件事,为什么角度不同结论就不同?多头注意力——同一个词从不同子空间观察
智能是什么?为什么 Transformer 不是智能,又好像是
意识是什么?“AI 有意识吗"这个问题为什么如此难回答
“知道"和"说得出"是一回事吗?语言模型的边界:它只处理能被说出的知识
信息是什么?交叉熵、信息论、LLM 为什么本质是个压缩器
“因为所以"到底是什么意思?为什么 LLM 能找到相关性却理解不了因果

左边那列没有一项会出现在简历上。右边那列是 AI 最核心的概念。

中间连接它们的是什么?

好奇心。

不是"AI 时代需要什么技能"那种功利性的好奇。是"无理数凭什么存在"那种纯粹的、不带目的的、在深夜把人从床上拽起来的困惑。


三、Ilya 的书单

2020 年,John Carmack——传奇程序员,《DOOM》和《Quake》的创造者——决定转行研究 AI。他去找 Ilya Sutskever,当时 OpenAI 的首席科学家,要了一份推荐阅读清单。

Sutskever 给了他大约三十篇论文。

如果你期待看到的是"Transformer 架构详解”、“GPT 实战指南"之类的内容,你会失望。清单里有这些:

Kolmogorov 复杂度——用程序的最短长度来定义一个事物的"复杂程度”。本质上是在问:信息是什么?

统计力学——一堆粒子的微观混乱如何产生宏观秩序。本质上是在问:秩序从哪里来?

压缩即智能——预测和压缩在数学上是等价的。一个好的压缩器就是一个好的预测器。本质上是在问:理解是什么?

看到了吗?AI 领域最核心的研究者,认为理解 AI 的前提不是读 API 文档——而是想过什么是信息、什么是秩序、什么是理解。

这不是巧合。

1960 年,物理学家 Eugene Wigner 写了一篇著名的论文:《数学在自然科学中不合理的有效性》。他感到困惑的是——数学明明是人类头脑中的纯粹游戏,为什么它能如此精确地描述物理世界?

六十年后,同样的困惑以新的形式出现了:线性代数——矩阵乘法、向量旋转、子空间投影——明明是一堆抽象运算,为什么它能产生"理解语义"的效果?为什么把"国王"减去"男人"加上"女人”,就得到"女王”?

如果你从来没被 Wigner 的问题震动过——“为什么数学能描述世界”——你就不会追问 embedding 空间为什么有效。你只会用它,但不会理解它。就像一个从未抬头看过星空的人,你可以教他查星表、用望远镜,但他不会理解天文学在做什么。

Hofstadter 在《哥德尔、艾舍尔、巴赫》里做了一件类似的事——他想理解"意识如何从物质中涌现",结果他需要同时穿越数学(哥德尔的不完备定理)、视觉艺术(埃舍尔的循环画)、音乐(巴赫的赋格)。三条线索缺任何一条,这本书都不成立。

这就是我说的——那些"没用的问题",不是装饰品。它们是你认知系统的预训练数据。


四、催化剂和原料

化学课上学过一个概念:催化剂加速反应,但不提供原料。没有原料,催化剂催化的是空气。

AI 就是催化剂。

如果你脑子里有问题——真正的、困扰你的、你自己追问过的问题——AI 是人类历史上最强的学习工具。你可以在三分钟内拿到一个概念的五种解释,看哪种击中你。你可以让它生成可视化,把抽象变成直觉。你可以跟它辩论,把半成形的想法磨出棱角。

但如果你脑子里没有问题——AI 就只是一个更高级的搜索引擎。你问它"什么是 embedding",它给你一段解释,你读完点点头,然后什么也没发生。不是 AI 的问题,是你没有足够的困惑去接住它给你的答案。

心理学家 George Loewenstein 在 1994 年提出过一个理论:信息缺口理论。他说好奇心不是凭空产生的——它产生于你意识到自己"知道一些但不够多"的那一刻。你得先知道足够多,才能感觉到缺口的存在。

换句话说:你得先困惑过,才会提问。你得先提问,AI 才能帮你。

这就是为什么同样用 ChatGPT,有人用它重新理解了微积分,有人只是用它来写周报。不是工具的差异——是进入工具之前,两个人脑子里装的东西不同。

一个想过"连续是什么"的人,遇到微积分的 ε-δ 定义时,会尖叫——“原来可以这样逼近!“一个从来没想过这个问题的人,只会记住公式,考完试忘掉。

AI 放大的不是知识,是好奇心。

你有多少好奇心,AI 就能放大多少。你有零,放大一万倍还是零。


五、那你为什么还在看我写的东西?

这是一个我必须正面回答的问题。

我写这个系列,大量使用了 AI 辅助。这不是秘密。AI 帮我查文献、校对公式、生成可视化、润色表达。从信息量的角度,你完全可以自己去问 ChatGPT,得到同样的——甚至更多的——知识。

那你为什么还在看?

我也问自己:那我为什么还在写?

这个问题困扰了我一阵子。后来我想明白了。

AI 可以给出任何答案,但它不会经历从"不懂"到"懂"的过程。

它从来没有在凌晨三点对着一个公式发呆,突然想到"等等,这不就是在说……“然后兴奋得睡不着觉。它没有过那个卡住的阶段——眼前的文字每一个字都认识,合在一起就是不懂。它也没有过那个打通的瞬间——两个原本不相干的概念,忽然在脑子里接上了。

我写的东西,信息含量可能比不上 AI 直接生成的教程。但我写的东西里有一样 AI 给不了你的——

一个人真实的困惑史。

我在哪里卡住过,我为什么卡住,我怎么绕的弯路,最后哪个瞬间通了——这条路径本身就是内容。不是知识的内容,是理解的内容

Feynman 说过:“What I cannot create, I do not understand."——我不能创造的东西,我就不理解。对我来说,这句话的变体是:我写不清楚的东西,我就没真正理解。 写作不是输出知识——是测试自己到底懂了没有。AI 辅助了表达,但那个"我到底搞懂了没有"的追问,它替代不了。

而你之所以还在看——我猜——是因为你在找共振

你不是在找信息。信息到处都有。你在找的是"有没有人跟我一样,在同一个地方感到困惑过”。你在找的是一个信号:你的困惑不是因为你笨,是因为这个东西确实难,而且值得想。

AI 能告诉你答案。但只有一个真实的人,能告诉你:“我也在这里卡了很久。”


六、学习学的到底是什么

在 AI 之前,学习的逻辑很清晰:

学一个技能 → 反复练习 → 变得熟练 → 用熟练度换取报酬 → 技能贬值 → 学下一个技能。

这个循环运转了几十年,大家习以为常。

然后 AI 来了,把中间那个环节——“反复练习变得熟练”——从几年压缩到了几分钟。你不需要花三年成为一个中等水平的程序员,Copilot 三秒钟就到了那个水平。你不需要花五年成为一个合格的翻译,GPT-4 直接跳过了这个阶段。

但这里有一个微妙的分界线。

AI 压缩的是从零到六十分的距离。从六十到九十分,依然需要深度理解。从九十到一百分,需要的是品味、直觉、以及对根本问题的长期思考。

换句话说:AI 消灭的是"熟练"的价值。但"理解"的价值不降反升。

问题是——我们的教育体系,几乎全部押注在"熟练"上。

刷题、背公式、记模板、反复练习直到形成肌肉记忆。这些训练生产的是"熟练的人”。而 AI 做的事,恰好就是生产"熟练”。

Hannah Arendt 在《人的境况》里区分了三种人类活动:

劳动(labor)——维持生存的循环性活动,做完就消失,第二天还得重新做。

工作(work)——创造持久物品的活动,留下成果。

行动(action)——改变世界和自我认知的活动,不可逆,留下意义。

追热词是劳动——循环的,消耗性的,不留下持久成果。掌握一个框架是工作——有产出,但可能过时。而追问"智能是什么”、“我到底懂了没有”——是行动。它不可逆地改变你看待世界的方式。

AI 正在接管劳动,正在侵入工作。但它几乎无法触及行动。

所以,学习学的到底是什么?

不是学答案——答案现在免费了。

是学提问。 学会问出一个好问题,比得到一万个答案更难,也更值钱。

不是学技能——技能的保质期在缩短。

是养好奇心。 对"无限是什么"的好奇心,从公元前五世纪的芝诺到今天的神经网络,跨越了两千五百年还在产生价值。

不是学当搬运工——搬运信息的活儿,AI 已经干得比你好了。

是学当策展人。 AI 时代的价值,不在于你知道多少,而在于你选择让别人看到什么、以什么顺序看到、在哪里停下来想一想。这需要判断力——而判断力的来源,是你长期思考积淀下来的品味。


七、另一种理解方式

Melanie Mitchell——研究复杂系统的科学家,侯世达的学生——在 2021 年写了一篇论文,叫《为什么 AI 比我们想的更难》。她指出了人们理解 AI 时反复犯的一个错误:

我们根本没搞清楚"智能"是什么,就开始声称自己创造了它或者快要创造它。

这句话适用于行业,也适用于每一个学习者。

你没想过"什么是智能",就去学 AI——你学的到底是什么?你学的是操作手册。你能让模型跑起来,但你不知道它在做什么,不知道它做到了什么,也不知道它还差什么。

Michael Polanyi 在 1966 年提出过一个概念:隐性知识(tacit knowledge)。“我们知道的,比我们能说出来的多。” 你能认出一张朋友的脸,但你说不出你是根据什么认出的。你能感觉一首诗好,但你无法列出它好的理由。

语言模型只处理能被说出来的知识。那些说不出来的——直觉、体感、审美、在某个路口突然的犹豫——它都没有。

如果你没有想过"知道是什么意思",你就不会意识到这个盲区。你会把 LLM 的流畅输出等同于"理解"。你会被自己的投射欺骗。

Judea Pearl 在《为什么》里论证了类似的事情:深度学习能发现相关性,但不能理解因果。如果你从来没想过"因为所以"到底是什么意思——相关性和因果性之间的鸿沟——你就会把 LLM 的模式匹配当成"推理"。你不是在理解 AI,你是在被 AI 的表象理解。

所有这些误判,根源都是同一个:

你没有在遇到 AI 之前,先花时间困惑过那些"没用的问题"。

没有地基,上面盖什么都是浮沙。


八、假象与真相

AI 热潮制造了一个空前的假象:好像人人都能理解 AI,只要你肯学。

报个班、刷个课、读几篇论文、跑通几个 demo——你的 LinkedIn 上就可以写 “AI/ML” 了。完成了。你懂 AI 了。

但"跑通 demo"和"理解"之间的距离,可能比你想的大得多。

Daniel Berlyne 在 1960 年区分了两种好奇心:消遣性好奇(diversive curiosity)和认知性好奇(epistemic curiosity)。前者是刷短视频式的——被新东西吸引,看一眼就划走。后者是被一个问题抓住,不弄清楚不罢休。

追热词,是消遣性好奇。

想搞清楚"为什么矩阵乘法能让一个模型理解语言"——是认知性好奇。

AI 热潮把消遣性好奇包装成了认知性好奇的外壳。你以为你在深入学习,但其实你只是在快速浏览。你以为你在追赶前沿,但其实你只是在追赶热度。热度和前沿不是同一件事。

真相是:

理解 AI 不是一个技术问题。它是一个思维准备问题。

准备不是学了多少小时的课。是你在学 AI 之前的那些年里,有没有认真想过世界是怎么回事。

一个想过"生命是什么"的人,面对 AI 的"智能",会本能地追问:这是生命吗?它和生命的区别在哪?——然后他会读到 Max Tegmark 的 Life 3.0,读到自组织理论,读到涌现性。一条路打开了另一条路。

一个没想过这些的人,面对 AI,只会问:怎么调参数?

两种态度都能"用" AI。但只有前者在理解 AI。


九、入场券

上一篇文章的结尾,我说:“解冻你的权重。”

那篇文章讲的是——大模型需要通识才能涌现智能,你也一样。删掉诗歌,数学变差。删掉好奇心,学什么都是空的。

这篇文章讲的是同一件事的另一面——不是所有人都能"解冻"。

能解冻的人,是那些本来就有东西被冻住了的人。他们曾经好奇过,然后被生活、工作、分科、竞争压着,暂时封存了那些好奇心。AI 的出现,给了他们重新打开的契机。

但有些人没有东西可以解冻。不是因为他们不聪明——而是因为他们从来没有被那些"没用的问题"困扰过。没有人鼓励他们想这些。学校没教,工作不考,KPI 不量。

这不是他们的错。但这是现实。

AI 出现后最大的讽刺是:大家都在学 AI,但 AI 真正教给我们的那一课,几乎没人在学。

那一课是什么?

看看 LLM 的训练过程:它读了人类写过的几乎所有文字——诗歌、代码、哲学、八卦、法律、物理——然后从中涌现出了推理、翻译、创作的能力。它没有"选专业"。它没有跳过任何领域。它把所有东西都当作原料。

它用自己的存在证明了一件事:

好奇心是智能的前提条件。

不是充分条件——好奇不保证你理解。

但一定是必要条件——没有好奇,一定不理解。

所以这篇文章的题目叫"入场券"。

不是说有了它你就能进去。是说没有它,你连门在哪儿都看不见。

那张入场券不在任何培训班里。不在任何热词里。不在任何框架的文档里。

它在你小时候望着天空想过的那些问题里。在你上课走神时脑子里冒出来的那些念头里。在你读到某句话突然停下来、盯着看了五分钟、然后说"等一下,这个我不懂"的那个瞬间里。

如果你有——恭喜,AI 时代是你的主场。拿出来用。

如果你觉得你没有——别急。好奇心不是天赋,是一种可以被重新唤醒的状态。找一个你真的想搞明白的问题。不是为了简历,不是为了 KPI,不是为了跟上谁。就是因为你想知道。

哪怕只是一个。

比如——

一条线段上到底有多少个点?

这个问题看起来"没有用"。但如果你真的去想了——你会遇到无穷、遇到连续统、遇到康托尔、遇到集合论、遇到数学的第三次危机。然后你会发现,这些东西和神经网络的表达能力、万能近似定理、以及"为什么有限的参数能表达无限的函数",竟然接上了。

到那个时候,你不需要任何人教你 AI。

因为你已经在理解 AI 了。

你只是不知道而已。


本文提到的书和论文:

  • Eugene Wigner,《数学在自然科学中不合理的有效性》(1960)
  • Douglas Hofstadter,《哥德尔、艾舍尔、巴赫》(1979)
  • Michael Polanyi,《隐性之维》(1966) —— “We know more than we can tell”
  • Daniel Berlyne,《冲突、唤起与好奇心》(1960) —— 消遣性好奇 vs 认知性好奇
  • George Loewenstein,《好奇心理学》(1994) —— 信息缺口理论
  • Hannah Arendt,《人的境况》(1958) —— 劳动 / 工作 / 行动
  • 韩炳哲,《倦怠社会》(2010) —— 自我剥削
  • Judea Pearl,《为什么》(2018) —— 因果性 vs 相关性
  • Melanie Mitchell,《Why AI Is Harder Than We Think》(2021, arXiv:2104.12871)
  • Seneca,《道德书简》—— “我们在想象中受的苦,远多于在现实中受的苦”
  • Richard Feynman —— “What I cannot create, I do not understand”