看见物理(四):动量——惯性的力量
动量守恒比能量守恒更基本——因为它直接来自空间的对称性。而 AI 优化器里的 Momentum,不是比喻,就是物理动量的直接移植:让参数更新有了"惯性",不被噪声带跑。
动量守恒比能量守恒更基本——因为它直接来自空间的对称性。而 AI 优化器里的 Momentum,不是比喻,就是物理动量的直接移植:让参数更新有了"惯性",不被噪声带跑。
1865 年,一个德国人造了一个新词来形容世界的衰败;1948 年,一个美国人用同一个公式描述电报的成本;2025 年,你电脑里每一次 AI 推理,都在重演这条 160 年的暗线。熵不是公式——它是人类第一次承认「我不知道」,然后把这份无知量化成数学。
DeepSeek 给你编一个根本不存在的 API;国产大模型给研究生伪造 8 篇参考文献;自媒体因 AI 编造权威数据被封号 12 万粉。你以为 AI 在骗你 —— 不,它比骗更糟。骗人要先知道真相再刻意背离;AI 连真相这个坐标都没有。它是在胡诌。这篇把原理讲透。
AlphaFold 拿了诺贝尔奖,GPT 通过了律师考试——但 Sora 的玻璃穿过了桌子。LLM 到底懂不懂这个世界?LeCun 离开 Meta 创办 AMI Labs,李飞飞押注 World Labs,谢赛宁两次拒绝 Ilya——站在前沿的人给出了截然不同的答案。
水加热到 99 度还是水,加到 100 度就成了水蒸气——这一度里发生了什么?磁铁加热到居里温度就突然失去磁性,为什么是突然?GPT-3 到 GPT-4 的『涌现能力』像凭空出现,又为什么?物理学用了一个多世纪建立了一套数学描述『量变到质变』——它叫临界现象。今天 AI 研究者在讨论的 emergent abilities,是它的直系后裔。
1927 年的索尔维会议,爱因斯坦扔下一句『上帝不掷骰子』。100 年后,答案渐渐浮现:不是上帝在掷骰子——是『测量』这个动作本身在创造骰子的点数。量子力学不是『粒子在跑』,是『信念在更新』。它是贝叶斯定理的终极物理版:先验 × 证据 = 后验,只是这一次,先验就是世界的全部。
1918 年,一位被哥廷根大学拒绝授予教职的犹太女数学家,写下了一行让物理学换骨的定理:每一个对称,都对应一个守恒量。从此能量、动量、电磁场、质量,都成了宇宙『不在乎什么』的影子。这一篇,我们用对称性把整个系列串起来,也借此向《看见物理》八篇告别——并把这副从物理里磨出来的眼睛,带到下一个十字路口。
2026 年 3 月,菲尔兹奖得主 Michael Freedman 发了一篇只有 30 多页的论文,标题叫《Compression is all you need》。他用一个优雅的代数模型回答了三个古老问题:人类怎么构建数学?人类数学和形式数学的本质区别是什么?未来人类数学家如何和 AI 协作?答案只有两个字——压缩。
2025 年 1 月底,一家此前在英文世界几乎没人念得对名字的中国公司,把英伟达推下悬崖。但故事不是『中国赢了』,也不是『开源赢了』。真正发生的事情是:那条所有人以为只有一条的路,在那一周分了岔。开源与闭源、通用与垂直、Transformer 之后、大模型与小模型、连发明者本身都散去了不同方向——AI 的未来不再是一个,而是同时有几个。这一篇,我们站在路口往几个方向看,听听站在路口的那些人怎么说,再画一张可以反复对照的地图。
一个五年级的孩子用 ChatGPT 写完了周末的读后感。文笔流畅,结构工整,用词比他平时好两个等级。他妈妈看完说不出哪里不对,但就是觉得哪里不对。她的直觉是准的——那篇文章里什么都有,唯独没有她儿子。这件事让我想了很久。不是因为 AI,是因为它把一个教育里一直存在、但大家可以假装看不见的问题,推到了聚光灯底下。