Shannon 没有想到的事——当信息论遇上有限算力

Shannon 说「压缩 = 预测 = 理解」。但他假设观察者有无限算力。2026 年的一篇论文补上了这个前提,提出 epiplexity——衡量有限算力观察者能从数据中学到多少结构的新度量。

2026年3月30日 · 3 分钟 · 484 字 · AI Lab

计算机只懂 0 和 1——从莫尔斯电码到 GPT 的编码简史

Token、Embedding、Encode/Decode——这些 AI 术语听起来很新,但它们和 ASCII、Unicode 是同一件事的不同层次。计算机 200 年来一直在做同一件事:把符号变成数字。

2026年3月30日 · 5 分钟 · 994 字 · AI Lab

看见数学(番外):信息论——从电报到 GPT 的一条暗线

Shannon 1948 年证明了一件事:压缩 = 预测 = 理解。76 年后,我们用万亿参数的神经网络去逼近他的定理。这是贯穿「看见数学」所有篇章的那条暗线。

2026年3月26日 · 5 分钟 · 994 字 · AI Lab

为什么用 -log(p) 做损失函数?—— 从信息论到 Cross-Entropy 的完整推导

从 Shannon 1948 年的三条公理出发,理解为什么 GPT 的 loss 必须是 -log(p):它是满足「信息量」定义的唯一函数,用它做 loss 等价于最大似然估计和最小化 KL 散度——这不是经验选择,是数学必然。

2026年3月28日 · 5 分钟 · 1063 字 · AI Lab

贝叶斯没有想到的事——一个牧师的赌博公式,如何成为 AI 的第一性原理

1763 年,一个英国牧师的遗稿里藏着一条公式。263 年后,这条公式成了 GPT 训练的数学骨架:先验 = 预训练,似然 = 数据,后验 = 微调。贝叶斯定理不只是一个公式——它是一种「带着旧知识拥抱新证据」的思维方式。而这正是 AI 学习的方式。

2026年4月6日 · 5 分钟 · 957 字 · AI Lab