系列导航

第一幕(5 篇)+ 第二幕(5 篇)→ 查看全部
▹ 第十一篇:向量——给万物一个坐标
▹ 第十二篇:矩阵——空间的变形术
▹ 第十三篇:概率——拥抱不确定
▹ 第十四篇:高维——超越想象力
▹ 第十五篇:梯度下降——数学会学习
▸ 第十六篇(本文):终章——数学是人类的望远镜

回望:三幕十六篇

我们走了很远。让我们回望一下。

三幕全景
第一幕:数的觉醒——描述静止的世界
  ① 数          从结绳到数轴,抽象的起点
  ② 零          最伟大的发明,无中生有
  ③ 未知数 x    用字母代替未知,方程的开始
  ④ 坐标        数与形的统一,笛卡尔的礼物
  ⑤ 方程        自然界的源代码

第二幕:变化的语言——描述变化的世界
  ⑥ 函数        输入→输出的机器,GPT 也是函数
  ⑦ 指数        人脑理解不了的增长
  ⑧ 圆与波      三角函数的真面目
  ⑨ 微积分(上) 切碎看速度——导数
  ⑩ 微积分(下) 加起来的艺术——积分

第三幕:看不见的世界——AI 真正运行的舞台
  ⑪ 向量        给万物一个坐标
  ⑫ 矩阵        空间的变形术
  ⑬ 概率        拥抱不确定
  ⑭ 高维        超越想象力
  ⑮ 梯度下降    数学会学习
  ⑯ 终章(本文) 数学是人类的望远镜

从结绳记事走到梯度下降。从一万年前走到今天。人类走这段路花了几千年。而你只用了十六篇文章。


第一章:数学不是发明的

有一个古老的哲学争论:数学是人类发明的,还是发现的?

发明 vs 发现
如果数学是"发明的":
  → 它只是人类的符号游戏
  → 换一种文明,会发明出不同的数学
  → 数学只是"碰巧有用"

如果数学是"发现的":
  → 数学规律早就存在,人类只是找到了它们
  → 任何文明都会发现同样的数学
  → 数学"必然有用",因为它描述的是世界本身

证据支持"发现":

  • π = 3.14159… 不取决于你用什么语言、什么文明。古巴比伦人、古埃及人、古中国人、古希腊人——所有人都找到了同一个数
  • 勾股定理 被不同文明独立发现:中国的《周髀算经》、古希腊的毕达哥拉斯、古印度的数学家——方法不同,结论相同
  • 爱因斯坦用数学预言了引力波,100 年后我们真的测到了——数学怎么能预言一个还没观测到的物理现象?

物理学家 Eugene Wigner 写过一篇著名文章,标题就叫:“数学在自然科学中不合理的有效性”(The Unreasonable Effectiveness of Mathematics, 1960)。

他的困惑是:数学是人类在纸上画的符号,凭什么它能如此精确地描述宇宙?

这个问题至今没有令人满意的答案。

一句话记住: 数学不是"人造的工具"。它更像是宇宙的一种"语言"——人类不是作者,而是译者。


第二章:一万年的旅程

让我们把整个系列串成一条线:

数学的文明线
~8000 BC  结绳记事          第①篇
~3000 BC  巴比伦 60 进制     第①篇
~600 BC   勾股定理(周髀算经) 第④篇
~300 BC   欧几里得《几何原本》  第④篇
~100 BC   《九章算术》方程术   第⑤⑫篇
~628 AD   零的发明(印度)     第②篇
~825 AD   代数学(花拉子密)   第③篇
  1637    坐标系(笛卡尔)     第④篇
  1654    概率论(帕斯卡/费马) 第⑬篇
  1687    微积分(牛顿/莱布尼茨)第⑨⑩篇
  1812    傅里叶变换           第⑧篇
  1854    布尔代数             AI 逻辑的基础
  1948    信息论(香农)        压缩即智能
  1986    反向传播             第⑮篇
  2017    Transformer          全系列的终点

一万年的积累,才有了今天的 AI。

每一步都建立在前一步之上。没有"零"就没有位值制,没有位值制就没有计算机;没有坐标系就没有函数,没有函数就没有导数;没有导数就没有梯度下降,没有梯度下降就没有 GPT。

数学的进步是累积的。每一个概念都是一块砖,拿掉任何一块,上面的一切都会塌。


第三章:AI 的数学全景

现在我们可以画一张完整的图——GPT 的一次推理过程中,用到了多少数学

GPT 写一个字的背后
输入 "数学是" → 输出 "美丽的"

背后发生了什么:

1. 分词(tokenization)
   "数学是" → [token_1, token_2]

2. 嵌入(embedding)→ 向量(第⑪篇)
   每个 token → 768 维向量

3. 位置编码 → 三角函数(第⑧篇)
   sin/cos 编码位置信息

4. Attention → 矩阵变换(第⑫篇)+ 点积(第⑪篇)
   QKV 投影 = 三次矩阵乘法
   注意力分数 = 向量点积

5. softmax → 指数函数(第⑦篇)+ 概率(第⑬篇)
   e^x 把分数变成概率

6. 前馈网络 → 矩阵(第⑫篇)+ 函数(第⑥篇)
   矩阵变换 + 激活函数

7. 输出概率 → 概率分布(第⑬篇)
   P(下一个词 | 前文)

8. 采样 → 概率(第⑬篇)
   从分布中选一个词

全程在高维空间(第⑭篇)中进行。
而让这一切成为可能的训练过程 = 梯度下降(第⑮篇)。

你学过的每一个概念,都在这里了。

没有一个是多余的。数、函数、指数、三角函数、微积分、向量、矩阵、概率、高维、梯度——这十六篇覆盖的概念,恰好是理解 AI 所需的全部数学基础。


第四章:数学是望远镜

1608 年,荷兰人发明了望远镜。1609 年,伽利略把望远镜对准天空,看到了木星的卫星、月球的环形山、银河系的星星。

望远镜没有创造星星。星星一直在那里。望远镜只是让人类看见了它们。

数学也是如此。

数学让你"看见"了什么?
数学工具让你看见了什么
数和坐标万物可以被量化和定位
函数变化有规律可循
指数增长可以超出想象
三角函数万物皆有周期
微积分无穷小的累积产生有限
向量事物可以用一组数来描述
矩阵空间可以被变换
概率不确定性可以被管理
高维复杂性有容身之处
梯度下降机器可以自己"学习"

这些东西——变化的规律、增长的本质、不确定性的结构——它们一直存在。数学只是让你看见了它们。

就像望远镜让你看见了一直存在的星星。

而 AI,是这架望远镜最新的一片镜片。 它让人类看见了更多原本看不见的东西:文本中的语义结构、图像中的深层特征、蛋白质的折叠方式、新药的分子结构。AI 不是在"创造"知识,而是在帮人类"看见"更多。


第五章:写给读完这个系列的你

如果你真的从第一篇读到了这里——

你现在知道了什么
你知道了"数"是怎么被发明的
你知道了"零"为什么伟大
你知道了方程是自然界的源代码
你知道了函数是万能的输入-输出机器
你知道了指数增长为什么总让人措手不及
你知道了 sin/cos 为什么出现在 AI 里
你知道了微积分就是"切碎"和"加回来"
你知道了向量是"给万物一个坐标"
你知道了矩阵是"空间的变形术"
你知道了概率是"用数学管理无知"
你知道了高维空间大得超乎想象
你知道了 AI 的学习就是"蒙眼下山"

你没有"学会"这些数学。
但你"看见"了它们。

看见,是理解的第一步。

你不需要会手算矩阵乘法。你不需要记住求导公式。你只需要知道——

当有人说"AI 做了一次矩阵变换"时,你知道那是什么意思。

当有人说"模型在做梯度下降"时,你知道那是怎么回事。

当有人说"这是一个 768 维的向量空间"时,你不会觉得这是咒语。

这就够了。


尾声

古人仰望星空,发明了历法。

牧羊人数羊群,发明了自然数。

商人计算利息,需要了指数。

物理学家追踪运动,需要了微积分。

工程师设计 AI,需要了向量、矩阵、概率、梯度。

每一次,数学都是人类为了"看见更多"而伸出的手。

而现在,AI 正在用同样的数学,帮人类看见更多。

这个故事还在继续。


《看见数学》系列 — 从结绳记事到 AI,看见数学之美。全 16 篇,完结。
本文首发于「AI 学习笔记」博客:https://Jason-Azure.github.io/ai-blog/
微信公众号:AI-lab学习笔记
系列文章完整列表见 标签:看见数学