系列导航
第一幕(5 篇)+ 第二幕(5 篇)→ 查看全部▹ 第十一篇:向量——给万物一个坐标▹ 第十二篇:矩阵——空间的变形术▹ 第十三篇:概率——拥抱不确定▹ 第十四篇:高维——超越想象力▹ 第十五篇:梯度下降——数学会学习▸ 第十六篇(本文):终章——数学是人类的望远镜
回望:三幕十六篇
我们走了很远。让我们回望一下。
第一幕:数的觉醒——描述静止的世界
① 数 从结绳到数轴,抽象的起点
② 零 最伟大的发明,无中生有
③ 未知数 x 用字母代替未知,方程的开始
④ 坐标 数与形的统一,笛卡尔的礼物
⑤ 方程 自然界的源代码
第二幕:变化的语言——描述变化的世界
⑥ 函数 输入→输出的机器,GPT 也是函数
⑦ 指数 人脑理解不了的增长
⑧ 圆与波 三角函数的真面目
⑨ 微积分(上) 切碎看速度——导数
⑩ 微积分(下) 加起来的艺术——积分
第三幕:看不见的世界——AI 真正运行的舞台
⑪ 向量 给万物一个坐标
⑫ 矩阵 空间的变形术
⑬ 概率 拥抱不确定
⑭ 高维 超越想象力
⑮ 梯度下降 数学会学习
⑯ 终章(本文) 数学是人类的望远镜
从结绳记事走到梯度下降。从一万年前走到今天。人类走这段路花了几千年。而你只用了十六篇文章。
第一章:数学不是发明的
有一个古老的哲学争论:数学是人类发明的,还是发现的?
如果数学是"发明的":
→ 它只是人类的符号游戏
→ 换一种文明,会发明出不同的数学
→ 数学只是"碰巧有用"
如果数学是"发现的":
→ 数学规律早就存在,人类只是找到了它们
→ 任何文明都会发现同样的数学
→ 数学"必然有用",因为它描述的是世界本身
证据支持"发现":
- π = 3.14159… 不取决于你用什么语言、什么文明。古巴比伦人、古埃及人、古中国人、古希腊人——所有人都找到了同一个数
- 勾股定理 被不同文明独立发现:中国的《周髀算经》、古希腊的毕达哥拉斯、古印度的数学家——方法不同,结论相同
- 爱因斯坦用数学预言了引力波,100 年后我们真的测到了——数学怎么能预言一个还没观测到的物理现象?
物理学家 Eugene Wigner 写过一篇著名文章,标题就叫:“数学在自然科学中不合理的有效性”(The Unreasonable Effectiveness of Mathematics, 1960)。
他的困惑是:数学是人类在纸上画的符号,凭什么它能如此精确地描述宇宙?
这个问题至今没有令人满意的答案。
一句话记住: 数学不是"人造的工具"。它更像是宇宙的一种"语言"——人类不是作者,而是译者。
第二章:一万年的旅程
让我们把整个系列串成一条线:
~8000 BC 结绳记事 第①篇
~3000 BC 巴比伦 60 进制 第①篇
~600 BC 勾股定理(周髀算经) 第④篇
~300 BC 欧几里得《几何原本》 第④篇
~100 BC 《九章算术》方程术 第⑤⑫篇
~628 AD 零的发明(印度) 第②篇
~825 AD 代数学(花拉子密) 第③篇
1637 坐标系(笛卡尔) 第④篇
1654 概率论(帕斯卡/费马) 第⑬篇
1687 微积分(牛顿/莱布尼茨)第⑨⑩篇
1812 傅里叶变换 第⑧篇
1854 布尔代数 AI 逻辑的基础
1948 信息论(香农) 压缩即智能
1986 反向传播 第⑮篇
2017 Transformer 全系列的终点
一万年的积累,才有了今天的 AI。
每一步都建立在前一步之上。没有"零"就没有位值制,没有位值制就没有计算机;没有坐标系就没有函数,没有函数就没有导数;没有导数就没有梯度下降,没有梯度下降就没有 GPT。
数学的进步是累积的。每一个概念都是一块砖,拿掉任何一块,上面的一切都会塌。
第三章:AI 的数学全景
现在我们可以画一张完整的图——GPT 的一次推理过程中,用到了多少数学:
输入 "数学是" → 输出 "美丽的"
背后发生了什么:
1. 分词(tokenization)
"数学是" → [token_1, token_2]
2. 嵌入(embedding)→ 向量(第⑪篇)
每个 token → 768 维向量
3. 位置编码 → 三角函数(第⑧篇)
sin/cos 编码位置信息
4. Attention → 矩阵变换(第⑫篇)+ 点积(第⑪篇)
QKV 投影 = 三次矩阵乘法
注意力分数 = 向量点积
5. softmax → 指数函数(第⑦篇)+ 概率(第⑬篇)
e^x 把分数变成概率
6. 前馈网络 → 矩阵(第⑫篇)+ 函数(第⑥篇)
矩阵变换 + 激活函数
7. 输出概率 → 概率分布(第⑬篇)
P(下一个词 | 前文)
8. 采样 → 概率(第⑬篇)
从分布中选一个词
全程在高维空间(第⑭篇)中进行。
而让这一切成为可能的训练过程 = 梯度下降(第⑮篇)。
你学过的每一个概念,都在这里了。
没有一个是多余的。数、函数、指数、三角函数、微积分、向量、矩阵、概率、高维、梯度——这十六篇覆盖的概念,恰好是理解 AI 所需的全部数学基础。
第四章:数学是望远镜
1608 年,荷兰人发明了望远镜。1609 年,伽利略把望远镜对准天空,看到了木星的卫星、月球的环形山、银河系的星星。
望远镜没有创造星星。星星一直在那里。望远镜只是让人类看见了它们。
数学也是如此。
| 数学工具 | 让你看见了什么 |
|---|---|
| 数和坐标 | 万物可以被量化和定位 |
| 函数 | 变化有规律可循 |
| 指数 | 增长可以超出想象 |
| 三角函数 | 万物皆有周期 |
| 微积分 | 无穷小的累积产生有限 |
| 向量 | 事物可以用一组数来描述 |
| 矩阵 | 空间可以被变换 |
| 概率 | 不确定性可以被管理 |
| 高维 | 复杂性有容身之处 |
| 梯度下降 | 机器可以自己"学习" |
这些东西——变化的规律、增长的本质、不确定性的结构——它们一直存在。数学只是让你看见了它们。
就像望远镜让你看见了一直存在的星星。
而 AI,是这架望远镜最新的一片镜片。 它让人类看见了更多原本看不见的东西:文本中的语义结构、图像中的深层特征、蛋白质的折叠方式、新药的分子结构。AI 不是在"创造"知识,而是在帮人类"看见"更多。
第五章:写给读完这个系列的你
如果你真的从第一篇读到了这里——
你知道了"数"是怎么被发明的
你知道了"零"为什么伟大
你知道了方程是自然界的源代码
你知道了函数是万能的输入-输出机器
你知道了指数增长为什么总让人措手不及
你知道了 sin/cos 为什么出现在 AI 里
你知道了微积分就是"切碎"和"加回来"
你知道了向量是"给万物一个坐标"
你知道了矩阵是"空间的变形术"
你知道了概率是"用数学管理无知"
你知道了高维空间大得超乎想象
你知道了 AI 的学习就是"蒙眼下山"
你没有"学会"这些数学。
但你"看见"了它们。
看见,是理解的第一步。
你不需要会手算矩阵乘法。你不需要记住求导公式。你只需要知道——
当有人说"AI 做了一次矩阵变换"时,你知道那是什么意思。
当有人说"模型在做梯度下降"时,你知道那是怎么回事。
当有人说"这是一个 768 维的向量空间"时,你不会觉得这是咒语。
这就够了。
尾声
古人仰望星空,发明了历法。
牧羊人数羊群,发明了自然数。
商人计算利息,需要了指数。
物理学家追踪运动,需要了微积分。
工程师设计 AI,需要了向量、矩阵、概率、梯度。
每一次,数学都是人类为了"看见更多"而伸出的手。
而现在,AI 正在用同样的数学,帮人类看见更多。
这个故事还在继续。
《看见数学》系列 — 从结绳记事到 AI,看见数学之美。全 16 篇,完结。
本文首发于「AI 学习笔记」博客:https://Jason-Azure.github.io/ai-blog/
微信公众号:AI-lab学习笔记
系列文章完整列表见 标签:看见数学
