上一篇 《函数》 里,我们说世界是"弯的"——非线性才是真相。
在所有非线性中,有一种最特殊、最可怕、也最重要。
它看起来温温和和,然后突然炸开。
它叫指数增长。
系列导航
第一幕 · 数的觉醒(5 篇)→ 查看全部▸ 第七篇(本文):指数爆炸——人脑理解不了的增长▹ 第八篇:圆与波——三角函数的真面目▹ 第九篇:微积分(上)——追问"此刻"▹ 第十篇:微积分(下)——加起来的艺术
第一章:一张纸的旅程
先做一个思想实验。
拿一张普通的打印纸,厚度大约 0.1 毫米。
把它对折 1 次 → 0.2 毫米。 对折 2 次 → 0.4 毫米。 对折 3 次 → 0.8 毫米。
到这里都很正常。那继续折:
对折次数 厚度 相当于什么
─────────────────────────────────────────
0 次 0.1 毫米 一张纸
3 次 0.8 毫米 一枚硬币
7 次 1.28 厘米 一根手指
10 次 10.24 厘米 一本书
17 次 13.1 米 五层楼
20 次 104.9 米 足球场的长度
25 次 3.36 公里 从家到地铁站
30 次 107.4 公里 大气层的厚度
35 次 3,436 公里 北京到广州
40 次 109,951 公里 地球周长的 2.7 倍
42 次 439,805 公里 地球到月球!!!
42 次。
一张 0.1 毫米的纸,对折 42 次,厚度足以从地球到达月球(38 万公里)。
你相信吗?
让我们算一算:0.1 毫米 × 2⁴² = 0.1 × 4,398,046,511,104 毫米 ≈ 439,805 公里。
数学不会骗你。但你的直觉骗了你。
你的大脑在默默计算的是:折一次多 0.1 毫米,折 42 次多 4.2 毫米——那是线性思维。而现实是每次翻倍——这是指数。
一句话记住: 你的大脑天生做加法(每次 +0.1),不擅长做乘法(每次 ×2)。这不是你的错——这是全人类大脑的结构性限制。
第二章:棋盘上的米粒
折纸的故事你可能听过。让我再讲一个更古老的。
传说古印度有一个智者发明了国际象棋,国王非常喜欢,说要赏赐他。
智者说:“陛下,我的要求很简单。请在棋盘的第一个格子放 1 粒米,第二个格子放 2 粒,第三个格子放 4 粒……每一格是前一格的两倍。64 个格子放完,那些米就是我的赏赐。”
国王笑了:“这么简单?”
来算算:
格子 米粒数
1 1
2 2
3 4
4 8
5 16
...
10 512
20 524,288 (五十多万)
30 536,870,912 (五亿多)
40 549,755,813,888 (五千多亿)
50 562 万亿
60 5.76 × 10¹⁷
64 9.22 × 10¹⁸ (约 922 亿亿)
922 亿亿粒米。
这大约是 4610 亿吨——相当于全世界水稻产量的 1000 年总和。
国王当然付不起。
前半段棋盘(1-32 格),总共才约 43 亿粒米——不到一个仓库。
后半段棋盘(33-64 格),米粒数量突然爆炸——超过了全人类的生产能力。
这就是指数增长最可怕的特性:前半程风平浪静,后半程天翻地覆。
第三章:中国古人的指数直觉
你可能以为指数增长是"现代数学",但中国古人早就感受到了这种"翻倍的力量"。
《庄子·天下篇》引用了一个著名命题:
“一尺之棰,日取其半,万世不竭。”
一根一尺的木棍,每天取走一半。永远取不完。
1 → ½ → ¼ → ⅛ → ¹⁄₁₆ → ……
这其实是指数衰减——增长的反面。每一步变成原来的一半,永远不会到零。庄子时代的思想家已经在思考"无穷"和"极限"——这正是后来微积分的核心问题。
另一个例子来自中国民间:
“利滚利”——中国民间对复利的直觉描述。
古代放贷者用的"驴打滚"就是指数增长:利息加入本金,下一轮连利息一起计息。《大明律》甚至专门立法限制高利贷的复利,因为老百姓太容易在复利下被压垮。
这不是因为老百姓"不会算数"——而是因为人脑天生无法直觉理解指数增长的威力。
第四章:指数 vs 线性——一场不公平的赛跑
让我们把线性增长和指数增长放在一起,看看会发生什么。
步数 线性(每次+2) 指数(每次×2)
───────────────────────────────
1 2 2 ← 起步一样
2 4 4 ← 还是一样!
3 6 8
4 8 16
5 10 32 ← 开始拉开
10 20 1,024
15 30 32,768
20 40 1,048,576 ← 一百万!
25 50 33,554,432 ← 三千三百万!
30 60 1,073,741,824 ← 十亿!
线性走了 30 步到 60
指数走了 30 步到 10 亿
前 4 步,两条线几乎重合。你觉得它们差不多。
到第 10 步,指数是线性的 50 倍。
到第 30 步,指数是线性的 1800 万倍。
这就是指数增长的"诡计":
阶段一:"没什么了不起"
1, 2, 4, 8, 16, 32...
看起来增长很慢,和线性差不多
你放松了警惕
阶段二:"好像有点快"
...128, 256, 512, 1024...
开始加速,但还在可理解范围
你开始注意到
阶段三:"完全失控"
...百万, 千万, 亿, 十亿, 百亿...
每一步的增量都超过了之前所有步的总和
你已经来不及反应了
病毒传播就是这样。 AI 的进步也是这样。
第五章:指数增长在真实世界
指数增长不只是数学游戏。它在真实世界里反复出现:
| 现象 | 翻倍时间 | 结果 |
|---|---|---|
| 复利 年利率 7% | 约 10 年翻倍 | 10 万元 30 年后变 80 万 |
| 细胞分裂 | 约 24 小时 | 一个细胞 30 天变 10 亿 |
| 病毒传播 R₀=2 | 每代传播周期 | 10 代后从 1 人变 1024 人 |
| 摩尔定律 | 约 18 个月 | 芯片性能 40 年提升百万倍 |
| 数据增长 | 约 2-3 年 | 人类数据总量每几年翻一番 |
| AI 模型规模 | 约 1-2 年 | GPT-2(2019)→GPT-4(2023): 参数量增长数千倍 |
复利:时间的魔法
10 万元,年利率 7%,不取出来:
10 年后: 约 20 万(翻 1 倍)
20 年后: 约 40 万(翻 4 倍)
30 年后: 约 80 万(翻 8 倍)
40 年后: 约 160 万(翻 16 倍)
50 年后: 约 295 万(翻 29 倍)
不是每 10 年多 10 万(线性)
而是每 10 年翻一倍(指数)
这就是为什么理财专家总说"越早开始越好"——不是因为早存多存了几年的本金,而是因为多了几轮翻倍。
病毒传播:指数的恐怖
2020 年初,新冠病毒从武汉的几个病例开始,几个月内传遍全球。
为什么这么快?因为 R₀ ≈ 2-3,意思是每个感染者平均传给 2-3 个人。
第 1 代: 1 人
第 2 代: 3 人
第 3 代: 9 人
第 5 代: 243 人
第 10 代:59,049 人
第 20 代:约 35 亿人 ← 接近全球人口的一半
当然,实际传播受到很多因素限制(隔离、免疫等)。但这解释了为什么各国反应"慢了一步"——人脑用线性直觉去预测指数增长,永远会低估它的速度。
第六章:对数——把"炸开"拉回来
指数增长太猛了,数字太大了,大到人脑无法处理。
怎么办?
数学家发明了一个工具,专门用来"驯服"指数——对数(logarithm)。
指数问的问题: 2 的 10 次方是多少?
2¹⁰ = 1024
对数问的问题: 2 的多少次方等于 1024?
log₂(1024) = 10
指数: 小数 → 大数 (2 → 1024)
对数: 大数 → 小数 (1024 → 10)
对数把"爆炸"拉回了人能理解的范围。
| 原始数字 | 对数值 (log₁₀) | 你的感受 |
|---|---|---|
| 10 | 1 | 一个教室的人 |
| 1,000 | 3 | 一个学校 |
| 1,000,000 | 6 | 一个城镇 |
| 1,000,000,000 | 9 | 全中国 |
| 1,000,000,000,000 | 12 | 国家 GDP 量级 |
从 10 到 1 万亿,原始数字变化了一千亿倍。 但对数值只从 1 变到了 12。人脑能处理了。
你天天在用对数,只是不知道:
- 地震震级:里氏 5 级和 6 级,能量差 31 倍(对数尺度)
- 分贝:声音强度的对数。90 分贝不是 45 分贝的 2 倍,而是十亿倍
- pH 值:酸碱度的对数。pH 3 比 pH 5 酸 100 倍
- 星等:天文学用对数衡量星星的亮度
这些量度用对数,是因为人类的感官本身就是"对数式"的。
韦伯-费希纳定律(心理物理学):人类感知刺激的强度,和刺激的对数成正比。
翻译:你搬一箱 1 公斤的东西,加 1 公斤你明显感觉更重了。你搬一箱 50 公斤的东西,加 1 公斤你几乎感觉不到。
你的身体天生就是"对数感知器"。 这就是为什么人脑对指数增长"失灵"——因为你的感知系统会自动把指数"压缩"成对数,让巨大的变化看起来"没什么"。
一句话记住: 指数让小变大。对数让大变小。它们是一对互逆的工具。人脑天生是"对数感知"的,所以天生看不见指数增长——数学帮你补上这个盲区。
第七章:连接 AI——指数无处不在
指数和对数在 AI 的世界里无处不在。
1. Softmax 里的 e^x
还记得上一幕讲的 Transformer 注意力公式吗?其中的 softmax 函数,核心就是 e^x(e 的 x 次方):
softmax 把一组数变成概率:
原始分数: [2.0, 1.0, 0.5]
↓ e^x
指数化: [7.39, 2.72, 1.65]
↓ 归一化(除以总和)
概率: [0.63, 0.23, 0.14] 加起来 = 1
为什么用 e^x?因为指数会放大差异:
2.0 和 1.0 只差 1
但 e^2.0 和 e^1.0 差了 2.7 倍
差异被放大了 → 最大的选项更突出
AI 用指数函数来"放大信号"——让最可能的选项更突出,让不可能的选项更安静。
2. AI 能力的 Scaling Law
2020 年,OpenAI 发表了一篇影响深远的论文,发现了一条惊人的规律:
AI 的能力提升遵循幂律(类指数关系):
模型参数量 ×10 倍 → 能力提升一个台阶
训练数据量 ×10 倍 → 能力再提升一个台阶
计算量 ×10 倍 → 能力又提升一个台阶
GPT-2 (2019): 15 亿参数
GPT-3 (2020): 1750 亿参数 ← ×117 倍
GPT-4 (2023): 传说万亿+ ← 又×几倍
每次规模翻几倍,AI 就"突然"学会了新技能
——解数学题、写代码、理解讽刺……
这些能力不是人教的,是"涌现"的
这就是为什么 AI 的进步让所有人"措手不及"——
人类用线性直觉预测:“去年 AI 进步了这么多,明年大概也这么多吧。”
但 AI 的进步是指数级的。明年的进步,可能等于过去几年的总和。
3. 摩尔定律:半个世纪的指数奇迹
1965 年,英特尔创始人戈登·摩尔预测:芯片上的晶体管数量大约每两年翻一倍。
这个预测持续了近 60 年:
1971 年 Intel 4004: 2,300 个晶体管
1989 年 Intel 486: 1,200,000 个
2000 年 Pentium 4: 42,000,000 个
2012 年: 1,400,000,000 个
2024 年 Apple M4: 28,000,000,000 个
从 2300 到 280 亿——增长了 1200 万倍
没有这条指数曲线,就没有智能手机,没有互联网,没有 AI。人类文明过去 60 年的科技进步,建立在一条指数曲线上。
一句话记住: AI 的 softmax 用 e^x 放大信号,Scaling Law 是类指数的能力增长,摩尔定律是芯片的指数进化。理解指数,就理解了为什么技术进步总是"突然"加速。
第八章:为什么人脑理解不了指数?
走到这里,值得认真想一想——为什么指数这么反直觉?
人脑的默认模式:
吃 1 碗饭 → 有点饱
吃 2 碗饭 → 更饱一点
吃 3 碗饭 → 很饱
你的大脑总结:每多吃一碗,多饱一点(线性)
这在日常生活中完全够用
但指数世界是这样的:
第 1 天存 1 元
第 2 天存 2 元
第 3 天存 4 元
...
第 30 天存 5.37 亿元
你的大脑无法处理这种跳跃
因为进化没有为它准备这种场景
原因很简单:在人类进化的几十万年里,我们面对的几乎全是线性变化。
- 多走一步,多走一米
- 多采一天果子,多吃一顿饭
- 多生一个孩子,多干一份活
大脑在这种环境下进化,形成了线性直觉。这在原始社会完全够用。
但现代世界充满了指数现象——复利、病毒、技术进步、数据增长——你的石器时代大脑在这些面前是结构性失灵的。
这不是你笨。这是所有人类共同的认知限制。
而数学——特别是指数和对数——就是帮你补上这个盲区的工具。
动手实验
实验一:亲眼看指数爆炸
# 线性 vs 指数的赛跑
print("线性 vs 指数增长")
print("─" * 50)
print(f"{'步数':>4} {'线性(+2)':>10} {'指数(×2)':>15} {'倍数':>8}")
print("─" * 50)
for n in range(0, 31, 5):
linear = 2 * n
exponential = 2 ** n
ratio = exponential / max(linear, 1)
print(f"{n:>4} {linear:>10} {exponential:>15,} {ratio:>8.0f}x")
# 输出:
# 步数 线性(+2) 指数(×2) 倍数
# ──────────────────────────────────────────────────
# 0 0 1 Inf
# 5 10 32 3x
# 10 20 1,024 51x
# 15 30 32,768 1,092x
# 20 40 1,048,576 26,214x
# 25 50 33,554,432 671,089x
# 30 60 1,073,741,824 17,895,697x
实验二:复利计算器
# 复利:时间的魔法
principal = 100000 # 本金 10 万元
rate = 0.07 # 年利率 7%
print(f"本金: {principal:,} 元,年利率: {rate*100}%")
print("─" * 40)
print(f"{'年数':>4} {'总金额':>12} {'是本金的':>8}")
print("─" * 40)
for year in [1, 5, 10, 20, 30, 40, 50]:
amount = principal * (1 + rate) ** year
multiple = amount / principal
print(f"{year:>4} {amount:>12,.0f} {multiple:>7.1f} 倍")
# 输出:
# 年数 总金额 是本金的
# ────────────────────────────────────────
# 1 107,000 1.1 倍
# 5 140,255 1.4 倍
# 10 196,715 2.0 倍
# 20 386,968 3.9 倍
# 30 761,226 7.6 倍
# 40 1,497,446 15.0 倍
# 50 2,945,703 29.5 倍
实验三:感受对数的"压缩"
import math
print("对数把'爆炸'拉回来")
print("─" * 45)
print(f"{'原始数字':>15} {'log₁₀':>6} {'相当于':>10}")
print("─" * 45)
examples = [
(10, "一个班"),
(1000, "一个学校"),
(1000000, "一个城镇"),
(1000000000, "全中国"),
(8000000000, "全人类"),
(1e18, "棋盘上的米"),
]
for num, desc in examples:
log_val = math.log10(num)
print(f"{num:>15,.0f} {log_val:>6.1f} {desc:>10}")
# 从 10 到 10^18,原始数字变化了 10^17 倍
# 但 log₁₀ 只从 1 变到了 18——人脑能处理了!
本篇小结
一、指数增长是"温和的炸弹"
- 折纸 42 次到月球,棋盘 64 格装不下全世界的米
- 前半程风平浪静,后半程天翻地覆
二、人脑天生理解不了指数
- 进化给了你线性直觉,但世界充满指数现象
- 这不是你笨,是全人类的结构性限制
三、中国古人的指数直觉
- 庄子"一尺之棰日取其半"——指数衰减与极限
- “利滚利/驴打滚”——复利的民间认知
四、对数 = 指数的反面
- 大数→小数,把"爆炸"拉回人能理解的范围
- 地震震级、分贝、pH 值——全是对数尺度
- 人的感知本身就是对数式的(韦伯-费希纳定律)
五、AI 世界里的指数
- softmax 的 e^x:放大信号差异
- Scaling Law:模型规模的类指数增长→能力"涌现"
- 摩尔定律:60 年的芯片指数进化,撑起整个数字时代
下一篇预告
我们现在认识了两种变化:线性(直线)和指数(爆炸)。
但还有一种最常见的变化我们还没聊——周而复始的变化。
白天黑夜,春夏秋冬,潮涨潮落,心脏跳动……
这些变化不是一直往上走的,而是循环往复的。描述这种循环,需要一个你在数学课上可能最痛恨的东西——
三角函数。sin,cos。
但我保证——当你知道它真正在描述什么,你会说"原来这么美"。
《看见数学》系列 — 从结绳记事到 AI,看见数学之美。
本文首发于「AI 学习笔记」博客:https://Jason-Azure.github.io/ai-blog/
微信公众号:AI-lab学习笔记
系列文章完整列表见 标签:看见数学
