看见数学（七）：指数爆炸——人脑理解不了的增长

上一篇《函数》里，我们说世界是"弯的"——非线性才是真相。
在所有非线性中，有一种最特殊、最可怕、也最重要。
它看起来温温和和，然后突然炸开。
它叫指数增长。

系列导航
第一幕 · 数的觉醒（5 篇）→ 查看全部
▹ 第六篇：函数——万能的输入-输出机器
▸ 第七篇（本文）：指数爆炸——人脑理解不了的增长
▹ 第八篇：圆与波——三角函数的真面目
▹ 第九篇：微积分（上）——追问"此刻"
▹ 第十篇：微积分（下）——加起来的艺术

第一章：一张纸的旅程

先做一个思想实验。

拿一张普通的打印纸，厚度大约 0.1 毫米。

把它对折 1 次 → 0.2 毫米。对折 2 次 → 0.4 毫米。对折 3 次 → 0.8 毫米。

到这里都很正常。那继续折：

一张纸对折 n 次后的厚度

对折次数    厚度               相当于什么
─────────────────────────────────────────
  0 次      0.1 毫米           一张纸
  3 次      0.8 毫米           一枚硬币
  7 次      1.28 厘米          一根手指
 10 次      10.24 厘米         一本书
 17 次      13.1 米            五层楼
 20 次      104.9 米           足球场的长度
 25 次      3.36 公里          从家到地铁站
 30 次      107.4 公里         大气层的厚度
 35 次      3,436 公里         北京到广州
 40 次      109,951 公里       地球周长的 2.7 倍

 42 次      439,805 公里       地球到月球！！！

42 次。

一张 0.1 毫米的纸，对折 42 次，厚度足以从地球到达月球（38 万公里）。

你相信吗？

让我们算一算：0.1 毫米 × 2⁴² = 0.1 × 4,398,046,511,104 毫米 ≈ 439,805 公里。

数学不会骗你。但你的直觉骗了你。

你的大脑在默默计算的是：折一次多 0.1 毫米，折 42 次多 4.2 毫米——那是线性思维。而现实是每次翻倍——这是指数。

一句话记住： 你的大脑天生做加法（每次 +0.1），不擅长做乘法（每次 ×2）。这不是你的错——这是全人类大脑的结构性限制。

第二章：棋盘上的米粒

折纸的故事你可能听过。让我再讲一个更古老的。

国际象棋与米粒的传说

传说古印度有一个智者发明了国际象棋，国王非常喜欢，说要赏赐他。

智者说：“陛下，我的要求很简单。请在棋盘的第一个格子放 1 粒米，第二个格子放 2 粒，第三个格子放 4 粒……每一格是前一格的两倍。64 个格子放完，那些米就是我的赏赐。”

国王笑了：“这么简单？”

来算算：

格子   米粒数
  1    1
  2    2
  3    4
  4    8
  5    16
  ...
 10    512
 20    524,288           （五十多万）
 30    536,870,912       （五亿多）
 40    549,755,813,888   （五千多亿）
 50    562 万亿
 60    5.76 × 10¹⁷
 64    9.22 × 10¹⁸       （约 922 亿亿）

922 亿亿粒米。

这大约是 4610 亿吨——相当于全世界水稻产量的 1000 年总和。

国王当然付不起。

前半段棋盘（1-32 格），总共才约 43 亿粒米——不到一个仓库。

后半段棋盘（33-64 格），米粒数量突然爆炸——超过了全人类的生产能力。

这就是指数增长最可怕的特性：前半程风平浪静，后半程天翻地覆。

第三章：中国古人的指数直觉

你可能以为指数增长是"现代数学"，但中国古人早就感受到了这种"翻倍的力量"。

《庄子·天下篇》引用了一个著名命题：

“一尺之棰，日取其半，万世不竭。”

一根一尺的木棍，每天取走一半。永远取不完。

1 → ½ → ¼ → ⅛ → ¹⁄₁₆ → ……

这其实是指数衰减——增长的反面。每一步变成原来的一半，永远不会到零。庄子时代的思想家已经在思考"无穷"和"极限"——这正是后来微积分的核心问题。

另一个例子来自中国民间：

“利滚利”——中国民间对复利的直觉描述。

古代放贷者用的"驴打滚"就是指数增长：利息加入本金，下一轮连利息一起计息。《大明律》甚至专门立法限制高利贷的复利，因为老百姓太容易在复利下被压垮。

这不是因为老百姓"不会算数"——而是因为人脑天生无法直觉理解指数增长的威力。

第四章：指数 vs 线性——一场不公平的赛跑

让我们把线性增长和指数增长放在一起，看看会发生什么。

线性 vs 指数：一场赛跑

步数   线性(每次+2)   指数(每次×2)
───────────────────────────────
  1        2              2        ← 起步一样
  2        4              4        ← 还是一样！
  3        6              8
  4        8             16
  5       10             32        ← 开始拉开
 10       20          1,024
 15       30         32,768
 20       40      1,048,576        ← 一百万！
 25       50     33,554,432        ← 三千三百万！
 30       60  1,073,741,824        ← 十亿！

线性走了 30 步到 60
指数走了 30 步到 10 亿

前 4 步，两条线几乎重合。你觉得它们差不多。

到第 10 步，指数是线性的 50 倍。

到第 30 步，指数是线性的 1800 万倍。

这就是指数增长的"诡计"：

指数增长的三个阶段

阶段一："没什么了不起"
  1, 2, 4, 8, 16, 32...
  看起来增长很慢，和线性差不多
  你放松了警惕

阶段二："好像有点快"
  ...128, 256, 512, 1024...
  开始加速，但还在可理解范围
  你开始注意到

阶段三："完全失控"
  ...百万, 千万, 亿, 十亿, 百亿...
  每一步的增量都超过了之前所有步的总和
  你已经来不及反应了

病毒传播就是这样。 AI 的进步也是这样。

第五章：指数增长在真实世界

指数增长不只是数学游戏。它在真实世界里反复出现：

真实世界的指数增长

现象	翻倍时间	结果
复利年利率 7%	约 10 年翻倍	10 万元 30 年后变 80 万
细胞分裂	约 24 小时	一个细胞 30 天变 10 亿
病毒传播 R₀=2	每代传播周期	10 代后从 1 人变 1024 人
摩尔定律	约 18 个月	芯片性能 40 年提升百万倍
数据增长	约 2-3 年	人类数据总量每几年翻一番
AI 模型规模	约 1-2 年	GPT-2(2019)→GPT-4(2023): 参数量增长数千倍

复利：时间的魔法

10 万元，年利率 7%，不取出来：

  10 年后：  约 20 万（翻 1 倍）
  20 年后：  约 40 万（翻 4 倍）
  30 年后：  约 80 万（翻 8 倍）
  40 年后：  约 160 万（翻 16 倍）
  50 年后：  约 295 万（翻 29 倍）

不是每 10 年多 10 万（线性）
而是每 10 年翻一倍（指数）

这就是为什么理财专家总说"越早开始越好"——不是因为早存多存了几年的本金，而是因为多了几轮翻倍。

病毒传播：指数的恐怖

2020 年初，新冠病毒从武汉的几个病例开始，几个月内传遍全球。

为什么这么快？因为 R₀ ≈ 2-3，意思是每个感染者平均传给 2-3 个人。

第 1 代：     1 人
第 2 代：     3 人
第 3 代：     9 人
第 5 代：    243 人
第 10 代：59,049 人
第 20 代：约 35 亿人 ← 接近全球人口的一半

当然，实际传播受到很多因素限制（隔离、免疫等）。但这解释了为什么各国反应"慢了一步"——人脑用线性直觉去预测指数增长，永远会低估它的速度。

第六章：对数——把"炸开"拉回来

指数增长太猛了，数字太大了，大到人脑无法处理。

怎么办？

数学家发明了一个工具，专门用来"驯服"指数——对数（logarithm）。

对数 = 指数的"反面"

指数问的问题：  2 的 10 次方是多少？
                2¹⁰ = 1024

对数问的问题：  2 的多少次方等于 1024？
                log₂(1024) = 10

指数：  小数 → 大数   （2 → 1024）
对数：  大数 → 小数   （1024 → 10）

对数把"爆炸"拉回了人能理解的范围。

对数让大数变得"可读"

原始数字	对数值 (log₁₀)	你的感受
10	1	一个教室的人
1,000	3	一个学校
1,000,000	6	一个城镇
1,000,000,000	9	全中国
1,000,000,000,000	12	国家 GDP 量级

从 10 到 1 万亿，原始数字变化了一千亿倍。但对数值只从 1 变到了 12。人脑能处理了。

你天天在用对数，只是不知道：

地震震级：里氏 5 级和 6 级，能量差 31 倍（对数尺度）
分贝：声音强度的对数。90 分贝不是 45 分贝的 2 倍，而是十亿倍
pH 值：酸碱度的对数。pH 3 比 pH 5 酸 100 倍
星等：天文学用对数衡量星星的亮度

这些量度用对数，是因为人类的感官本身就是"对数式"的。

韦伯-费希纳定律（心理物理学）：人类感知刺激的强度，和刺激的对数成正比。

翻译：你搬一箱 1 公斤的东西，加 1 公斤你明显感觉更重了。你搬一箱 50 公斤的东西，加 1 公斤你几乎感觉不到。

你的身体天生就是"对数感知器"。 这就是为什么人脑对指数增长"失灵"——因为你的感知系统会自动把指数"压缩"成对数，让巨大的变化看起来"没什么"。

一句话记住： 指数让小变大。对数让大变小。它们是一对互逆的工具。人脑天生是"对数感知"的，所以天生看不见指数增长——数学帮你补上这个盲区。

第七章：连接 AI——指数无处不在

指数和对数在 AI 的世界里无处不在。

1. Softmax 里的 e^x

还记得上一幕讲的 Transformer 注意力公式吗？其中的 softmax 函数，核心就是 e^x（e 的 x 次方）：

softmax 把一组数变成概率：

  原始分数：  [2.0,  1.0,  0.5]
      ↓  e^x
  指数化：    [7.39, 2.72, 1.65]
      ↓  归一化（除以总和）
  概率：      [0.63, 0.23, 0.14]   加起来 = 1

为什么用 e^x？因为指数会放大差异：
  2.0 和 1.0 只差 1
  但 e^2.0 和 e^1.0 差了 2.7 倍
  差异被放大了 → 最大的选项更突出

AI 用指数函数来"放大信号"——让最可能的选项更突出，让不可能的选项更安静。

2. AI 能力的 Scaling Law

2020 年，OpenAI 发表了一篇影响深远的论文，发现了一条惊人的规律：

Scaling Law：AI 的"指数魔法"

AI 的能力提升遵循幂律（类指数关系）：

  模型参数量   ×10 倍  → 能力提升一个台阶
  训练数据量   ×10 倍  → 能力再提升一个台阶
  计算量      ×10 倍  → 能力又提升一个台阶

GPT-2 (2019):    15 亿参数
GPT-3 (2020):  1750 亿参数  ← ×117 倍
GPT-4 (2023):  传说万亿+    ← 又×几倍

每次规模翻几倍，AI 就"突然"学会了新技能
——解数学题、写代码、理解讽刺……
这些能力不是人教的，是"涌现"的

这就是为什么 AI 的进步让所有人"措手不及"——

人类用线性直觉预测：“去年 AI 进步了这么多，明年大概也这么多吧。”

但 AI 的进步是指数级的。明年的进步，可能等于过去几年的总和。

3. 摩尔定律：半个世纪的指数奇迹

1965 年，英特尔创始人戈登·摩尔预测：芯片上的晶体管数量大约每两年翻一倍。

这个预测持续了近 60 年：

1971 年 Intel 4004:         2,300 个晶体管
1989 年 Intel 486:        1,200,000 个
2000 年 Pentium 4:       42,000,000 个
2012 年:              1,400,000,000 个
2024 年 Apple M4:    28,000,000,000 个

从 2300 到 280 亿——增长了 1200 万倍

没有这条指数曲线，就没有智能手机，没有互联网，没有 AI。人类文明过去 60 年的科技进步，建立在一条指数曲线上。

一句话记住： AI 的 softmax 用 e^x 放大信号，Scaling Law 是类指数的能力增长，摩尔定律是芯片的指数进化。理解指数，就理解了为什么技术进步总是"突然"加速。

第八章：为什么人脑理解不了指数？

走到这里，值得认真想一想——为什么指数这么反直觉？

人脑的"线性陷阱"

人脑的默认模式：

  吃 1 碗饭 → 有点饱
  吃 2 碗饭 → 更饱一点
  吃 3 碗饭 → 很饱

  你的大脑总结：每多吃一碗，多饱一点（线性）
  这在日常生活中完全够用

但指数世界是这样的：

  第 1 天存 1 元
  第 2 天存 2 元
  第 3 天存 4 元
  ...
  第 30 天存 5.37 亿元

  你的大脑无法处理这种跳跃
  因为进化没有为它准备这种场景

原因很简单：在人类进化的几十万年里，我们面对的几乎全是线性变化。

多走一步，多走一米
多采一天果子，多吃一顿饭
多生一个孩子，多干一份活

大脑在这种环境下进化，形成了线性直觉。这在原始社会完全够用。

但现代世界充满了指数现象——复利、病毒、技术进步、数据增长——你的石器时代大脑在这些面前是结构性失灵的。

这不是你笨。这是所有人类共同的认知限制。

而数学——特别是指数和对数——就是帮你补上这个盲区的工具。

动手实验

实验一：亲眼看指数爆炸

# 线性 vs 指数的赛跑

print("线性 vs 指数增长")
print("─" * 50)
print(f"{'步数':>4}  {'线性(+2)':>10}  {'指数(×2)':>15}  {'倍数':>8}")
print("─" * 50)

for n in range(0, 31, 5):
    linear = 2 * n
    exponential = 2 ** n
    ratio = exponential / max(linear, 1)
    print(f"{n:>4}  {linear:>10}  {exponential:>15,}  {ratio:>8.0f}x")

# 输出：
# 步数    线性(+2)       指数(×2)      倍数
# ──────────────────────────────────────────────────
#    0           0                1       Inf
#    5          10               32         3x
#   10          20            1,024        51x
#   15          30           32,768     1,092x
#   20          40        1,048,576    26,214x
#   25          50       33,554,432   671,089x
#   30          60    1,073,741,824 17,895,697x

实验二：复利计算器

# 复利：时间的魔法

principal = 100000  # 本金 10 万元
rate = 0.07         # 年利率 7%

print(f"本金: {principal:,} 元，年利率: {rate*100}%")
print("─" * 40)
print(f"{'年数':>4}  {'总金额':>12}  {'是本金的':>8}")
print("─" * 40)

for year in [1, 5, 10, 20, 30, 40, 50]:
    amount = principal * (1 + rate) ** year
    multiple = amount / principal
    print(f"{year:>4}  {amount:>12,.0f}  {multiple:>7.1f} 倍")

# 输出：
#  年数        总金额    是本金的
# ────────────────────────────────────────
#    1       107,000      1.1 倍
#    5       140,255      1.4 倍
#   10       196,715      2.0 倍
#   20       386,968      3.9 倍
#   30       761,226      7.6 倍
#   40     1,497,446     15.0 倍
#   50     2,945,703     29.5 倍

实验三：感受对数的"压缩"

import math

print("对数把'爆炸'拉回来")
print("─" * 45)
print(f"{'原始数字':>15}  {'log₁₀':>6}  {'相当于':>10}")
print("─" * 45)

examples = [
    (10, "一个班"),
    (1000, "一个学校"),
    (1000000, "一个城镇"),
    (1000000000, "全中国"),
    (8000000000, "全人类"),
    (1e18, "棋盘上的米"),
]

for num, desc in examples:
    log_val = math.log10(num)
    print(f"{num:>15,.0f}  {log_val:>6.1f}  {desc:>10}")

# 从 10 到 10^18，原始数字变化了 10^17 倍
# 但 log₁₀ 只从 1 变到了 18——人脑能处理了！

本篇小结

这篇文章讲了什么？

一、指数增长是"温和的炸弹"

折纸 42 次到月球，棋盘 64 格装不下全世界的米
前半程风平浪静，后半程天翻地覆

二、人脑天生理解不了指数

进化给了你线性直觉，但世界充满指数现象
这不是你笨，是全人类的结构性限制

三、中国古人的指数直觉

庄子"一尺之棰日取其半"——指数衰减与极限
“利滚利/驴打滚”——复利的民间认知

四、对数 = 指数的反面

大数→小数，把"爆炸"拉回人能理解的范围
地震震级、分贝、pH 值——全是对数尺度
人的感知本身就是对数式的（韦伯-费希纳定律）

五、AI 世界里的指数

softmax 的 e^x：放大信号差异
Scaling Law：模型规模的类指数增长→能力"涌现"
摩尔定律：60 年的芯片指数进化，撑起整个数字时代

下一篇预告

我们现在认识了两种变化：线性（直线）和指数（爆炸）。

但还有一种最常见的变化我们还没聊——周而复始的变化。

白天黑夜，春夏秋冬，潮涨潮落，心脏跳动……

这些变化不是一直往上走的，而是循环往复的。描述这种循环，需要一个你在数学课上可能最痛恨的东西——

三角函数。sin，cos。

但我保证——当你知道它真正在描述什么，你会说"原来这么美"。

下一篇：看见数学（八）：圆与波——三角函数的真面目

《看见数学》系列 — 从结绳记事到 AI，看见数学之美。
本文首发于「AI 学习笔记」博客：https://Jason-Azure.github.io/ai-blog/
微信公众号：AI-lab学习笔记
系列文章完整列表见标签：看见数学

第一章：一张纸的旅程#

第二章：棋盘上的米粒#

第三章：中国古人的指数直觉#

第四章：指数 vs 线性——一场不公平的赛跑#

第五章：指数增长在真实世界#

复利：时间的魔法#

病毒传播：指数的恐怖#

第六章：对数——把"炸开"拉回来#

第七章：连接 AI——指数无处不在#

1. Softmax 里的 e^x#

2. AI 能力的 Scaling Law#

3. 摩尔定律：半个世纪的指数奇迹#

第八章：为什么人脑理解不了指数？#

动手实验#

实验一：亲眼看指数爆炸#

实验二：复利计算器#

实验三：感受对数的"压缩"#

本篇小结#

下一篇预告#