上一篇 《函数》 里,我们说世界是"弯的"——非线性才是真相。

在所有非线性中,有一种最特殊、最可怕、也最重要。

它看起来温温和和,然后突然炸开

它叫指数增长

系列导航

第一幕 · 数的觉醒(5 篇)→ 查看全部
▸ 第七篇(本文):指数爆炸——人脑理解不了的增长
▹ 第八篇:圆与波——三角函数的真面目
▹ 第九篇:微积分(上)——追问"此刻"
▹ 第十篇:微积分(下)——加起来的艺术

第一章:一张纸的旅程

先做一个思想实验。

拿一张普通的打印纸,厚度大约 0.1 毫米。

把它对折 1 次 → 0.2 毫米。 对折 2 次 → 0.4 毫米。 对折 3 次 → 0.8 毫米。

到这里都很正常。那继续折:

一张纸对折 n 次后的厚度
对折次数    厚度               相当于什么
─────────────────────────────────────────
  0 次      0.1 毫米           一张纸
  3 次      0.8 毫米           一枚硬币
  7 次      1.28 厘米          一根手指
 10 次      10.24 厘米         一本书
 17 次      13.1 米            五层楼
 20 次      104.9 米           足球场的长度
 25 次      3.36 公里          从家到地铁站
 30 次      107.4 公里         大气层的厚度
 35 次      3,436 公里         北京到广州
 40 次      109,951 公里       地球周长的 2.7 倍

 42 次      439,805 公里       地球到月球!!!

42 次。

一张 0.1 毫米的纸,对折 42 次,厚度足以从地球到达月球(38 万公里)。

你相信吗?

让我们算一算:0.1 毫米 × 2⁴² = 0.1 × 4,398,046,511,104 毫米 ≈ 439,805 公里。

数学不会骗你。但你的直觉骗了你。

你的大脑在默默计算的是:折一次多 0.1 毫米,折 42 次多 4.2 毫米——那是线性思维。而现实是每次翻倍——这是指数。

一句话记住: 你的大脑天生做加法(每次 +0.1),不擅长做乘法(每次 ×2)。这不是你的错——这是全人类大脑的结构性限制。


第二章:棋盘上的米粒

折纸的故事你可能听过。让我再讲一个更古老的。

国际象棋与米粒的传说

传说古印度有一个智者发明了国际象棋,国王非常喜欢,说要赏赐他。

智者说:“陛下,我的要求很简单。请在棋盘的第一个格子放 1 粒米,第二个格子放 2 粒,第三个格子放 4 粒……每一格是前一格的两倍。64 个格子放完,那些米就是我的赏赐。”

国王笑了:“这么简单?”

来算算:

格子   米粒数
  1    1
  2    2
  3    4
  4    8
  5    16
  ...
 10    512
 20    524,288           (五十多万)
 30    536,870,912       (五亿多)
 40    549,755,813,888   (五千多亿)
 50    562 万亿
 60    5.76 × 10¹⁷
 64    9.22 × 10¹⁸       (约 922 亿亿)

922 亿亿粒米。

这大约是 4610 亿吨——相当于全世界水稻产量的 1000 年总和。

国王当然付不起。

前半段棋盘(1-32 格),总共才约 43 亿粒米——不到一个仓库。

后半段棋盘(33-64 格),米粒数量突然爆炸——超过了全人类的生产能力。

这就是指数增长最可怕的特性:前半程风平浪静,后半程天翻地覆。


第三章:中国古人的指数直觉

你可能以为指数增长是"现代数学",但中国古人早就感受到了这种"翻倍的力量"。

庄子·天下篇》引用了一个著名命题:

“一尺之棰,日取其半,万世不竭。”

一根一尺的木棍,每天取走一半。永远取不完。

1 → ½ → ¼ → ⅛ → ¹⁄₁₆ → ……

这其实是指数衰减——增长的反面。每一步变成原来的一半,永远不会到零。庄子时代的思想家已经在思考"无穷"和"极限"——这正是后来微积分的核心问题。

另一个例子来自中国民间:

“利滚利”——中国民间对复利的直觉描述。

古代放贷者用的"驴打滚"就是指数增长:利息加入本金,下一轮连利息一起计息。《大明律》甚至专门立法限制高利贷的复利,因为老百姓太容易在复利下被压垮。

这不是因为老百姓"不会算数"——而是因为人脑天生无法直觉理解指数增长的威力。


第四章:指数 vs 线性——一场不公平的赛跑

让我们把线性增长和指数增长放在一起,看看会发生什么。

线性 vs 指数:一场赛跑
步数   线性(每次+2)   指数(每次×2)
───────────────────────────────
  1        2              2        ← 起步一样
  2        4              4        ← 还是一样!
  3        6              8
  4        8             16
  5       10             32        ← 开始拉开
 10       20          1,024
 15       30         32,768
 20       40      1,048,576        ← 一百万!
 25       50     33,554,432        ← 三千三百万!
 30       60  1,073,741,824        ← 十亿!

线性走了 30 步到 60
指数走了 30 步到 10 亿

前 4 步,两条线几乎重合。你觉得它们差不多。

到第 10 步,指数是线性的 50 倍。

到第 30 步,指数是线性的 1800 万倍。

这就是指数增长的"诡计":

指数增长的三个阶段
阶段一:"没什么了不起"
  1, 2, 4, 8, 16, 32...
  看起来增长很慢,和线性差不多
  你放松了警惕

阶段二:"好像有点快"
  ...128, 256, 512, 1024...
  开始加速,但还在可理解范围
  你开始注意到

阶段三:"完全失控"
  ...百万, 千万, 亿, 十亿, 百亿...
  每一步的增量都超过了之前所有步的总和
  你已经来不及反应了

病毒传播就是这样。 AI 的进步也是这样。


第五章:指数增长在真实世界

指数增长不只是数学游戏。它在真实世界里反复出现:

真实世界的指数增长
现象翻倍时间结果
复利 年利率 7%约 10 年翻倍10 万元 30 年后变 80 万
细胞分裂约 24 小时一个细胞 30 天变 10 亿
病毒传播 R₀=2每代传播周期10 代后从 1 人变 1024 人
摩尔定律约 18 个月芯片性能 40 年提升百万倍
数据增长约 2-3 年人类数据总量每几年翻一番
AI 模型规模约 1-2 年GPT-2(2019)→GPT-4(2023): 参数量增长数千倍

复利:时间的魔法

10 万元,年利率 7%,不取出来:

  10 年后:  约 20 万(翻 1 倍)
  20 年后:  约 40 万(翻 4 倍)
  30 年后:  约 80 万(翻 8 倍)
  40 年后:  约 160 万(翻 16 倍)
  50 年后:  约 295 万(翻 29 倍)

不是每 10 年多 10 万(线性)
而是每 10 年翻一倍(指数)

这就是为什么理财专家总说"越早开始越好"——不是因为早存多存了几年的本金,而是因为多了几轮翻倍

病毒传播:指数的恐怖

2020 年初,新冠病毒从武汉的几个病例开始,几个月内传遍全球。

为什么这么快?因为 R₀ ≈ 2-3,意思是每个感染者平均传给 2-3 个人

第 1 代:     1 人
第 2 代:     3 人
第 3 代:     9 人
第 5 代:    243 人
第 10 代:59,049 人
第 20 代:约 35 亿人 ← 接近全球人口的一半

当然,实际传播受到很多因素限制(隔离、免疫等)。但这解释了为什么各国反应"慢了一步"——人脑用线性直觉去预测指数增长,永远会低估它的速度。


第六章:对数——把"炸开"拉回来

指数增长太猛了,数字太大了,大到人脑无法处理。

怎么办?

数学家发明了一个工具,专门用来"驯服"指数——对数(logarithm)

对数 = 指数的"反面"
指数问的问题:  2 的 10 次方是多少?
                2¹⁰ = 1024

对数问的问题:  2 的多少次方等于 1024?
                log₂(1024) = 10

指数:  小数 → 大数   (2 → 1024)
对数:  大数 → 小数   (1024 → 10)

对数把"爆炸"拉回了人能理解的范围。

对数让大数变得"可读"
原始数字对数值 (log₁₀)你的感受
101一个教室的人
1,0003一个学校
1,000,0006一个城镇
1,000,000,0009全中国
1,000,000,000,00012国家 GDP 量级

从 10 到 1 万亿,原始数字变化了一千亿倍。 但对数值只从 1 变到了 12。人脑能处理了。

你天天在用对数,只是不知道:

  • 地震震级:里氏 5 级和 6 级,能量差 31 倍(对数尺度)
  • 分贝:声音强度的对数。90 分贝不是 45 分贝的 2 倍,而是十亿倍
  • pH 值:酸碱度的对数。pH 3 比 pH 5 酸 100 倍
  • 星等:天文学用对数衡量星星的亮度

这些量度用对数,是因为人类的感官本身就是"对数式"的。

韦伯-费希纳定律(心理物理学):人类感知刺激的强度,和刺激的对数成正比。

翻译:你搬一箱 1 公斤的东西,加 1 公斤你明显感觉更重了。你搬一箱 50 公斤的东西,加 1 公斤你几乎感觉不到。

你的身体天生就是"对数感知器"。 这就是为什么人脑对指数增长"失灵"——因为你的感知系统会自动把指数"压缩"成对数,让巨大的变化看起来"没什么"。

一句话记住: 指数让小变大。对数让大变小。它们是一对互逆的工具。人脑天生是"对数感知"的,所以天生看不见指数增长——数学帮你补上这个盲区。


第七章:连接 AI——指数无处不在

指数和对数在 AI 的世界里无处不在。

1. Softmax 里的 e^x

还记得上一幕讲的 Transformer 注意力公式吗?其中的 softmax 函数,核心就是 e^x(e 的 x 次方):

softmax 把一组数变成概率:

  原始分数:  [2.0,  1.0,  0.5]
      ↓  e^x
  指数化:    [7.39, 2.72, 1.65]
      ↓  归一化(除以总和)
  概率:      [0.63, 0.23, 0.14]   加起来 = 1

为什么用 e^x?因为指数会放大差异:
  2.0 和 1.0 只差 1
  但 e^2.0 和 e^1.0 差了 2.7 倍
  差异被放大了 → 最大的选项更突出

AI 用指数函数来"放大信号"——让最可能的选项更突出,让不可能的选项更安静。

2. AI 能力的 Scaling Law

2020 年,OpenAI 发表了一篇影响深远的论文,发现了一条惊人的规律:

Scaling Law:AI 的"指数魔法"
AI 的能力提升遵循幂律(类指数关系):

  模型参数量   ×10 倍  → 能力提升一个台阶
  训练数据量   ×10 倍  → 能力再提升一个台阶
  计算量      ×10 倍  → 能力又提升一个台阶

GPT-2 (2019):    15 亿参数
GPT-3 (2020):  1750 亿参数  ← ×117 倍
GPT-4 (2023):  传说万亿+    ← 又×几倍

每次规模翻几倍,AI 就"突然"学会了新技能
——解数学题、写代码、理解讽刺……
这些能力不是人教的,是"涌现"的

这就是为什么 AI 的进步让所有人"措手不及"——

人类用线性直觉预测:“去年 AI 进步了这么多,明年大概也这么多吧。”

但 AI 的进步是指数级的。明年的进步,可能等于过去几年的总和。

3. 摩尔定律:半个世纪的指数奇迹

1965 年,英特尔创始人戈登·摩尔预测:芯片上的晶体管数量大约每两年翻一倍。

这个预测持续了近 60 年:

1971 年 Intel 4004:         2,300 个晶体管
1989 年 Intel 486:        1,200,000 个
2000 年 Pentium 4:       42,000,000 个
2012 年:              1,400,000,000 个
2024 年 Apple M4:    28,000,000,000 个

从 2300 到 280 亿——增长了 1200 万倍

没有这条指数曲线,就没有智能手机,没有互联网,没有 AI。人类文明过去 60 年的科技进步,建立在一条指数曲线上。

一句话记住: AI 的 softmax 用 e^x 放大信号,Scaling Law 是类指数的能力增长,摩尔定律是芯片的指数进化。理解指数,就理解了为什么技术进步总是"突然"加速。


第八章:为什么人脑理解不了指数?

走到这里,值得认真想一想——为什么指数这么反直觉?

人脑的"线性陷阱"
人脑的默认模式:

  吃 1 碗饭 → 有点饱
  吃 2 碗饭 → 更饱一点
  吃 3 碗饭 → 很饱

  你的大脑总结:每多吃一碗,多饱一点(线性)
  这在日常生活中完全够用

但指数世界是这样的:

  第 1 天存 1 元
  第 2 天存 2 元
  第 3 天存 4 元
  ...
  第 30 天存 5.37 亿元

  你的大脑无法处理这种跳跃
  因为进化没有为它准备这种场景

原因很简单:在人类进化的几十万年里,我们面对的几乎全是线性变化。

  • 多走一步,多走一米
  • 多采一天果子,多吃一顿饭
  • 多生一个孩子,多干一份活

大脑在这种环境下进化,形成了线性直觉。这在原始社会完全够用。

但现代世界充满了指数现象——复利、病毒、技术进步、数据增长——你的石器时代大脑在这些面前是结构性失灵的。

这不是你笨。这是所有人类共同的认知限制。

而数学——特别是指数和对数——就是帮你补上这个盲区的工具。


动手实验

实验一:亲眼看指数爆炸

# 线性 vs 指数的赛跑

print("线性 vs 指数增长")
print("─" * 50)
print(f"{'步数':>4}  {'线性(+2)':>10}  {'指数(×2)':>15}  {'倍数':>8}")
print("─" * 50)

for n in range(0, 31, 5):
    linear = 2 * n
    exponential = 2 ** n
    ratio = exponential / max(linear, 1)
    print(f"{n:>4}  {linear:>10}  {exponential:>15,}  {ratio:>8.0f}x")

# 输出:
# 步数    线性(+2)       指数(×2)      倍数
# ──────────────────────────────────────────────────
#    0           0                1       Inf
#    5          10               32         3x
#   10          20            1,024        51x
#   15          30           32,768     1,092x
#   20          40        1,048,576    26,214x
#   25          50       33,554,432   671,089x
#   30          60    1,073,741,824 17,895,697x

实验二:复利计算器

# 复利:时间的魔法

principal = 100000  # 本金 10 万元
rate = 0.07         # 年利率 7%

print(f"本金: {principal:,} 元,年利率: {rate*100}%")
print("─" * 40)
print(f"{'年数':>4}  {'总金额':>12}  {'是本金的':>8}")
print("─" * 40)

for year in [1, 5, 10, 20, 30, 40, 50]:
    amount = principal * (1 + rate) ** year
    multiple = amount / principal
    print(f"{year:>4}  {amount:>12,.0f}  {multiple:>7.1f} 倍")

# 输出:
#  年数        总金额    是本金的
# ────────────────────────────────────────
#    1       107,000      1.1 倍
#    5       140,255      1.4 倍
#   10       196,715      2.0 倍
#   20       386,968      3.9 倍
#   30       761,226      7.6 倍
#   40     1,497,446     15.0 倍
#   50     2,945,703     29.5 倍

实验三:感受对数的"压缩"

import math

print("对数把'爆炸'拉回来")
print("─" * 45)
print(f"{'原始数字':>15}  {'log₁₀':>6}  {'相当于':>10}")
print("─" * 45)

examples = [
    (10, "一个班"),
    (1000, "一个学校"),
    (1000000, "一个城镇"),
    (1000000000, "全中国"),
    (8000000000, "全人类"),
    (1e18, "棋盘上的米"),
]

for num, desc in examples:
    log_val = math.log10(num)
    print(f"{num:>15,.0f}  {log_val:>6.1f}  {desc:>10}")

# 从 10 到 10^18,原始数字变化了 10^17 倍
# 但 log₁₀ 只从 1 变到了 18——人脑能处理了!

本篇小结

这篇文章讲了什么?

一、指数增长是"温和的炸弹"

  • 折纸 42 次到月球,棋盘 64 格装不下全世界的米
  • 前半程风平浪静,后半程天翻地覆

二、人脑天生理解不了指数

  • 进化给了你线性直觉,但世界充满指数现象
  • 这不是你笨,是全人类的结构性限制

三、中国古人的指数直觉

  • 庄子"一尺之棰日取其半"——指数衰减与极限
  • “利滚利/驴打滚”——复利的民间认知

四、对数 = 指数的反面

  • 大数→小数,把"爆炸"拉回人能理解的范围
  • 地震震级、分贝、pH 值——全是对数尺度
  • 人的感知本身就是对数式的(韦伯-费希纳定律)

五、AI 世界里的指数

  • softmax 的 e^x:放大信号差异
  • Scaling Law:模型规模的类指数增长→能力"涌现"
  • 摩尔定律:60 年的芯片指数进化,撑起整个数字时代

下一篇预告

我们现在认识了两种变化:线性(直线)和指数(爆炸)。

但还有一种最常见的变化我们还没聊——周而复始的变化

白天黑夜,春夏秋冬,潮涨潮落,心脏跳动……

这些变化不是一直往上走的,而是循环往复的。描述这种循环,需要一个你在数学课上可能最痛恨的东西——

三角函数。sin,cos。

但我保证——当你知道它真正在描述什么,你会说"原来这么美"。

下一篇:看见数学(八):圆与波——三角函数的真面目


《看见数学》系列 — 从结绳记事到 AI,看见数学之美。
本文首发于「AI 学习笔记」博客:https://Jason-Azure.github.io/ai-blog/
微信公众号:AI-lab学习笔记
系列文章完整列表见 标签:看见数学