马尔可夫的幽灵——从预测下一个词到预测下一步行动

1913 年,俄国数学家马尔可夫翻开普希金的《叶甫盖尼·奥涅金》,开始数元音和辅音。他不是在做文学研究,而是在拆掉一个旧世界:下一个符号不是凭空出现的,它被前一个状态牵引。一个多世纪后,LLM 被训练去预测下一个 token,Agent 被训练去选择下一步行动。这个目标看似无聊,却把语言、知识、推理和行动都压进了一个极密的监督信号里。马尔可夫没有想到 ChatGPT,但他留下了现代 AI 最小的一条语法:状态、转移、下一步。

2026年5月7日 · 6 分钟 · 1098 字 · AI Lab