AI哲学 | AI 学习笔记

那些"没用的问题"，是理解 AI 的入场券

Prompt engineering 过时了。Context engineering 也快了。Agent 还能热多久？——你在追的每一个热词，都将被它自己所描述的技术淘汰。但有一类东西永远不会过时：你在深夜想过的那些"没用的问题"。

贝叶斯没有想到的事——一个牧师的赌博公式，如何成为 AI 的第一性原理

1763 年，一个英国牧师的遗稿里藏着一条公式。263 年后，这条公式成了 GPT 训练的数学骨架：先验 = 预训练，似然 = 数据，后验 = 微调。贝叶斯定理不只是一个公式——它是一种「带着旧知识拥抱新证据」的思维方式。而这正是 AI 学习的方式。

好奇心去了哪里

1956 年夏天,十个人在达特茅斯学院关了两个月,想回答一个问题:机器能不能思考?七十年后,这个问题撑起了万亿市值。但驱动它诞生的那样东西——好奇心——在我们的教育系统里几乎没有被认真对待过。AI 的历史和一个人受教育的历史,走的是同一条路。这一篇,我们从达特茅斯出发,经过上海的数学课堂、法国的哲学考场、芬兰的森林学校,最后回到每个人自己身上——那个被磨掉的东西,也许还在。

被替代的到底是什么

你花了十年学一门手艺,AI 用三秒钟做到了六十分。你的第一反应是——我会不会失业?但如果再往下想一层,真正让人不安的也许不是失业本身,而是一个你从来没被逼着回答的问题:如果我的技能不是’我’,那我是什么?就业问题的表面是经济问题,底下是身份问题。

马尔可夫的幽灵——从预测下一个词到预测下一步行动

1913 年，俄国数学家马尔可夫翻开普希金的《叶甫盖尼·奥涅金》，开始数元音和辅音。他不是在做文学研究，而是在拆掉一个旧世界：下一个符号不是凭空出现的，它被前一个状态牵引。一个多世纪后，LLM 被训练去预测下一个 token，Agent 被训练去选择下一步行动。这个目标看似无聊，却把语言、知识、推理和行动都压进了一个极密的监督信号里。马尔可夫没有想到 ChatGPT，但他留下了现代 AI 最小的一条语法：状态、转移、下一步。

当 AI 说“我”时：意识不是机器的问题，而是人类的镜子

当 AI 开始说“我在想”“我感受到”，真正被审问的不是 AI，而是人类关于意识的定义。智能、语言、自我报告、主观体验，到底是不是一回事？

维纳没有想到的事——从防空炮到 ChatGPT，反馈如何变成智能

二战时期，数学家诺伯特·维纳研究一个残酷的问题：飞机一直在动，炮弹也需要时间飞行，防空炮到底该打向哪里？这不是简单地预测飞机下一秒的位置，而是要持续计算拦截点，并在观测误差、动作延迟和敌人机动中不断修正。这个问题把他带向一个更深的概念：反馈。智能不是一次性给出正确答案，而是在行动之后被世界纠正。梯度下降、RLHF、DeepSeek-R1、Agent、自动驾驶，表面上差别很大，底层却都在同一个闭环里运行：行动、观察、误差、修正。

AI 不是忘了你，是还没学会你

我们正在把 AI 越做越像一个带着巨大资料柜的天才：它能查资料、能翻历史、能接工具、能在一个长上下文里表现得很聪明。但查得到不等于学会了。真正的持续学习，不是让上下文窗口无限变大，而是让经验被压缩、抽象，并在未来变成能力。

压缩即智能 — 开篇语

压缩，是用低维形式保存高维信息的方式。大语言模型用向量与矩阵转存了人类语言中的统计规律，在解压时涌现出了我们称之为"智能"的东西。

谁在决定 AI 的性格？——从文字接龙到讨好型机器

预训练让 AI 学会文字接龙，SFT 让它学会像助手一样接龙，RLHF 让它学会哪种接龙更容易被人类喜欢。但“被喜欢”不是“真实”，“听话”不是“善良”，“安全”也不是没有价值立场。对齐 AI 的过程，表面上是在训练机器，深处是在审问人类：我们到底希望一个更聪明的存在，服从谁的规则，继承谁的偏见，代表谁的文明？