AI 不是忘了你,是还没学会你
我们正在把 AI 越做越像一个带着巨大资料柜的天才:它能查资料、能翻历史、能接工具、能在一个长上下文里表现得很聪明。但查得到不等于学会了。真正的持续学习,不是让上下文窗口无限变大,而是让经验被压缩、抽象,并在未来变成能力。
我们正在把 AI 越做越像一个带着巨大资料柜的天才:它能查资料、能翻历史、能接工具、能在一个长上下文里表现得很聪明。但查得到不等于学会了。真正的持续学习,不是让上下文窗口无限变大,而是让经验被压缩、抽象,并在未来变成能力。

AI 画画不是从空白画布开始,也不是脑子里凭空想象出一只猫。扩散模型先学会一万种『猫如何被噪声毁掉』,再把这个毁掉的过程一步步倒放。生成的秘密,不是凭空创造,而是给噪声一个方向。
多模态不是让 LLM 简单长出眼睛。更准确地说,是把文字、图片、声音、视频变成模型能处理的 token 或 embedding,再让 Transformer、扩散模型、Flow、VAE、视觉编码器、音频 codec 和视频生成器协同工作。看图、听音、懂图、画图、生成视频,背后其实是几种不同的数据流。
ChatGPT 让 AI 学会了聊天,VLA 正在让 AI 学会干活。机器人终于从写死的动作脚本,走向能看、能听、能规划、能动手的通用模型。但物理世界没有撤回键,所以机器人的 GPT 时刻不会是一次突然刷屏,而是一场被数据、安全和工程慢慢推开的黎明。
压缩,是用低维形式保存高维信息的方式。大语言模型用向量与矩阵转存了人类语言中的统计规律,在解压时涌现出了我们称之为"智能"的东西。
预训练让 AI 学会文字接龙,SFT 让它学会像助手一样接龙,RLHF 让它学会哪种接龙更容易被人类喜欢。但“被喜欢”不是“真实”,“听话”不是“善良”,“安全”也不是没有价值立场。对齐 AI 的过程,表面上是在训练机器,深处是在审问人类:我们到底希望一个更聪明的存在,服从谁的规则,继承谁的偏见,代表谁的文明?