大理石假说——为什么微调不是在教 AI 新东西

预训练用了 15 万亿 tokens,微调只用了 1000 条。数据量差了一百亿倍,但行为变化却翻天覆地。更诡异的是,微调和预训练的算法完全一样——同样的反向传播、同样的梯度下降。那凭什么微调能起作用?答案简单到令人不安:因为你停了。

2026年4月11日 · 5 分钟 · 1012 字 · AI Lab

谁在决定 AI 的性格?——从文字接龙到讨好型机器

预训练让 AI 学会文字接龙,SFT 让它学会像助手一样接龙,RLHF 让它学会哪种接龙更容易被人类喜欢。但“被喜欢”不是“真实”,“听话”不是“善良”,“安全”也不是没有价值立场。对齐 AI 的过程,表面上是在训练机器,深处是在审问人类:我们到底希望一个更聪明的存在,服从谁的规则,继承谁的偏见,代表谁的文明?

2026年5月14日 · 6 分钟 · 1178 字 · AI Lab