AI 学习笔记

DeepSeek-R1：一个模型如何学会「思考」

2025 年最大的 AI 突破不是更大的模型，而是一个模型学会了停下来想一想再回答。DeepSeek-R1 登上 Nature，证明了一件事：不需要人类手把手教推理步骤，只需要给对奖励，模型就能自己学会思考。

从矩阵乘法到 Attention 完整公式：softmax(QK^T/√d)×V。把四篇数学基础组装成 Transformer 的核心引擎。零基础线性代数系列完结篇。

DeepSeek-V3 拥有 6710 亿参数，但每个 token 只激活 370 亿——不到总量的 6%。这不是偷懒，这是 AI 架构设计中最精巧的一课：不是所有神经元都需要同时工作。

ReLU：一行代码 max(0, x) 让深度学习成为可能。理解激活函数为什么是神经网络不可或缺的非线性魔法。

找一张白纸，画两个圆。恭喜你——你刚刚做了一件六千年前埃及人做过的事。在那个杏仁形的重叠区里，藏着 √3、黄金比例，以及一朵开遍全世界的花。

Agent、MCP、Manus、Coze……AI 热词一个接一个。但拆掉所有包装之后，你会发现一个更深层的问题：当技术不再是瓶颈，‘该做什么’这个被我们忽略了太久的问题，终于无处可藏了。

从损失函数到反向传播：AI 训练的核心算法。理解 microgpt 和 nanoGPT 训练时 loss 为什么会下降。零基础数学系列完结篇。

从生命之花中提取13个圆心，用78条直线全部连接——一个叫做麦塔特隆立方体的图案浮现了。藏在里面的，是宇宙中仅有的五种完美形状。

1956年，十位科学家相信20年就能造出思考的机器。70年后回望，这条路比任何人想象的都要漫长。这是一群异端者的故事——他们在所有人都放弃的年代，选择继续相信。

1701年，莱布尼茨收到一封来自北京的信，附着邵雍的六十四卦方圆图。他看了很久——这和他推演二十年的二进制计数表，严丝合缝。