AI 的数学语言(四):矩阵乘法与 AI——理解 Transformer 的最后一块拼图

从矩阵乘法到 Attention 完整公式:softmax(QK^T/√d)×V。把四篇数学基础组装成 Transformer 的核心引擎。零基础线性代数系列完结篇。

2026年2月22日 · 3 分钟 · 635 字 · AI Lab

AI 的数学语言(五):激活函数——神经网络的开关

ReLU:一行代码 max(0, x) 让深度学习成为可能。理解激活函数为什么是神经网络不可或缺的非线性魔法。

2026年2月22日 · 5 分钟 · 1003 字 · AI Lab

AI 的数学语言(六):梯度下降——AI 怎么学习

从损失函数到反向传播:AI 训练的核心算法。理解 microgpt 和 nanoGPT 训练时 loss 为什么会下降。零基础数学系列完结篇。

2026年2月22日 · 5 分钟 · 990 字 · AI Lab

中文 vs 英文:大语言模型的语言鸿沟与技术突围

为什么 GPT-3 的中文只占训练数据的 0.1%?为什么同样一句话中文要花 13 倍的 Token?国内大模型是怎么用 15 万词表逆转这个劣势的?从训练语料、Tokenizer 到 Embedding,一篇讲透中英文 LLM 的底层差异。

2026年3月3日 · 6 分钟 · 1097 字 · AI Lab

LLM 中的概率论:从掷骰子到生成文本

零基础理解大语言模型背后的概率论:条件概率、Softmax、交叉熵、Temperature、采样策略、大数定律与中心极限定理——用最直观的类比和动图,拆解 LLM 的数学骨架。

2026年3月13日 · 7 分钟 · 1281 字 · AI Lab

AI 为什么"一本正经地胡诌"?—— 幻觉的底层逻辑

DeepSeek 给你编一个根本不存在的 API;国产大模型给研究生伪造 8 篇参考文献;自媒体因 AI 编造权威数据被封号 12 万粉。你以为 AI 在骗你 —— 不,它比骗更糟。骗人要先知道真相再刻意背离;AI 连真相这个坐标都没有。它是在胡诌。这篇把原理讲透。

2026年4月17日 · 3 分钟 · 629 字 · AI Lab