为什么 LLM 要用 GPU?从游戏显卡到 AI 引擎

训练 ChatGPT 用的不是什么神秘的 AI 芯片,而是打游戏用的显卡。一块为了让游戏画面更流畅而设计的芯片,为什么成了 AI 革命的引擎?因为游戏画面和语言理解在底层共享了同一个数学本质——矩阵乘法。

2026年3月12日 · 6 分钟 · 1249 字 · AI Lab

一看就懂:矩阵乘法到底对 LLM 做了什么?

GPT 的本质就是矩阵乘法。但矩阵乘法到底在干什么?9 张动图,把 GPT 里最核心的数学拍给你看。维度变了,几何没变——看懂 2D,就看懂了 GPT。

2026年3月12日 · 3 分钟 · 594 字 · AI Lab

AI 的数学语言(四):矩阵乘法与 AI——理解 Transformer 的最后一块拼图

从矩阵乘法到 Attention 完整公式:softmax(QK^T/√d)×V。把四篇数学基础组装成 Transformer 的核心引擎。零基础线性代数系列完结篇。

2026年2月22日 · 3 分钟 · 635 字 · AI Lab

从矩阵乘法到 Transformer:LLM 背后的数学直觉

不做证明,只建直觉。从矩阵乘法的三种视角出发,一步步搭建理解 Transformer 的完整数学框架:QKV 投影、多头注意力、残差连接、MLP,以及它们如何协作生成下一个 token。

2026年3月2日 · 7 分钟 · 1387 字 · AI Lab

从手写数字识别到 ChatGPT——一个最简单的神经网络能教会我们什么

用纯 Python 和 NumPy 从零搭了一个 10 个神经元的神经网络,识别手写数字,然后把它拆开——看清了模板匹配、投票矩阵和每一步计算。从这个最小的网络出发,聊聊 FNN、CNN、RNN、Transformer 的演进,以及可解释性的边界。

2026年3月30日 · 5 分钟 · 928 字 · AI Lab

从一个取反说起——计算机如何从「只会加法」走到「AI 写诗」

~5 = -6?从这个小困惑出发,我们穿越 7 层抽象,看见逻辑门如何一步步堆叠成 ChatGPT。这是一篇写给所有人的计算机底层原理科普。

2026年3月23日 · 8 分钟 · 1699 字 · AI Lab