<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>QKV on AI 学习笔记</title><link>https://jason-azure.github.io/ai-blog/tags/qkv/</link><description>Recent content in QKV on AI 学习笔记</description><generator>Hugo -- 0.146.0</generator><language>zh-CN</language><lastBuildDate>Thu, 12 Mar 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://jason-azure.github.io/ai-blog/tags/qkv/index.xml" rel="self" type="application/rss+xml"/><item><title>一看就懂：矩阵乘法到底对 LLM 做了什么？</title><link>https://jason-azure.github.io/ai-blog/posts/geometric-intuition/</link><pubDate>Thu, 12 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/geometric-intuition/</guid><description>GPT 的本质就是矩阵乘法。但矩阵乘法到底在干什么？9 张动图，把 GPT 里最核心的数学拍给你看。维度变了，几何没变——看懂 2D，就看懂了 GPT。</description></item><item><title>从语言的本质到 Attention 的诞生——QKV 为什么长这样</title><link>https://jason-azure.github.io/ai-blog/posts/why-qkv/</link><pubDate>Thu, 05 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/why-qkv/</guid><description>语言是对世界的压缩，但用语言解释语言是死循环。40 年的规则尝试失败后，分布式假说绕过了这个问题，而 QKV 是它的工程终局。一篇从哲学到代码、从碳基到硅基的探索之旅。</description></item><item><title>从加减乘除到预测下一个字：Attention 机制零基础拆解</title><link>https://jason-azure.github.io/ai-blog/posts/transformer-attention/</link><pubDate>Sat, 21 Feb 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/transformer-attention/</guid><description>用零基础也能懂的语言，拆解 Transformer 的核心：点积、缩放、Softmax、QKV、多头注意力、因果遮罩。既讲人类设计了什么，也讲机器自己学到了什么。</description></item><item><title>用 4192 个参数看透 Transformer：QKV、多头注意力、MLP 全拆解</title><link>https://jason-azure.github.io/ai-blog/posts/transformer-qkv-demo/</link><pubDate>Thu, 26 Feb 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/transformer-qkv-demo/</guid><description>用一个只有 4192 个参数的 GPT 模型，展示 Transformer 内部每一步的真实数据——Token 嵌入、QKV 投影、多头注意力权重、MLP 稀疏激活，所有数字都来自真实训练。</description></item><item><title>从矩阵乘法到 Transformer：LLM 背后的数学直觉</title><link>https://jason-azure.github.io/ai-blog/posts/transformer-math/</link><pubDate>Mon, 02 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/transformer-math/</guid><description>不做证明，只建直觉。从矩阵乘法的三种视角出发，一步步搭建理解 Transformer 的完整数学框架：QKV 投影、多头注意力、残差连接、MLP，以及它们如何协作生成下一个 token。</description></item></channel></rss>