<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Softmax on AI 学习笔记</title><link>https://jason-azure.github.io/ai-blog/tags/softmax/</link><description>Recent content in Softmax on AI 学习笔记</description><generator>Hugo -- 0.146.0</generator><language>zh-CN</language><lastBuildDate>Fri, 17 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://jason-azure.github.io/ai-blog/tags/softmax/index.xml" rel="self" type="application/rss+xml"/><item><title>从加减乘除到预测下一个字：Attention 机制零基础拆解</title><link>https://jason-azure.github.io/ai-blog/posts/transformer-attention/</link><pubDate>Sat, 21 Feb 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/transformer-attention/</guid><description>用零基础也能懂的语言，拆解 Transformer 的核心：点积、缩放、Softmax、QKV、多头注意力、因果遮罩。既讲人类设计了什么，也讲机器自己学到了什么。</description></item><item><title>LLM 中的概率论：从掷骰子到生成文本</title><link>https://jason-azure.github.io/ai-blog/posts/llm-probability/</link><pubDate>Fri, 13 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/llm-probability/</guid><description>零基础理解大语言模型背后的概率论：条件概率、Softmax、交叉熵、Temperature、采样策略、大数定律与中心极限定理——用最直观的类比和动图，拆解 LLM 的数学骨架。</description></item><item><title>看见数学（十三）：概率——拥抱不确定</title><link>https://jason-azure.github.io/ai-blog/posts/see-math-13-probability/</link><pubDate>Fri, 20 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/see-math-13-probability/</guid><description>概率不是&amp;quot;猜&amp;quot;——概率是用数学管理无知。赌徒的信件催生了概率论，贝叶斯牧师教会了 AI 如何&amp;quot;更新信念&amp;quot;，而 GPT 每写一个字，都是在从概率分布里抽样。</description></item><item><title>为什么用 -log(p) 做损失函数？—— 从信息论到 Cross-Entropy 的完整推导</title><link>https://jason-azure.github.io/ai-blog/posts/cross-entropy-loss/</link><pubDate>Sat, 28 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/cross-entropy-loss/</guid><description>从 Shannon 1948 年的三条公理出发，理解为什么 GPT 的 loss 必须是 -log(p)：它是满足「信息量」定义的唯一函数，用它做 loss 等价于最大似然估计和最小化 KL 散度——这不是经验选择，是数学必然。</description></item><item><title>欧拉的 e——一个数字如何同时出现在复利、衰变和神经网络里</title><link>https://jason-azure.github.io/ai-blog/posts/eulers-e/</link><pubDate>Sun, 05 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/eulers-e/</guid><description>2.71828… 这个数字出现在银行复利、放射性衰变、人口增长、Softmax 函数、学习率衰减里。它不是人造的常数——它是自然界「连续变化」的签名。读完这篇，你再看到 e 不会害怕，而会觉得亲切。</description></item><item><title>看见物理（五）：熵——承认无知的勇气</title><link>https://jason-azure.github.io/ai-blog/posts/see-physics-5-entropy/</link><pubDate>Fri, 17 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/see-physics-5-entropy/</guid><description>1865 年，一个德国人造了一个新词来形容世界的衰败；1948 年，一个美国人用同一个公式描述电报的成本；2025 年，你电脑里每一次 AI 推理，都在重演这条 160 年的暗线。熵不是公式——它是人类第一次承认「我不知道」，然后把这份无知量化成数学。</description></item><item><title>玻尔兹曼的遗产——一个被时代辜负的物理学家，和他留给 AI 的公式</title><link>https://jason-azure.github.io/ai-blog/posts/boltzmann-legacy/</link><pubDate>Mon, 13 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/boltzmann-legacy/</guid><description>1906 年，一位被整个学术界否定的物理学家在杜伊诺的度假村永远闭上了眼睛。他的墓碑上只刻了一个公式：S = k ln W。120 年后，这个公式每天在全球数十亿次 AI 推理中被执行——以 Softmax 的名义。</description></item></channel></rss>