<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>AI 基础 on AI 学习笔记</title><link>https://jason-azure.github.io/ai-blog/categories/ai-%E5%9F%BA%E7%A1%80/</link><description>Recent content in AI 基础 on AI 学习笔记</description><generator>Hugo -- 0.146.0</generator><language>zh-CN</language><lastBuildDate>Thu, 14 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://jason-azure.github.io/ai-blog/categories/ai-%E5%9F%BA%E7%A1%80/index.xml" rel="self" type="application/rss+xml"/><item><title>大理石假说——为什么微调不是在教 AI 新东西</title><link>https://jason-azure.github.io/ai-blog/posts/finetuning-illusion/</link><pubDate>Sat, 11 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/finetuning-illusion/</guid><description>预训练用了 15 万亿 tokens，微调只用了 1000 条。数据量差了一百亿倍，但行为变化却翻天覆地。更诡异的是，微调和预训练的算法完全一样——同样的反向传播、同样的梯度下降。那凭什么微调能起作用？答案简单到令人不安：因为你停了。</description></item><item><title>为什么 AI 离不开线性？因为人类的大脑也离不开</title><link>https://jason-azure.github.io/ai-blog/posts/why-linearity/</link><pubDate>Fri, 13 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/why-linearity/</guid><description>线性不是世界的本质，而是大脑的&amp;rsquo;操作系统&amp;rsquo;。从认知偏差到万能近似，从傅里叶到 Transformer 位置编码——一根直线如何撬动整个 AI。6 张动图，一篇从认知科学到工程哲学的深度探索。</description></item><item><title>为什么 LLM 要用 GPU？从游戏显卡到 AI 引擎</title><link>https://jason-azure.github.io/ai-blog/posts/why-gpu/</link><pubDate>Thu, 12 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/why-gpu/</guid><description>训练 ChatGPT 用的不是什么神秘的 AI 芯片，而是打游戏用的显卡。一块为了让游戏画面更流畅而设计的芯片，为什么成了 AI 革命的引擎？因为游戏画面和语言理解在底层共享了同一个数学本质——矩阵乘法。</description></item><item><title>一看就懂：矩阵乘法到底对 LLM 做了什么？</title><link>https://jason-azure.github.io/ai-blog/posts/geometric-intuition/</link><pubDate>Thu, 12 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/geometric-intuition/</guid><description>GPT 的本质就是矩阵乘法。但矩阵乘法到底在干什么？9 张动图，把 GPT 里最核心的数学拍给你看。维度变了，几何没变——看懂 2D，就看懂了 GPT。</description></item><item><title>AI学习笔记— 博客正式上线</title><link>https://jason-azure.github.io/ai-blog/posts/hello-world/</link><pubDate>Tue, 17 Feb 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/hello-world/</guid><description>AI 学习笔记博客正式上线！在这里我会分享 AI 基础知识、大语言模型实战经验和实用工具教程。</description></item><item><title>函数的竞赛：人类试过的所有方法，和神经网络胜出的原因</title><link>https://jason-azure.github.io/ai-blog/posts/function-competition/</link><pubDate>Tue, 17 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/function-competition/</guid><description>人类 400 年来发明了无数拟合函数的方法——泰勒级数、傅里叶级数、多项式、样条、核方法。每一种都精妙绝伦。但当任务变成&amp;rsquo;在万亿维空间中学习生成规律&amp;rsquo;，只有一个选手能站到终点。这不是选择题，这是淘汰赛。</description></item><item><title>神经网络沉浮录：从万众瞩目到无人问津，再到改变世界</title><link>https://jason-azure.github.io/ai-blog/posts/neural-network-history/</link><pubDate>Thu, 19 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/neural-network-history/</guid><description>一个 80 年的真实故事：被一本书判了死刑，被一个算法起死回生，靠改名字重获新生——科技的命运，终究也逃不过人性。</description></item><item><title>DeepSeek-R1：一个模型如何学会「思考」</title><link>https://jason-azure.github.io/ai-blog/posts/deepseek-r1-thinking/</link><pubDate>Sat, 21 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/deepseek-r1-thinking/</guid><description>2025 年最大的 AI 突破不是更大的模型，而是一个模型学会了停下来想一想再回答。DeepSeek-R1 登上 Nature，证明了一件事：不需要人类手把手教推理步骤，只需要给对奖励，模型就能自己学会思考。</description></item><item><title>MoE：671B 参数的模型，为什么只用 37B 就够了？</title><link>https://jason-azure.github.io/ai-blog/posts/moe-architecture/</link><pubDate>Mon, 23 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/moe-architecture/</guid><description>DeepSeek-V3 拥有 6710 亿参数，但每个 token 只激活 370 亿——不到总量的 6%。这不是偷懒，这是 AI 架构设计中最精巧的一课：不是所有神经元都需要同时工作。</description></item><item><title>AI的70年（上）：从达特茅斯的梦想到漫长的寒冬</title><link>https://jason-azure.github.io/ai-blog/posts/ai-history-1/</link><pubDate>Tue, 24 Feb 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/ai-history-1/</guid><description>1956年，十位科学家相信20年就能造出思考的机器。70年后回望，这条路比任何人想象的都要漫长。这是一群异端者的故事——他们在所有人都放弃的年代，选择继续相信。</description></item><item><title>AI的70年（中）：从两块显卡到改变世界的注意力机制</title><link>https://jason-azure.github.io/ai-blog/posts/ai-history-2/</link><pubDate>Tue, 24 Feb 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/ai-history-2/</guid><description>2012年，两块游戏显卡训练出的AlexNet震惊了整个AI领域。五年后，Google的一篇论文彻底终结了循环网络时代。又五年，ChatGPT上线。硬件、算法、数据——三条线索在这十年间完成了历史性的交汇。</description></item><item><title>AI的70年（下）：争鸣——机器究竟有没有在思考？</title><link>https://jason-azure.github.io/ai-blog/posts/ai-history-3/</link><pubDate>Tue, 24 Feb 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/ai-history-3/</guid><description>AI会下棋、会写诗、会通过律师考试。但它真的在&amp;rsquo;思考&amp;rsquo;吗？从Chomsky的语言天赋论到LeCun的世界模型缺失，从随机鹦鹉到具身认知——这是一场关于智能本质的终极辩论。而70年AI之路的最深启示，也许不在技术之中。</description></item><item><title>为什么矩阵和激活函数就能涌现智能？——从符号主义到万能近似定理</title><link>https://jason-azure.github.io/ai-blog/posts/universal-approximation/</link><pubDate>Tue, 10 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/universal-approximation/</guid><description>AI 发展 70 年，本质是两个思想流派的交锋：符号主义相信规则，联结主义相信连接。今天的 ChatGPT 靠的是矩阵乘法加一行激活函数——为什么这么简单的东西就够了？一个 1989 年的数学定理给出了答案。</description></item><item><title>用 4192 个参数看透 Transformer：QKV、多头注意力、MLP 全拆解</title><link>https://jason-azure.github.io/ai-blog/posts/transformer-qkv-demo/</link><pubDate>Thu, 26 Feb 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/transformer-qkv-demo/</guid><description>用一个只有 4192 个参数的 GPT 模型，展示 Transformer 内部每一步的真实数据——Token 嵌入、QKV 投影、多头注意力权重、MLP 稀疏激活，所有数字都来自真实训练。</description></item><item><title>从矩阵乘法到 Transformer：LLM 背后的数学直觉</title><link>https://jason-azure.github.io/ai-blog/posts/transformer-math/</link><pubDate>Mon, 02 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/transformer-math/</guid><description>不做证明，只建直觉。从矩阵乘法的三种视角出发，一步步搭建理解 Transformer 的完整数学框架：QKV 投影、多头注意力、残差连接、MLP，以及它们如何协作生成下一个 token。</description></item><item><title>AI 全景定位：从概念迷雾到清晰地图</title><link>https://jason-azure.github.io/ai-blog/posts/ai-landscape/</link><pubDate>Sat, 07 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/ai-landscape/</guid><description>当我们谈论 AI 时，创业者、投资人、家长和研究者说的可能完全不是同一件事。本文用一张嵌套图理清 AI、机器学习、深度学习、LLM 的层级关系，用一个房价预测的例子让你感受机器学习的范式革命——以及为什么理解这件事，比你想象的更重要。</description></item><item><title>Shannon 没有想到的事——当信息论遇上有限算力</title><link>https://jason-azure.github.io/ai-blog/posts/epiplexity/</link><pubDate>Mon, 30 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/epiplexity/</guid><description>Shannon 说「压缩 = 预测 = 理解」。但他假设观察者有无限算力。2026 年的一篇论文补上了这个前提，提出 epiplexity——衡量有限算力观察者能从数据中学到多少结构的新度量。</description></item><item><title>计算机只懂 0 和 1——从莫尔斯电码到 GPT 的编码简史</title><link>https://jason-azure.github.io/ai-blog/posts/ascii-to-token/</link><pubDate>Mon, 30 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/ascii-to-token/</guid><description>Token、Embedding、Encode/Decode——这些 AI 术语听起来很新，但它们和 ASCII、Unicode 是同一件事的不同层次。计算机 200 年来一直在做同一件事：把符号变成数字。</description></item><item><title>为什么用 -log(p) 做损失函数？—— 从信息论到 Cross-Entropy 的完整推导</title><link>https://jason-azure.github.io/ai-blog/posts/cross-entropy-loss/</link><pubDate>Sat, 28 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/cross-entropy-loss/</guid><description>从 Shannon 1948 年的三条公理出发，理解为什么 GPT 的 loss 必须是 -log(p)：它是满足「信息量」定义的唯一函数，用它做 loss 等价于最大似然估计和最小化 KL 散度——这不是经验选择，是数学必然。</description></item><item><title>从手写数字识别到 ChatGPT——一个最简单的神经网络能教会我们什么</title><link>https://jason-azure.github.io/ai-blog/posts/mnist-to-chatgpt/</link><pubDate>Mon, 30 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/mnist-to-chatgpt/</guid><description>用纯 Python 和 NumPy 从零搭了一个 10 个神经元的神经网络，识别手写数字，然后把它拆开——看清了模板匹配、投票矩阵和每一步计算。从这个最小的网络出发，聊聊 FNN、CNN、RNN、Transformer 的演进，以及可解释性的边界。</description></item><item><title>当数字学会了远近亲疏——从查表到 Embedding 的一步跨越</title><link>https://jason-azure.github.io/ai-blog/posts/embedding/</link><pubDate>Wed, 01 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/embedding/</guid><description>A=65, B=66——这些数字是死的。「大漠孤烟直，长河落日圆」——这些文字是活的。从莫尔斯电码到 GPT 的编码史中，有一步跨越改变了一切：数字不再是编号，而是坐标。它们学会了远近、方向和意思。这一步叫 Embedding。</description></item><item><title>第一个词和第五个词有什么不同？——位置编码的数学与直觉</title><link>https://jason-azure.github.io/ai-blog/posts/positional-encoding/</link><pubDate>Thu, 02 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/positional-encoding/</guid><description>Transformer 天生是个色盲——它能看清每个词的颜色（语义），却分不清词的位置。&amp;lsquo;猫吃鱼&amp;rsquo;和&amp;rsquo;鱼吃猫&amp;rsquo;在它眼中完全等价。为了让模型学会&amp;rsquo;谁在前谁在后&amp;rsquo;，研究者发明了一种优雅到不真实的方案：把位置信息编码成波，然后直接加到语义向量上。这一步看似暴力，实则深刻。</description></item><item><title>从一个取反说起——计算机如何从「只会加法」走到「AI 写诗」</title><link>https://jason-azure.github.io/ai-blog/posts/gates-to-gpt/</link><pubDate>Mon, 23 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/gates-to-gpt/</guid><description>~5 = -6？从这个小困惑出发，我们穿越 7 层抽象，看见逻辑门如何一步步堆叠成 ChatGPT。这是一篇写给所有人的计算机底层原理科普。</description></item><item><title>一个加号拯救了深度学习——残差连接的前世今生</title><link>https://jason-azure.github.io/ai-blog/posts/residual-connection/</link><pubDate>Fri, 03 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/residual-connection/</guid><description>2015 年，何恺明发现了一件诡异的事：56 层的神经网络比 20 层的更差——不是过拟合，是训练误差也更高。深度学习的根基似乎在动摇。然后他加了一个加号：y = F(x) + x。就这一个加号，让网络从 20 层一路堆到 1000 层，让 Transformer 成为可能，让 GPT 能有 96 层。这篇文章讲的就是这个加号的故事。</description></item><item><title>欧拉的 e——一个数字如何同时出现在复利、衰变和神经网络里</title><link>https://jason-azure.github.io/ai-blog/posts/eulers-e/</link><pubDate>Sun, 05 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/eulers-e/</guid><description>2.71828… 这个数字出现在银行复利、放射性衰变、人口增长、Softmax 函数、学习率衰减里。它不是人造的常数——它是自然界「连续变化」的签名。读完这篇，你再看到 e 不会害怕，而会觉得亲切。</description></item><item><title>贝叶斯没有想到的事——一个牧师的赌博公式，如何成为 AI 的第一性原理</title><link>https://jason-azure.github.io/ai-blog/posts/bayes-not-expected/</link><pubDate>Mon, 06 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/bayes-not-expected/</guid><description>1763 年，一个英国牧师的遗稿里藏着一条公式。263 年后，这条公式成了 GPT 训练的数学骨架：先验 = 预训练，似然 = 数据，后验 = 微调。贝叶斯定理不只是一个公式——它是一种「带着旧知识拥抱新证据」的思维方式。而这正是 AI 学习的方式。</description></item><item><title>世界模型之争 —— LLM 到底懂不懂这个世界？</title><link>https://jason-azure.github.io/ai-blog/posts/world-model-debate/</link><pubDate>Fri, 17 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/world-model-debate/</guid><description>AlphaFold 拿了诺贝尔奖，GPT 通过了律师考试——但 Sora 的玻璃穿过了桌子。LLM 到底懂不懂这个世界？LeCun 离开 Meta 创办 AMI Labs，李飞飞押注 World Labs，谢赛宁两次拒绝 Ilya——站在前沿的人给出了截然不同的答案。</description></item><item><title>压缩即是全部 —— 菲尔兹奖得主给数学和 AI 的一封信</title><link>https://jason-azure.github.io/ai-blog/posts/compression-is-all-you-need/</link><pubDate>Tue, 21 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/compression-is-all-you-need/</guid><description>2026 年 3 月，菲尔兹奖得主 Michael Freedman 发了一篇只有 30 多页的论文，标题叫《Compression is all you need》。他用一个优雅的代数模型回答了三个古老问题：人类怎么构建数学？人类数学和形式数学的本质区别是什么？未来人类数学家如何和 AI 协作？答案只有两个字——压缩。</description></item><item><title>马尔可夫的幽灵——从预测下一个词到预测下一步行动</title><link>https://jason-azure.github.io/ai-blog/posts/markov-ghost/</link><pubDate>Thu, 07 May 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/markov-ghost/</guid><description>1913 年，俄国数学家马尔可夫翻开普希金的《叶甫盖尼·奥涅金》，开始数元音和辅音。他不是在做文学研究，而是在拆掉一个旧世界：下一个符号不是凭空出现的，它被前一个状态牵引。一个多世纪后，LLM 被训练去预测下一个 token，Agent 被训练去选择下一步行动。这个目标看似无聊，却把语言、知识、推理和行动都压进了一个极密的监督信号里。马尔可夫没有想到 ChatGPT，但他留下了现代 AI 最小的一条语法：状态、转移、下一步。</description></item><item><title>当 AI 学会了看——多模态大模型的架构拆解</title><link>https://jason-azure.github.io/ai-blog/posts/multimodal-llm-architecture/</link><pubDate>Sat, 11 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/multimodal-llm-architecture/</guid><description>GPT-4 能看图、Gemini 能看视频、Qwen-VL 能看中文文档——但一个语言模型是怎么&amp;rsquo;看见&amp;rsquo;图像的？答案藏在三个组件的协作中：视觉编码器把图像切成 token，对齐模块把视觉 token 翻译成语言能懂的格式，LLM 把它们和文字一起处理。本文从 ViT 到 CLIP 到 LLaVA，完整拆解多模态大模型的架构。</description></item><item><title>谁给了 AI 一双眼睛——从 CLIP 到开源军备竞赛</title><link>https://jason-azure.github.io/ai-blog/posts/clip-open-source-story/</link><pubDate>Sun, 12 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/clip-open-source-story/</guid><description>2021 年 OpenAI 发布 CLIP，让 AI 第一次&amp;rsquo;看懂&amp;rsquo;了图片。但它公开了模型权重，却藏起了 4 亿对训练数据。这引发了一场全球性的&amp;rsquo;造眼睛&amp;rsquo;军备竞赛——德国非营利组织 LAION 逆向工程出 50 亿对数据，Google 发明了新的训练方法，Meta 证明不需要文字也能学会看……一个模型的开源，如何改变了整个视觉 AI 生态？&amp;lsquo;开源&amp;rsquo;到底意味着什么？</description></item><item><title>万物皆向量——当 AI 选择用数学理解世界</title><link>https://jason-azure.github.io/ai-blog/posts/vectors-language-of-understanding/</link><pubDate>Sun, 12 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/vectors-language-of-understanding/</guid><description>多模态 AI 揭示了一个深刻的事实：文字、图片、声音——看似截然不同的信息形式，最终都被转化成了同一种东西——向量。然后由同一个 Transformer 用同一套 Attention 机制处理。这引出一个更根本的问题：理解这个世界，最终都要变成语言吗？还是说，有一种比语言更底层的&amp;rsquo;表示&amp;rsquo;在承载真正的理解？</description></item><item><title>玻尔兹曼的遗产——一个被时代辜负的物理学家，和他留给 AI 的公式</title><link>https://jason-azure.github.io/ai-blog/posts/boltzmann-legacy/</link><pubDate>Mon, 13 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/boltzmann-legacy/</guid><description>1906 年，一位被整个学术界否定的物理学家在杜伊诺的度假村永远闭上了眼睛。他的墓碑上只刻了一个公式：S = k ln W。120 年后，这个公式每天在全球数十亿次 AI 推理中被执行——以 Softmax 的名义。</description></item><item><title>维纳没有想到的事——从防空炮到 ChatGPT，反馈如何变成智能</title><link>https://jason-azure.github.io/ai-blog/posts/feedback-cybernetics/</link><pubDate>Sat, 09 May 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/feedback-cybernetics/</guid><description>二战时期，数学家诺伯特·维纳研究一个残酷的问题：飞机一直在动，炮弹也需要时间飞行，防空炮到底该打向哪里？这不是简单地预测飞机下一秒的位置，而是要持续计算拦截点，并在观测误差、动作延迟和敌人机动中不断修正。这个问题把他带向一个更深的概念：反馈。智能不是一次性给出正确答案，而是在行动之后被世界纠正。梯度下降、RLHF、DeepSeek-R1、Agent、自动驾驶，表面上差别很大，底层却都在同一个闭环里运行：行动、观察、误差、修正。</description></item><item><title>AI 不是忘了你，是还没学会你</title><link>https://jason-azure.github.io/ai-blog/posts/continual-learning/</link><pubDate>Mon, 11 May 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/continual-learning/</guid><description>我们正在把 AI 越做越像一个带着巨大资料柜的天才：它能查资料、能翻历史、能接工具、能在一个长上下文里表现得很聪明。但查得到不等于学会了。真正的持续学习，不是让上下文窗口无限变大，而是让经验被压缩、抽象，并在未来变成能力。</description></item><item><title>从噪声中看见猫——扩散模型的数学美学</title><link>https://jason-azure.github.io/ai-blog/posts/diffusion-models/</link><pubDate>Tue, 12 May 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/diffusion-models/</guid><description>AI 画画不是从空白画布开始，也不是脑子里凭空想象出一只猫。扩散模型先学会一万种『猫如何被噪声毁掉』，再把这个毁掉的过程一步步倒放。生成的秘密，不是凭空创造，而是给噪声一个方向。</description></item><item><title>AI 到底是怎么看图、懂图、画图的？——从 LLM 到多模态的架构地图</title><link>https://jason-azure.github.io/ai-blog/posts/multimodal-image-architecture/</link><pubDate>Wed, 13 May 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/multimodal-image-architecture/</guid><description>多模态不是让 LLM 简单长出眼睛。更准确地说，是把文字、图片、声音、视频变成模型能处理的 token 或 embedding，再让 Transformer、扩散模型、Flow、VAE、视觉编码器、音频 codec 和视频生成器协同工作。看图、听音、懂图、画图、生成视频，背后其实是几种不同的数据流。</description></item><item><title>机器人的 GPT 时刻：从会聊天到会干活</title><link>https://jason-azure.github.io/ai-blog/posts/robot-gpt-moment/</link><pubDate>Thu, 14 May 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/robot-gpt-moment/</guid><description>ChatGPT 让 AI 学会了聊天，VLA 正在让 AI 学会干活。机器人终于从写死的动作脚本，走向能看、能听、能规划、能动手的通用模型。但物理世界没有撤回键，所以机器人的 GPT 时刻不会是一次突然刷屏，而是一场被数据、安全和工程慢慢推开的黎明。</description></item><item><title>压缩即智能 — 开篇语</title><link>https://jason-azure.github.io/ai-blog/posts/opening-essay/</link><pubDate>Sun, 01 Feb 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/opening-essay/</guid><description>压缩，是用低维形式保存高维信息的方式。大语言模型用向量与矩阵转存了人类语言中的统计规律，在解压时涌现出了我们称之为&amp;quot;智能&amp;quot;的东西。</description></item><item><title>谁在决定 AI 的性格？——从文字接龙到讨好型机器</title><link>https://jason-azure.github.io/ai-blog/posts/rlhf-alignment-sycophancy/</link><pubDate>Thu, 14 May 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/rlhf-alignment-sycophancy/</guid><description>预训练让 AI 学会文字接龙，SFT 让它学会像助手一样接龙，RLHF 让它学会哪种接龙更容易被人类喜欢。但“被喜欢”不是“真实”，“听话”不是“善良”，“安全”也不是没有价值立场。对齐 AI 的过程，表面上是在训练机器，深处是在审问人类：我们到底希望一个更聪明的存在，服从谁的规则，继承谁的偏见，代表谁的文明？</description></item></channel></rss>