<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>泛化 on AI 学习笔记</title><link>https://jason-azure.github.io/ai-blog/tags/%E6%B3%9B%E5%8C%96/</link><description>Recent content in 泛化 on AI 学习笔记</description><generator>Hugo -- 0.146.0</generator><language>zh-CN</language><lastBuildDate>Fri, 27 Mar 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://jason-azure.github.io/ai-blog/tags/%E6%B3%9B%E5%8C%96/index.xml" rel="self" type="application/rss+xml"/><item><title>万亿字节的压缩术：LLM 如何把互联网装进一个模型</title><link>https://jason-azure.github.io/ai-blog/posts/llm-training-stages/</link><pubDate>Fri, 27 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/llm-training-stages/</guid><description>你这辈子大概会读 5000 万个字。GPT 在训练时&amp;rsquo;读&amp;rsquo;过的量，相当于你读两万辈子。然后它把这些内容装进了一块硬盘里——不仅能回忆大部分内容，还能写出从未存在过的文章。这是压缩吗？是理解吗？如果互联网消失了，能靠 LLM 复原吗？</description></item></channel></rss>