<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Word2Vec on AI 学习笔记</title><link>https://jason-azure.github.io/ai-blog/tags/word2vec/</link><description>Recent content in Word2Vec on AI 学习笔记</description><generator>Hugo -- 0.146.0</generator><language>zh-CN</language><lastBuildDate>Wed, 01 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://jason-azure.github.io/ai-blog/tags/word2vec/index.xml" rel="self" type="application/rss+xml"/><item><title>计算机只懂 0 和 1——从莫尔斯电码到 GPT 的编码简史</title><link>https://jason-azure.github.io/ai-blog/posts/ascii-to-token/</link><pubDate>Mon, 30 Mar 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/ascii-to-token/</guid><description>Token、Embedding、Encode/Decode——这些 AI 术语听起来很新，但它们和 ASCII、Unicode 是同一件事的不同层次。计算机 200 年来一直在做同一件事：把符号变成数字。</description></item><item><title>当数字学会了远近亲疏——从查表到 Embedding 的一步跨越</title><link>https://jason-azure.github.io/ai-blog/posts/embedding/</link><pubDate>Wed, 01 Apr 2026 00:00:00 +0000</pubDate><guid>https://jason-azure.github.io/ai-blog/posts/embedding/</guid><description>A=65, B=66——这些数字是死的。「大漠孤烟直，长河落日圆」——这些文字是活的。从莫尔斯电码到 GPT 的编码史中，有一步跨越改变了一切：数字不再是编号，而是坐标。它们学会了远近、方向和意思。这一步叫 Embedding。</description></item></channel></rss>