Step by Token

Tabla de contenidos

21 / 21 · 189 min

IAnatomía de un modelo

01
Predecir una palabra a la vez
¿Qué es un modelo de lenguaje? Por qué predecir la siguiente palabra es suficiente para hacer emerger la inteligencia.
6 min
02
Del texto a los tokens
Cómo el texto se convierte en números. BPE, subpalabras, y por qué los LLMs tienen dificultades para contar letras.
8 min
03
El espacio del significado
Palabras en un espacio geométrico. Rey − Hombre + Mujer = Reina, y otros milagros vectoriales.
10 min
04
La atención es todo lo que necesitas
El mecanismo que lo cambia todo. Cómo cada token mira a todos los demás para entender el contexto.
12 min
05
El Transformer completo
Ensamblando las piezas: atención multi-cabeza, feed-forward, normalización, conexiones residuales.
14 min