Um guia interativo sobre LLMs

Step by Token

Entender como os grandes modelos de linguagem funcionam, uma visualização interativa de cada vez.

Começar a ler Glossário

Sumário

21 / 21 · 189 min

IAnatomia de um modelo

01
Prever uma palavra de cada vez
O que é um modelo de linguagem? Por que prever a próxima palavra é suficiente para fazer emergir a inteligência.
6 min
02
Do texto aos tokens
Como o texto se torna números. BPE, subpalavras, e por que os LLMs têm dificuldade em contar letras.
8 min
03
O espaço do significado
Palavras em um espaço geométrico. Rei − Homem + Mulher = Rainha, e outros milagres vetoriais.
10 min
04
Atenção é tudo que você precisa
O mecanismo que muda tudo. Como cada token olha para todos os outros para entender o contexto.
12 min
05
O Transformer completo
Montando as peças: atenção multi-cabeça, feed-forward, normalização, conexões residuais.
14 min

IITreinar e alinhar

IIIO modelo em produção

IVIndo mais longe

Step by Token