Una guida interattiva agli LLM

Step by Token

Capire come funzionano i grandi modelli linguistici, una visualizzazione interattiva alla volta.

Inizia a leggere Glossario

Indice

21 / 21 · 189 min

IAnatomia di un modello

01
Predire una parola alla volta
Cos'è un modello linguistico? Perché predire la parola successiva è sufficiente per far emergere l'intelligenza.
6 min
02
Dal testo ai token
Come il testo diventa numeri. BPE, sottoparole, e perché gli LLM faticano a contare le lettere.
8 min
03
Lo spazio del significato
Parole in uno spazio geometrico. Re − Uomo + Donna = Regina, e altri miracoli vettoriali.
10 min
04
L'attenzione è tutto ciò che ti serve
Il meccanismo che cambia tutto. Come ogni token guarda tutti gli altri per capire il contesto.
12 min
05
Il Transformer completo
Assemblare i pezzi: attenzione multi-testa, feed-forward, normalizzazione, connessioni residuali.
14 min

IIAddestrare e allineare

IIIIl modello in produzione

IVAndare oltre

Step by Token