Indice

Tutti i capitoli

Dalla tokenizzazione all'allineamento. Ogni capitolo include almeno una visualizzazione interattiva.

IAnatomia di un modello

01
Fondamenti
Predire una parola alla volta
Cos'è un modello linguistico? Perché predire la parola successiva è sufficiente per far emergere l'intelligenza.
6 min
02
Tokenizzazione
Dal testo ai token
Come il testo diventa numeri. BPE, sottoparole, e perché gli LLM faticano a contare le lettere.
8 min
03
Embeddings
Lo spazio del significato
Parole in uno spazio geometrico. Re − Uomo + Donna = Regina, e altri miracoli vettoriali.
10 min
04
Attenzione
L'attenzione è tutto ciò che ti serve
Il meccanismo che cambia tutto. Come ogni token guarda tutti gli altri per capire il contesto.
12 min
05
Architettura
Il Transformer completo
Assemblare i pezzi: attenzione multi-testa, feed-forward, normalizzazione, connessioni residuali.
14 min

IIAddestrare e allineare

IIIIl modello in produzione

IVAndare oltre

Tutti i capitoli · Step by Token