Step by Token

Inhaltsverzeichnis

21 / 21 · 189 min

IAnatomie eines Modells

01
Ein Wort nach dem anderen vorhersagen
Was ist ein Sprachmodell? Warum das Vorhersagen des nächsten Wortes ausreicht, um Intelligenz entstehen zu lassen.
6 min
02
Vom Text zu Tokens
Wie Text zu Zahlen wird. BPE, Teilwörter und warum LLMs Schwierigkeiten haben, Buchstaben zu zählen.
8 min
03
Der Raum der Bedeutung
Wörter in einem geometrischen Raum. König − Mann + Frau = Königin, und andere Vektorwunder.
10 min
04
Aufmerksamkeit ist alles, was du brauchst
Der Mechanismus, der alles verändert. Wie jedes Token alle anderen betrachtet, um den Kontext zu verstehen.
12 min
05
Der vollständige Transformer
Die Teile zusammensetzen: Multi-Head-Attention, Feed-Forward, Normalisierung, Residualverbindungen.
14 min