Kapitel 1.1 · Visualisierung

Byte Pair Encoding (BPE) Animation

Beobachte Schritt für Schritt, wie der BPE-Algorithmus einen Text in Tokens zerlegt – die Grundlage jedes LLMs.

Tokenisierung ist der erste Schritt jeder LLM-Verarbeitung: Bevor ein Modell Text verstehen kann, muss dieser in diskrete Einheiten zerlegt werden. Der BPE-Algorithmus (Byte Pair Encoding) fusioniert schrittweise häufige Zeichenpaare, um ein effizientes Vokabular zu erstellen.

📖 Lern-Kontext ▼

Verstehen, warum Text vor der Verarbeitung tokenisiert werden muss
Den BPE-Algorithmus Schritt für Schritt nachvollziehen können
Den Trade-off zwischen Vokabulargröße und Sequenzlänge erkennen

Schritt 1/8 Transformer Grundlagen

Tokenisierung ist die Eingangstür zu jedem LLM. Die hier erzeugten Token-IDs werden im nächsten Schritt (1.2 Embeddings) in kontinuierliche Vektoren umgewandelt, mit denen das Modell rechnen kann.

Die Wahl des Tokenizers beeinflusst direkt die Modell-Performance: Ein größeres Vokabular ermöglicht kompaktere Textdarstellungen (kürzere Sequenzen), erfordert aber mehr Parameter in der Embedding-Matrix. Moderne Modelle wie Llama 3 (128K Tokens) und GPT-4 (~100K Tokens) haben diesen Trade-off sorgfältig optimiert.

BPE startet mit Einzelzeichen und fusioniert iterativ die häufigsten Paare
Moderne Modelle nutzen 50K-128K Tokens (GPT-4: ~100K, Llama 3: 128K)
Subword-Tokenisierung balanciert Vokabulargröße gegen Sequenzlänge

BPE-Algorithmus Schritt für Schritt

Geschwindigkeit:

Tastatur: Space Play/Pause · → Nächster Schritt · R Reset

Schritt 0 von 0 Merges

Initialisierung Starte mit einzelnen Zeichen als Basis-Tokens

Token Display

Paar-Häufigkeiten (aktuell)

Vokabular (0 Tokens)

Aktuelle Tokens

Merges durchgeführt

1.0×

Kompression

💡 So funktioniert BPE

Byte Pair Encoding startet mit einzelnen Zeichen und fusioniert iterativ die häufigsten benachbarten Paare zu neuen Tokens. Im Beispiel aaabdaaabac wird zuerst aa → Z, dann ab → Y, usw. fusioniert, bis die gewünschte Vokabulargröße erreicht ist.

Byte Pair Encoding (BPE) Animation

Lernziele

Kontext: Wo sind wir?

Warum wichtig

Key Takeaways

Verwandte Visualisierungen