Lost in the Middle

Warum LLMs wichtige Informationen in der Mitte von Prompts übersehen

Lost in the Middle – das überraschende Phänomen, dass LLMs Informationen in der Mitte langer Kontexte vergessen. Diese Visualisierung zeigt die Attention-Verteilung über verschiedene Prompt-Regionen und erklärt, warum Position im Kontext so wichtig ist.

📖 Lern-Kontext ▼

Das Lost-in-the-Middle-Phänomen verstehen und erkennen
Die Attention-Verteilung über System/User/Context analysieren
Strategien zur Platzierung wichtiger Informationen ableiten

Schritt 2/4 In-Context Learning & Prompting

Teil der System-Prompt-Analyse. Zeigt die Grenzen langer Kontextfenster und warum „mehr Kontext" nicht immer besser ist.

RAG-Systeme mit 20+ Chunks leiden unter diesem Problem. Die wichtigste Information sollte am Anfang oder Ende stehen – nie in der Mitte.

U-Kurve: Attention ist hoch am Anfang und Ende, niedrig in der Mitte
RAG-Implikation: Top-Ranked Chunks ans Ende des Kontexts setzen
Chunk-Anzahl: Weniger, aber relevantere Chunks schlagen viele mittelmäßige

Das "Lost in the Middle" Phänomen

LLMs besuchen Anfang und Ende von Prompts mit hoher Attention, aber die Mitte wird vernachlässigt. System Prompt: 90% Attention. User Query (am Ende): 85%. Mittlere Infos: nur 20%!

U-Kurve: Empirisches Muster

Lost-in-the-Middle Paper (2023): Messbare U-Form in Attention. Position 0: ~100%. Position 50% (Mitte): ~15%. Position 100%: ~95%. Betrifft alle gängigen Models (GPT, Llama, Claude).

System Prompt im Vorteil

System Prompt wird IMMER am Anfang platziert → bekommt maximale Attention. User Message am Ende → auch hohe Attention. Kontextdokumente in der Mitte: Verlieren! RAG-Integration problematisch.

Mitigation Strategien

1. Wichtige Infos an Start/Ende. 2. Repetition in der Mitte. 3. Hierarchische Struktur (Zusammenfassung oben). 4. Neuere Models (Claude 4.5+) zeigen bessere Mittel-Attention, aber U-Kurve bleibt.

RAG-Implikationen

Wenn Retrieval 20 Dokumente in Mitte positioniert: Qualität leidet! Lösung: Top-K Reranking basierend auf Attention-Mustern. oder: Wichtigste Dokumente am Anfang/Ende.

Zukunftsaussicht

Längere Kontexte (1M+) verschärfen Problem. Forschung zeigt: Transformer-Architektur für dieses Muster verantwortlich. Neue Attention-Mechanismen (z.B. linear) zeigen bessere Mittel-Preserving.

Lost in the Middle

Lernziele

Kontext: Wo sind wir?

Warum wichtig

Key Takeaways

Attention Distribution (Start)

Attention Distribution (Ende)