Schritt für Schritt: Wie der Lightning Indexer funktioniert – von Query-Token über Index-Score bis zur finalen Sparse Attention.
Lightning Indexer ist das Herzstück von DSA: Er identifiziert in O(n log n) die wichtigsten Token-Paare, bevor die eigentliche Attention berechnet wird. Pre-Filtering statt Post-Filtering.
Schritt 4/5 in Kapitel 2 „Moderne Architekturvarianten"
Detailansicht der DSA-Implementierung. Zeigt, wie der Indexer entscheidet, welche Tokens relevant sind.
Der Indexer nutzt Locality-Sensitive Hashing (LSH) oder learned routing für effiziente Kandidaten-Suche. Das ermöglicht O(n log n) statt O(n²).