Vergleich von BM25-Keyword-Suche und Embedding-basierten Ansätzen
Dense vs. Sparse Retrieval vergleicht zwei Paradigmen: Embedding-basierte Suche (Dense) vs. Token-Match (Sparse/BM25). Moderne RAG-Systeme kombinieren beide für optimale Ergebnisse.
Schritt 4/5 in Kapitel 2 „Moderne Architekturvarianten"
Anwendung von Sparse-Konzepten in RAG. Zeigt, wie Retrieval-Optimierung Inference-Qualität beeinflusst.
Hybrid Retrieval (z.B. Cohere Rerank) kombiniert BM25 + Embeddings für beste Ergebnisse. 30% BM25 + 70% Dense ist ein bewährter Production-Standard.
Keyword-basierter Ansatz, der auf Wort-Häufigkeiten und Positionen basiert. Keine ML-Training nötig, extrem schnell.
Embedding-basiert, versteht Bedeutung. Besser bei Paraphrasen und semantisch ähnlichen Dokumenten.
BM25 ist 10-100× schneller, aber Dense hat bessere semantische Qualität. Wahl je nach Anwendungsfall.
Kombination: 30% BM25 + 70% Dense. Beste Balance zwischen Geschwindigkeit und Genauigkeit in Production.
BM25 skaliert linear, Dense benötigt Vector-DB (FAISS, Milvus). Für große Corpora: Hybrid oder nur Dense.
Google Search: BM25 als Filter, dann Ranker. RAG-Systeme: Dense Retrieval, BM25 als Fallback.