Retrieval-Augmented Generation (RAG)

Zurück zum Glossar

Retrieval-Augmented Generation ist eine KI-Technik, die zur Abfragezeit relevante Dokumente einholt und in den Kontext des Sprachmodells gibt, damit es aus Quellen antwortet statt nur aus parametrischem Gedächtnis.

Warum es zählt

Reine LLMs halluzinieren selbstbewusst, wenn sie etwas nicht wissen. RAG adressiert das, indem es Generierung in eingeholten Dokumenten verankert — das Modell kann zitieren, belegen und sich auf Quellmaterial beschränken. Es ist das dominante Muster für Enterprise-KI-Deployments und der Motor hinter Tools wie Perplexity, NotebookLM und Piths Wiki-Engine.

Die RAG-Qualität hängt an der Retrieval-Qualität. Embedding-basiertes Retrieval (Vektor-Suche), Keyword-Retrieval (BM25) und hybride Ansätze haben jeweils Trade-offs. Aktuelle Arbeiten betonen **Citation Grounding** (jede generierte Aussage einer konkreten Quellpassage zugeordnet) gegenüber reinem Retrieval, weil Nutzer prüfen können müssen.

Wie Pith reinpasst

Piths Wiki und Suche nutzen RAG: Bookmarks werden embedded und indexiert, nach Relevanz abgerufen und in Wiki-Seiten mit Zitaten zurück zu den Quellen synthetisiert. Jeder Wiki-Absatz verlinkt auf das Bookmark, aus dem er entstand.

Siehe auch

Semantische Suche Vektor-Embedding Knowledge Graph

Zuletzt geprüft: 10. Mai 2026 · Lizenziert CC BY 4.0 · frei zitierbar unter Namensnennung von Pith.