Definition. RAG (Retrieval-Augmented Generation) ist ein Verfahren, bei dem ein Sprachmodell seine Antworten nicht nur aus dem Trainingswissen erzeugt, sondern zur Laufzeit relevante Informationen aus einer externen Wissensquelle abruft und einbezieht. Dokumente werden typischerweise in einer Vektordatenbank gespeichert; zu einer Anfrage werden passende Ausschnitte gesucht und dem Modell als Kontext mitgegeben.
Warum relevant. Für den Mittelstand macht RAG KI auf den eigenen, aktuellen Inhalten nutzbar statt nur auf dem statischen Trainingsstand des Modells. Das reduziert Halluzinationen, macht Quellen nachvollziehbar und ist die Grundlage für Wissensassistenten und interne Suche. Voraussetzung sind strukturierte, maschinell nutzbare Inhalte.
Verwandt. MCP, Structured Content, AI-ready CMS, Agent Readiness