Das leistungsstärkste Sprachmodell nützt wenig, wenn es die falschen Informationen bekommt und das Ergebnisformat nicht weiterverarbeitbar ist.
Viele KI-Agenten scheitern im Unternehmenseinsatz genau daran. Kontext-Engineering und strukturierte Ausgaben adressieren das Problem an der Wurzel.
In den frühen Tagen der generativen KI konzentrierte sich die Branche auf Prompt Engineering: die Kunst, Anfragen so zu formulieren, dass das Modell möglichst präzise antwortet. Das war ein sinnvoller erster Schritt, aber Prompt Engineering optimiert die Kommunikation mit dem Modell, nicht das, was das Modell weiß. Ein Sprachmodell verarbeitet, was ihm gegeben wird. Wer einen Agenten baut, der auf Unternehmensdaten operieren soll, muss sich deshalb eine grundlegend andere Frage stellen: Nicht „Wie formuliere ich meine Anfrage?“, sondern „Was muss das Modell in diesem Moment wissen?“ In der Fachwelt hat sich dafür der Begriff Kontext-Engineering etabliert, und er markiert den Übergang von generativer KI als Experimentierfeld zur generativen KI als produktiv einsetzbarer Unternehmenskomponente.
Kontext ist nicht gleich Kontext
Moderne Reasoning-Modelle können Aufgaben planen, Werkzeuge nutzen und sich iterativ selbst korrigieren, aber ihre Leistung hängt unmittelbar davon ab, welche Informationen sie zum richtigen Zeitpunkt erhalten. Zwar arbeiten aktuelle Modelle mit sehr großen Kontextfenstern, aber die Qualität der Ausgaben nimmt ab, wenn diese mit ungefilterten Daten überladen werden. Denn das Modell gewichtet relevante Informationen schlechter, je mehr irrelevantes Material im Kontext vorhanden ist. Zu wenig Information führt zu Halluzinationen, weil das Modell Lücken mit trainierten Annahmen füllt. Widersprüchliche oder ablenkende Daten hingegen können selbst leistungsstarke Modelle systematisch in die Irre führen.
Kontext-Engineering zielt darauf ab, genau diese Fehlermodi zu vermeiden. Aus dem gesamten verfügbaren Datenuniversum eines Unternehmens, also E-Mails, Logs, Dokumente, Transaktionshistorien und Sicherheitswarnungen, müssen in Echtzeit genau die Informationen bereitgestellt werden, die für den jeweiligen Entscheidungsmoment des Agenten relevant sind.
Der Weg zur richtigen Information
Unternehmensdaten sind fragmentiert, heterogen und über Dutzende Systeme verteilt. Relevanz hängt von der Fragestellung, vom Datentyp und vom Nutzerkontext ab. Ein Agent, der Sicherheitswarnungen triagiert, braucht andere Retrieval-Mechanismen als einer, der Kundenfeedback auswertet oder Lieferkettenrisiken bewertet. Effektives Kontext-Engineering erfordert deshalb zunächst eine Plattform, auf der alle relevanten Unternehmensdaten, strukturierte wie unstrukturierte, zentral zugänglich und durchsuchbar sind, und die verschiedene Suchtechniken beherrscht und situativ kombiniert.
Semantische Vektorsuche etwa erschließt die Bedeutung hinter einer Anfrage, nicht nur die Wörter darin. Sie eignet sich überall dort, wo Nutzer oder Agenten in natürlicher Sprache nach Konzepten suchen, deren exakte Formulierung in den Dokumenten abweicht. Keyword-Suche hingegen ist präziser und zuverlässiger, wenn es auf exakte Treffer ankommt, etwa bei Produktnummern, Fehlercodes oder regulatorischen Bezeichnungen. Strukturierte Abfragen erschließen numerische oder geografische Daten, die sich weder semantisch noch lexikalisch sinnvoll suchen lassen. In der Praxis liefert keiner dieser Ansätze allein die besten Ergebnisse. Hybrid-Suche, also die Kombination mehrerer Techniken in einer einzigen Abfrage, hat sich deshalb als Standard für produktive Agenten-Architekturen etabliert, weil sie die Stärken der einzelnen Verfahren situativ kombiniert und die jeweiligen Schwächen ausgleicht.
Genau diese Suchtechniken bilden den Retrieval-Layer, auf dem Architekturen wie Retrieval-Augmented Generation (RAG) aufsetzen. RAG ist das Architekturmuster, das Retrieval und Generierung verbindet: Der Agent ruft zunächst relevante Informationen aus den Unternehmensdaten ab und übergibt sie dann als Kontext an das Modell, statt auf dessen trainiertes Wissen zurückzufallen. Das verringert das Halluzinationsrisiko, weil das Modell seine Antworten auf konkrete, abrufbare Quellen stützt. Damit der Agent in der Produktion zuverlässig funktioniert, braucht es zusätzlich integrierte Zugriffskontrollen und Observability, um nachvollziehen zu können, welche Daten der Agent abgerufen hat und warum.
Der zweite Reifegrad: Strukturierte Ausgaben
Selbst wenn ein Agent den richtigen Kontext erhält und eine inhaltlich korrekte Antwort erzeugt, bleibt ein weiteres Problem offen: In welchem Format gibt er diese Antwort zurück? Freiformtext ist für Menschen lesbar, für Downstream-Systeme, nachgelagerte Agenten oder automatisierte Workflows aber eine permanente Fehlerquelle. Sprachmodelle erzeugen probabilistische Ausgaben, sodass die gleiche Anfrage bei jeder Ausführung unterschiedliche Strukturen, Feldnamen oder Formate produzieren kann. In einem Multi-Agenten-System, in dem Agenten miteinander kommunizieren und Ergebnisse weiterreichen, muss jede Schnittstelle somit individuell damit umgehen, was der vorgelagerte Agent zurückgibt. Da Sprachmodelle von Natur aus variable Ausgaben erzeugen, ist das ein Wartungsaufwand, der in der Praxis kaum beherrschbar ist.
Strukturierte Ausgaben adressieren dieses Problem auf struktureller Ebene. Das Modell wird gezwungen, seine Antwort in einem exakt definierten, maschinenlesbaren Format zu liefern, validiert gegen ein Schema, mit typisierten Feldern und definierten Constraints. Entspricht die Ausgabe nicht dem Schema, schlägt die Anfrage sofort fehl, statt fehlerhafte Daten stillschweigend ins System zu schleusen.
Dass Google, OpenAI und Anthropic Strukturierte Ausgaben direkt in ihre APIs integriert haben, zeigt, dass sich das Konzept als Standard etabliert. Der Grundgedanke ist derselbe wie bei API-Verträgen: Ein einmal definiertes Schema macht die Ausgabe vorhersagbar und direkt maschinenlesbar, ohne nachgelagerte Parsing-Logik. So werden Agenten zu berechenbaren Komponenten in einer größeren Automatisierungsarchitektur.
Zwei Konzepte, ein Kreislauf
Kontext-Engineering und strukturierte Ausgaben lösen auf den ersten Blick verschiedene Probleme. Aber in einer produktiven Agenten-Architektur bedingen sie einander. Ein Agent, der zuverlässigen Kontext erhält, aber seine Ergebnisse als Freitext zurückgibt, ist für automatisierte Workflows nicht nutzbar. Ein Agent, der sauber strukturierte Ausgaben liefert, aber mit dem falschen oder unvollständigen Kontext arbeitet, liefert zuverlässig falsche Ergebnisse. Erst wenn beides zusammenkommt, entsteht ein geschlossener Kreislauf: Verifizierter Kontext fließt ins Modell, validierte strukturierte Ausgaben fließen heraus, und nachgelagerte Systeme können darauf aufbauen, ohne zusätzliche Fehlerbehandlung.
Fazit: Die Architektur entscheidet
Die Frage, welches Modell ein Unternehmen einsetzt, tritt zunehmend in den Hintergrund. Was verlässliche KI-Agenten im Unternehmenseinsatz wirklich unterscheidet, ist die Architektur dahinter – die Kontext-Engineering und strukturierte Ausgaben integriert. Deren Fundament ist eine leistungsfähige Such- und Retrievalplattform, die Unternehmensdaten über Systemgrenzen hinweg zugänglich und durchsuchbar macht. Unternehmen, die das heute als strategische Architekturaufgabe begreifen, schaffen die Voraussetzung dafür, dass KI-Agenten nicht nur in der Demo funktionieren, sondern im Alltag zuverlässig Wert liefern.