Why isn't reconstruction just a simple swap-back?

The LLM doesn't just copy tokens from input to output — it generates new text that reasons over them. Tokens appear in contexts the input never had, in combinations the model invented, sometimes with formatting drift (CUST-7F2A coming back as CUST 7F2A or the customer designated 7F2A). A naive exact-match swap fails on these cases, leaving token fragments visible in the output. Real reconstruction is robust token recognition across diverse generative output forms, with substitution that preserves grammatical coherence.

Where does reconstruction have to run?

Inside the enterprise environment, colocated with the mapping and the source systems. Reconstruction requires reading the mapping; if reconstruction runs outside the enterprise — on a vendor's infrastructure, in a third-country region, or on middleware the enterprise doesn't fully control — the mapping has to be replicated to that location, which collapses the protection the tokenisation provided. This is the most common architectural mistake in deployments of this pattern.

What are the three integration patterns for reconstruction?

Inline reconstruction (the AI integration layer performs reconstruction before returning the response — works for synchronous request-response workflows like contract review). Streaming reconstruction (works on token-by-token streams, buffering enough to recognise data-protection tokens as they appear — needed for chat-style UIs and live summarisation). Event-driven reconstruction (happens at the boundary between AI integration and a downstream system like a CRM, ticketing platform, or document store — reconstruction occurs just before the data is written into the system the user will see).

What should happen when the model hallucinates a token?

Three reasonable responses, and the choice should be configurable per workflow. Flag the hallucinated token and surface it as an explicit gap (preserves transparency at the cost of cleanliness). Drop the hallucinated reference and rewrite the surrounding sentence (cleaner output but obscures that the model produced something not grounded in the input). Reject the response and re-prompt the model with a constraint to use only input tokens (highest quality, adds latency and cost). A summarisation for internal review may prefer flagging; a document going to a customer may prefer re-prompting.

What does a reconstruction audit log need to contain?

Enough metadata to answer 'who triggered the reconstruction of which token, when, in service of which workflow, and where did the result go.' It does not need to contain the original values themselves — that would defeat the access controls — but it has to make the operation traceable. Logs should be retained separately from the workflow logs, with different access controls, and under the same boundary constraints as the mapping itself. They are, in effect, an audit trail of the most sensitive operation in the architecture.

What are the most common reconstruction mistakes?

Five recur. Building reconstruction as a manual cleanup step users have to perform (they will skip it). Running reconstruction in a vendor cloud or middleware service because it's convenient (it collapses the protection). Treating reconstruction as static string substitution (it fails on the messy real output from production models). Not logging reconstruction (the team cannot defend the architecture or do incident response). Coupling reconstruction tightly to a specific LLM provider (it breaks when the workflow switches vendor, even if the underlying tokenisation didn't change).

← Learn

KI-Output wiederherstellen: Die letzte Meile zwischen Modellantwort und Geschäftspraxis

Die tokenisierte Antwort eines externen LLM ist noch nicht einsatzbereit. Erst die Rekonstruktion macht daraus verwertbaren Output — und genau hier investieren die meisten Teams zu wenig, bis der Prozess im Produktivbetrieb ins Stocken gerät.

AI Architecture~9 min readUpdated May 2026

TL;DR

Rekonstruktion — der Schritt, der tokenisierten LLM-Output wieder auf Originalwerte abbildet — ist technisch überschaubar, aber architektonisch entscheidend. Die meisten Enterprise-KI-Piloten investieren zu wenig darin und scheitern im Produktivbetrieb am selben Punkt: Das Modell funktioniert, die Integration funktioniert — doch der Output verlangt manuelle Nacharbeit, und der erhoffte Produktivitätsgewinn verpufft. Echte Rekonstruktion ist mehr als ein einfaches Zurücksetzen: Ein LLM erzeugt neuen Text, der Token in unbekannten Kontexten referenziert, manchmal mit Formatierungsabweichungen, manchmal halluziniert, manchmal token-weise gestreamt. Die Rekonstruktion muss innerhalb der Unternehmensinfrastruktur ausgeführt werden, gemeinsam mit dem Mapping — sobald sie auf externer Middleware läuft, bricht der durch die Tokenisierung erzielte Schutz zusammen. Drei Integrationsmuster (Inline, Streaming, Event-Driven) decken die meisten Workflows ab. Halluzinierte Token erfordern eine explizite, konfigurierbare Strategie: markieren, verwerfen oder neu anfordern. Jede Operation muss auditiert und in separaten Logs unter denselben Zugriffskontrollen wie das Mapping gespeichert werden. Fünf Betriebsfehler wiederholen sich: manuelle Bereinigung, falscher Ausführungsort, statische Ersetzung, fehlende Protokollierung, Anbieterabhängigkeit. Wenn die Rekonstruktion stimmt, wird sie zur unsichtbaren Infrastruktur. Wenn nicht, scheitert das gesamte Architekturversprechen still auf der letzten Meile.

1. Warum Rekonstruktion mehr ist als ein simples Zurücksetzen

Wenn Enterprise-KI-Teams einen Workflow entwerfen, der tokenisierte Dokumente an ein externes LLM übergibt, liegt der Fokus fast immer auf der Vorbereitungsphase: Erkennung, Transformation, was die Grenze überquert. Die Antwortseite erhält deutlich weniger Aufmerksamkeit. Die implizite Annahme: Sobald das Modell seinen Output liefert, genügt es, die Token zurückzutauschen — und das Ergebnis ist fertig.

Diese Annahme ist grob korrekt — und operativ falsch. Die Rekonstruktion ist technisch einfach: Token im Mapping nachschlagen, zurücksetzen. Architektonisch ist sie jedoch entscheidend. Hier entscheidet sich, ob ein Pilot in der Demo überzeugt oder ob ein Workflow produktiv betrieben werden kann. Teams, die die Rekonstruktion als Nebensache behandeln, stoßen regelmäßig am selben Punkt an eine Wand: Das Modell läuft, die Integration läuft — aber der Output ist ohne manuelle Nacharbeit nicht nutzbar, und der Produktivitätsgewinn, der das Vorhaben rechtfertigte, löst sich in Luft auf.

Im einfachsten Fall ist die Rekonstruktion symmetrisch zur Tokenisierung: Im Input wurde Marlene Schmidt durch CUST-7F2A ersetzt; der Output referenziert CUST-7F2A; die Rekonstruktion tauscht CUST-7F2A zurück in Marlene Schmidt, der Workflow läuft weiter.

Wären alle Workflows so gestaltet, wäre Rekonstruktion eine Nebensache. In der Praxis ist das aus mehreren Gründen nicht der Fall.

Die Modellantwort ist generativ, nicht nur substitutiv. Ein LLM kopiert keine Token vom Input in den Output — es erzeugt neuen Text, der über die Token schlussfolgert. Der Output referenziert Token in neuen Sätzen, neuen Kombinationen, manchmal paraphrasiert, manchmal zusammengefasst, manchmal über mehrere Eingabe-Token hinweg synthetisiert. Die Rekonstruktionsschicht muss Token in Kontexten verarbeiten, die der Input nie enthielt.
Der Output kann Token enthalten, die im Input nicht vorkamen. Eine Zusammenfassung über fünf Tickets kann einen Satz erzeugen wie: „Drei der betroffenen Kunden (CUST-7F2A, CUST-3B91, CUST-9D2C) verwenden dieselbe Firmware-Version." Diese Konstruktion ist neu. Die Rekonstruktionsschicht muss jeden Token finden, nachschlagen und in einen vom Modell formulierten Satz einsetzen.
Der Output enthält manchmal fehlerhafte Token-Referenzen. Modelle verlieren insbesondere bei langen Ausgaben gelegentlich das Formatierungsmuster. Ein Token, der als CUST-7F2A eingegeben wurde, kann als CUST 7F2A, CUST7F2A oder schlicht als „der Kunde mit der Kennung 7F2A" zurückkommen. Eine Rekonstruktionsschicht, die nur exaktes String-Matching betreibt, versagt in diesen Fällen — der Nutzer erhält Output mit sichtbaren Token-Fragmenten, die hätten aufgelöst werden sollen.
Der Output kann Kommentare oder Einschränkungen des Modells enthalten. „Basierend auf den Informationen zu Kunde CUST-7F2A ist die wahrscheinlichste Ursache ..." Die Rekonstruktion muss Token auch in Nebensätzen, die das Modell eigenständig formuliert hat, mit derselben Genauigkeit verarbeiten wie Token aus direkten Extraktionen.

Was wie ein simples Zurücksetzen wirkt, ist in Wirklichkeit ein kleines, aber reales Textverarbeitungsproblem: robuste Token-Erkennung über diverse Ausgabeformen hinweg — mit einer Ersetzung, die die grammatikalische Kohärenz der Modellantwort wahrt.

2. Wo die Rekonstruktion ausgeführt werden muss

Der Ausführungsort der Rekonstruktion ist nicht verhandelbar: Sie muss innerhalb der Unternehmensinfrastruktur stattfinden — bevor der Output den Nutzer oder ein nachgelagertes System erreicht.

Der Grund ist derselbe, aus dem das Mapping in der Unternehmensinfrastruktur verbleiben muss: Rekonstruktion erfordert das Lesen des Mappings. Findet die Rekonstruktion außerhalb des Unternehmens statt — auf der Infrastruktur eines Anbieters, in einer Drittlandregion, auf einem System, das das Unternehmen nicht vollständig kontrolliert — muss das Mapping an diesem Ort verfügbar gemacht werden. Damit bricht der Schutz zusammen, den die Tokenisierung ursprünglich gewährleistet hat.

Dies ist der häufigste Architekturfehler beim Einsatz dieses Musters: Teams konfigurieren die Tokenisierung innerhalb der Unternehmensgrenze, senden die Daten an das externe LLM — und führen die Rekonstruktion dann in einem Cloud-Dienst oder einer Middleware aus, die zufällig zur Hand ist. Der Komfort ist real. Der Schutz ist dahin. Das Mapping, das ausschließlich unter Unternehmenskontrolle bleiben sollte, wurde an einen Ort repliziert, an dem die ursprünglichen Zusagen nicht mehr gelten.

Die korrekte Architektur sieht vor, dass die Rekonstruktion gemeinsam mit den Quellsystemen und dem Mapping platziert ist — On-Premise, in der eigenen VPC des Unternehmens oder in der EU-regionalen Infrastruktur, in der der Workflow läuft. Der tokenisierte LLM-Output kehrt zurück, durchläuft die Rekonstruktionsschicht innerhalb der Unternehmensgrenze und verlässt diese als verwertbarer Geschäftsinhalt. Die externe Datenreise endet mit der Rekonstruktion.

Bei Workflows, deren restliche Architektur die Grenzen penibel einhält — Kapselung intern, Mapping intern, Audit-Logs intern — und die Rekonstruktion das einzige Element ist, das nach außen gewandert ist, werden alle übrigen Architekturversprechen auf das Schutzniveau reduziert, das der externe Rekonstruktionsort bieten kann.

Abbildung 1 · Der häufigste Architekturfehler — die Rekonstruktion aus Bequemlichkeit auf externer Middleware auszuführen — repliziert das Mapping außerhalb des Unternehmens und hebt den Schutz der Tokenisierung auf.

3. Integration der Rekonstruktion in den Workflow

Rekonstruktion ist kein eigenständiger Schritt, den Nutzer manuell auslösen. Sie ist Infrastruktur, die an jedem Punkt integriert sein muss, an dem KI-Output ausgeliefert wird. Drei Integrationsmuster decken die meisten Enterprise-Deployments ab.

3.1 Inline-Rekonstruktion im Antwortpfad

Die KI-Integrationsschicht — die Middleware zwischen Workflow und LLM-Endpunkt — führt die Rekonstruktion durch, bevor sie die Antwort an das aufrufende System zurückgibt. Das aufrufende System sieht niemals Token; es erhält den fertigen, verwertbaren Output. Dies ist das sauberste Muster und eignet sich für synchrone Anfrage-Antwort-Workflows wie Vertragsüberprüfungen, Zusammenfassungen und Klassifizierungen.

3.2 Streaming-Rekonstruktion

Für LLM-Antworten, die token-weise gestreamt werden (im NLP-Sinne, nicht im datenschutzrechtlichen Sinne — die Begriffsüberschneidung ist unglücklich), muss die Rekonstruktion auf dem Stream arbeiten: Datenschutz-Token werden erkannt, sobald sie erscheinen, und in Echtzeit ersetzt. Dies ist anspruchsvoller als Batch-Rekonstruktion, da ein Datenschutz-Token zu jedem Zeitpunkt nur teilweise gestreamt sein kann und die Rekonstruktionsschicht ausreichend puffern muss, um ihn zu erkennen. Workflows mit Streaming-UIs — Chat-Interfaces, Live-Zusammenfassungen — benötigen dieses Muster; Workflows, die auf die vollständige Antwort warten, nicht.

3.3 Event-Driven-Rekonstruktion

Bei Workflows, in denen der KI-Output nachgelagerte Aktionen auslöst — ein Ticket im Betriebssystem anlegen, einen Bericht ins DMS schreiben, einen Datensatz im CRM aktualisieren — muss die Rekonstruktion an der Grenze zwischen KI-Integration und dem nachgelagerten System stattfinden. Der tokenisierte Output kann in der Integrationsschicht für Routing, Klassifizierung oder Triage verarbeitet werden; die Rekonstruktion erfolgt unmittelbar bevor die Daten in das System geschrieben werden, das der Nutzer sieht.

Die Architektur muss klar definieren, welches Muster auf welchen Workflow anzuwenden ist. Eine Fehlzuordnung — etwa Streaming-Rekonstruktion für einen Event-Driven-Workflow oder Inline-Rekonstruktion für einen Streaming-Workflow — erzeugt nutzerseitige Defekte, die wie KI-Qualitätsprobleme wirken, in Wirklichkeit aber Integrationsfehler sind.

4. Wenn das Modell nicht existierende Token erzeugt

Ein Fehlerfall, dem besondere Aufmerksamkeit gebührt: Das Modell halluziniert gelegentlich Token. Es erzeugt eine Zeichenkette, die dem Token-Format des Systems ähnelt, aber zu keinem Eintrag im Mapping passt.

Dies geschieht aus vorhersehbaren Gründen. Das Modell hat im Input CUST-7F2A und CUST-3B91 gesehen und erzeugt im Output CUST-5D44, indem es das Muster extrapoliert. Oder das Modell fasst zusammen und erfindet einen token-förmigen Platzhalter für eine erschlossene Entität. Seltener übernimmt das Modell ein Token-Format aus seinen Trainingsdaten, das zufällig mit dem Unternehmensformat kollidiert.

Die Rekonstruktionsschicht kann einen halluzinierten Token nicht stillschweigend ersetzen — es gibt nichts, womit er ersetzt werden könnte. Sie kann ihn auch nicht im Output belassen, da der Nutzer ein Fragment sieht, das wie ein Systembezeichner wirkt. Es gibt drei sinnvolle Reaktionen.

Den halluzinierten Token im Output markieren und dem Nutzer als explizite Lücke anzeigen — etwa: „[Verweis auf eine Entität, die das Modell erzeugt hat, die das System jedoch nicht auflösen kann.]" Dies bewahrt die Transparenz auf Kosten der Output-Sauberkeit.
Den halluzinierten Verweis verwerfen und den umgebenden Satz neu formulieren. Dies erzeugt saubereren Output, erfordert jedoch nicht-triviale Textmanipulation durch die Rekonstruktionsschicht und kann verschleiern, dass das Modell etwas produziert hat, das nicht im Input verankert ist.
Die Antwort ablehnen und das Modell mit einer Systemanweisung neu anfragen, die es auf die im Input enthaltenen Token beschränkt. Dies liefert die höchste Ausgabequalität, erhöht jedoch Latenz und Kosten.

Verschiedene Workflows erfordern verschiedene Reaktionen. Eine interne Zusammenfassung kann die erste Option bevorzugen (markieren und anzeigen). Ein Dokument für einen Kunden bevorzugt möglicherweise die dritte (neu anfragen). Diese Entscheidung sollte auf Workflow-Ebene konfigurierbar sein — nicht fest in die Rekonstruktionsschicht einprogrammiert.

5. Auditierbarkeit und Rückverfolgbarkeit

Die Rekonstruktion ist der Moment, in dem die ursprünglichen sensiblen Werte wieder in den Workflow eintreten. Aus Audit-Perspektive ist dies einer der kritischsten Punkte der Architektur — hier werden die Zugriffskontrollen auf die Originaldaten wirksam.

Eine sorgfältig konzipierte Rekonstruktionsschicht protokolliert jeden Vorgang: Welcher Token wurde nachgeschlagen, wann, für welchen Workflow, durch welche Integration. Das Log muss die Originalwerte nicht enthalten — das würde den Zweck der Zugriffskontrollen untergraben — aber es muss ausreichend Metadaten liefern, um die Frage zu beantworten: „Wer hat die Rekonstruktion welches Tokens ausgelöst, und wohin ist das Ergebnis geflossen?"

Dies ist aus zwei operativen Gründen relevant. Erstens macht es die Architektur auditierbar: Eine interne Überprüfung des Workflows kann sicherstellen, dass die Rekonstruktion nur für berechtigte Workflows erfolgt und die Integration wie vorgesehen funktioniert. Zweitens ermöglicht es Incident Response: Verhält sich eine Rekonstruktionsintegration fehlerhaft, zeigt das Log, was geschehen ist und was offengelegt wurde.

Das Audit ist auch im Fehlerfall wichtig, wenn die Rekonstruktion Output an ein nachgelagertes System liefert, das keine Originalwerte erhalten sollte. Schreibt eine Rekonstruktionsintegration versehentlich verwertbaren Output in ein Logging-System, das keine Kundennamen sehen darf, zeigt der Audit-Trail dem Team, was offengelegt wurde und wem. Ohne das Log tappt das Team im Dunkeln.

Rekonstruktions-Logs sollten getrennt von Workflow-Logs aufbewahrt werden, mit eigenen Zugriffskontrollen und unter denselben Grenzbedingungen wie das Mapping selbst. Sie sind faktisch der Audit-Trail des sensibelsten Vorgangs in der Architektur.

6. Die häufigsten Betriebsfehler

In der Praxis zeigt sich bei Deployments dieses Musters ein überschaubares Fehlermuster, das sich wiederholt. Es lohnt sich, diese Fehler beim Namen zu nennen.

Rekonstruktion als manuellen Bereinigungsschritt einbauen. Der häufigste Fehler. Das Team bringt die Tokenisierung zum Laufen, sieht den tokenisierten KI-Output — und fügt dem Nutzer-Workflow einen manuellen Schritt hinzu: „Jetzt Token suchen und ersetzen." Nutzer überspringen diesen Schritt. Oder führen ihn inkonsistent aus. Oder kopieren tokenisierten Output in ein System, das ihn nicht sehen sollte, und die Bereinigung findet nie statt. Rekonstruktion muss Infrastruktur sein: automatisch und unsichtbar. Ist ein menschlicher Eingriff erforderlich, wird sie auf schwer erkennbare Weise sporadisch versagen.
Rekonstruktion am falschen Ort ausführen. Wie beschrieben ist der Komfort externer Ausführung real — ebenso der Schutzverlust. Die Architektur verspricht, dass Originalwerte in der Unternehmensinfrastruktur verbleiben; die Rekonstruktion muss dieses Versprechen einlösen.
Rekonstruktion als statische Ersetzung behandeln. Echte Rekonstruktion muss fehlerhafte Token, halluzinierte Token, Token in unerwarteten Kontexten und Streaming-Antworten verarbeiten. Eine naive Implementierung mit exaktem String-Matching funktioniert in der Demo — und versagt im Produktivbetrieb, wo der tatsächliche Modell-Output unordentlicher ist als Demo-Fälle.
Rekonstruktion nicht protokollieren. Rekonstruktion ohne Audit-Trail ist nicht verteidigbar. Beim ersten Mal, dass jemand fragt „Hat die KI jemals diesen Kundennamen gesehen, und wohin ist das Ergebnis geflossen?", kann das Team ohne Rekonstruktions-Logs nicht antworten.
Rekonstruktion eng an einen bestimmten LLM-Anbieter koppeln. Rekonstruktionslogik, die das Antwortformat von ChatGPT voraussetzt, bricht, wenn der Workflow auf Claude oder Gemini wechselt — obwohl die zugrundeliegende Tokenisierung unverändert bleibt. Die Rekonstruktionsschicht sollte anbieterunabhängig sein und die Modellantwort als zu verarbeitenden Text behandeln, nicht als bekannte Struktur.

7. Merkmale einer guten Rekonstruktion

Eine Rekonstruktionsschicht, die im Produktivbetrieb funktioniert, weist ein überschaubares Set an Eigenschaften auf.

Läuft innerhalb der Unternehmensinfrastruktur, gemeinsam mit dem Mapping.
Wird automatisch an der Integrationsgrenze aufgerufen — nie als manueller Schritt.
Verarbeitet Streaming-, Batch- und Event-Driven-Workflows über unterschiedliche Aufrufmuster, aber einen gemeinsamen Kern.
Erkennt Token robust über die Variationen, die echter Modell-Output erzeugt — Formatierungsabweichungen, Teilreferenzen, Paraphrasen.
Unterscheidet zwischen legitimen Token und halluzinierten token-förmigen Zeichenketten und behandelt beide nach einer konfigurierbaren Strategie.
Protokolliert jeden Vorgang in einem separaten Audit-Trail unter ausschließlicher Unternehmenskontrolle.
Anbieterunabhängig — der Workflow kann LLM-Endpunkte wechseln, ohne die Rekonstruktionsschicht neu schreiben zu müssen.

Sind diese Eigenschaften erfüllt, wird die Rekonstruktion zur unsichtbaren Infrastruktur. Der Nutzer reicht ein Dokument ein, der Workflow läuft, das Ergebnis kommt mit echten Werten in echter Struktur zurück — und der Nutzer sieht nie einen Token. Das Architekturversprechen — dass sensible Daten innerhalb der Unternehmensgrenze verblieben, während die KI nützliche Arbeit leistete — gilt für beide Hälften des Workflows.

Sind diese Eigenschaften nicht erfüllt, ist die Rekonstruktion der Punkt, an dem der Workflow bricht. Die Tokenisierung kann perfekt sein, das Modell hervorragend, die Grenzen penibel eingehalten — und der Nutzer erhält trotzdem Output, den er nicht verwenden kann, oder sensible Daten erscheinen versehentlich in einem nachgelagerten System, das sie nicht erhalten sollte. Die letzte Meile ist der Punkt, an dem die Architektur ihr Versprechen einlöst — oder still versagt.

8. Einordnung in das Gesamtmuster

Rekonstruktion ist eine der vier Phasen des übergeordneten Musters — Erkennung, Transformation (Tokenisierung), externe Verarbeitung, Rekonstruktion —, das es externen LLMs ermöglicht, mit Daten zu arbeiten, die das Unternehmen nicht im Rohformat verlassen dürfen. Die vier Phasen bilden ein Ganzes: Die Stärke der Architektur entspricht der schwächsten der vier Phasen.

Eine Übersicht über die Gesamtarchitektur und die Designentscheidungen der anderen drei Phasen bietet der Pillar-Beitrag zum Betrieb externer LLMs mit sensiblen Unternehmensdaten. Warum entfernungsbasierte Ansätze — Maskierung, Schwärzung, DSGVO-Guardrails — bei operativen Daten versagen und warum dieses Muster überhaupt benötigt wird, erläutert der Artikel zu KI-Workflows, die an Tabellen, Tickets und operativen Dokumenten scheitern. Die Tokenisierungsmuster auf der Eingabeseite, die die in diesem Artikel beschriebene Rekonstruktion umkehrt, behandelt der Artikel zur Tokenisierung für LLM-Eingaben.

Wesentliche Erkenntnisse

Rekonstruktion ist technisch überschaubar, aber architektonisch entscheidend — hier trennen sich Piloten, die in der Demo überzeugen, von Workflows, die produktiv betrieben werden.
Kein simples Zurücksetzen: LLM-Output ist generativ, enthält neue Token-Kombinationen, leidet unter Formatierungsabweichungen und halluziniert gelegentlich token-förmige Zeichenketten.
Der Ausführungsort ist nicht verhandelbar: Rekonstruktion muss innerhalb der Unternehmensinfrastruktur, gemeinsam mit dem Mapping, stattfinden. Externe Rekonstruktion hebt den Schutz auf.
Drei Integrationsmuster decken die meisten Workflows ab: Inline, Streaming und Event-Driven. Falsche Zuordnung erzeugt Defekte, die wie Modellprobleme wirken.
Halluzinierte Token erfordern eine explizite, konfigurierbare Strategie: markieren und anzeigen, verwerfen und neu formulieren oder ablehnen und neu anfragen.
Auditierung ist unverzichtbar: Die Rekonstruktion ist der Moment, in dem Originalwerte wieder in den Workflow eintreten — Logs sind das Mittel, mit dem das Team diesen Moment dokumentiert und im Ernstfall untersucht.
Fünf wiederkehrende Fehler: manuelle Bereinigung, falscher Ausführungsort, statische Ersetzung, fehlende Protokollierung, Anbieterabhängigkeit.
Gute Rekonstruktion ist unsichtbare Infrastruktur. Schlechte Rekonstruktion ist der Punkt, an dem die Architektur auf der letzten Meile still versagt.

Häufig gestellte Fragen

Warum ist Rekonstruktion mehr als ein simples Zurücksetzen?

Ein LLM kopiert keine Token vom Input in den Output — es erzeugt neuen Text, der über sie schlussfolgert. Token erscheinen in Kontexten, die der Input nie enthielt, in Kombinationen, die das Modell erfunden hat, manchmal mit Formatierungsabweichungen (CUST-7F2A kehrt als CUST 7F2A oder „der Kunde mit der Kennung 7F2A" zurück). Ein naives Matching versagt in diesen Fällen und hinterlässt sichtbare Token-Fragmente im Output. Echte Rekonstruktion ist robuste Token-Erkennung über diverse generative Ausgabeformen — mit einer Ersetzung, die die grammatikalische Kohärenz wahrt.

Wo muss die Rekonstruktion ausgeführt werden?

Innerhalb der Unternehmensinfrastruktur, gemeinsam mit Mapping und Quellsystemen. Rekonstruktion erfordert das Lesen des Mappings; findet sie außerhalb des Unternehmens statt — auf Anbieterinfrastruktur, in einer Drittlandregion oder auf Middleware, die das Unternehmen nicht vollständig kontrolliert — muss das Mapping dort repliziert werden, was den durch die Tokenisierung erzielten Schutz aufhebt. Dies ist der häufigste Architekturfehler bei Deployments dieses Musters.

Welche drei Integrationsmuster gibt es für die Rekonstruktion?

Inline-Rekonstruktion — die KI-Integrationsschicht führt die Rekonstruktion durch, bevor sie die Antwort zurückgibt. Geeignet für synchrone Anfrage-Antwort-Workflows wie Vertragsüberprüfungen. Streaming-Rekonstruktion — arbeitet auf token-weisen Streams, puffert ausreichend, um Datenschutz-Token beim Erscheinen zu erkennen. Erforderlich für Chat-Interfaces und Live-Zusammenfassungen. Event-Driven-Rekonstruktion — findet an der Grenze zwischen KI-Integration und einem nachgelagerten System — CRM, Ticketing-Plattform, Dokumentenablage — statt; die Rekonstruktion erfolgt unmittelbar vor dem Schreiben in das System, das der Nutzer sieht.

Was sollte geschehen, wenn das Modell einen Token halluziniert?

Drei sinnvolle Reaktionen — die Wahl sollte pro Workflow konfigurierbar sein. Markieren: den halluzinierten Token als explizite Lücke anzeigen — Transparenz auf Kosten der Sauberkeit. Verwerfen: den halluzinierten Verweis entfernen und den Satz neu formulieren — saubererer Output, verschleiert jedoch, dass das Modell etwas Unverankertes produziert hat. Ablehnen: die Antwort ablehnen und das Modell mit Token-Beschränkung neu anfragen — höchste Qualität, erhöht Latenz und Kosten. Eine interne Zusammenfassung bevorzugt möglicherweise die Markierung; ein Kundendokument die Neuanfrage.

Was muss ein Rekonstruktions-Audit-Log enthalten?

Ausreichend Metadaten, um die Frage zu beantworten: „Wer hat die Rekonstruktion welches Tokens ausgelöst, wann, für welchen Workflow, und wohin ist das Ergebnis geflossen?" Die Originalwerte selbst müssen nicht enthalten sein — das würde die Zugriffskontrollen untergraben — aber der Vorgang muss rückverfolgbar sein. Logs sollten getrennt von Workflow-Logs aufbewahrt werden, mit eigenen Zugriffskontrollen und denselben Grenzbedingungen wie das Mapping selbst. Sie sind faktisch der Audit-Trail des sensibelsten Vorgangs in der Architektur.

Was sind die häufigsten Fehler bei der Rekonstruktion?

Fünf wiederholen sich. Manuelle Bereinigung — Rekonstruktion als Schritt, den Nutzer ausführen müssen — sie werden ihn überspringen. Falscher Ort — Rekonstruktion in einer Vendor-Cloud, weil es bequem ist — der Schutz bricht zusammen. Statische Ersetzung — Rekonstruktion als exaktes String-Matching — versagt bei unordentlichem Produktiv-Output. Fehlende Protokollierung — das Team kann die Architektur nicht verteidigen und keinen Incident Response durchführen. Anbieterabhängigkeit — Rekonstruktionslogik an ein bestimmtes LLM-Format koppeln — bricht beim Anbieterwechsel, auch wenn die Tokenisierung unverändert bleibt.

Have a deployment question?

Bring your industry, your regulatory profile, and your data. We respond within one business day.

Request a Live Demo

Email : contact@cubig.ai

CUBIG LTD (United Kingdom)

Company Number: NI735459
Address: 21 Arthur Street, Belfast, Antrim, United Kingdom, BT1 4GA

CUBIG CORP (Republic of Korea)

Business Registration Number : 133-81-45679

E-Commerce Registration : 2023-Seoul-Seocho-2822

Address: 4F, NAVER 1784, 95, Jeongjail-ro, Bundang-gu, Seongnam-si, Gyeonggi-do, Republic of Korea

Produkt

Ressourcen

Company

Lösungen

Consent Preferences

Email : contact@cubig.ai

CUBIG LTD (United Kingdom)

Company Number: NI735459
Address: 21 Arthur Street, Belfast, Antrim, United Kingdom, BT1 4GA

CUBIG CORP (Republic of Korea)

Business Registration Number : 133-81-45679

E-Commerce Registration : 2023-Seoul-Seocho-2822

Address: 4F, NAVER 1784, 95, Jeongjail-ro, Bundang-gu, Seongnam-si, Gyeonggi-do, Republic of Korea

Produkt

Ressourcen

Company

Lösungen

Consent Preferences

Email : contact@cubig.ai

CUBIG LTD (United Kingdom)

Company Number: NI735459
Address: 21 Arthur Street, Belfast, Antrim, United Kingdom, BT1 4GA

CUBIG CORP (Republic of Korea)

Business Registration Number : 133-81-45679

E-Commerce Registration : 2023-Seoul-Seocho-2822

Address: 4F, NAVER 1784, 95, Jeongjail-ro, Bundang-gu, Seongnam-si, Gyeonggi-do, Republic of Korea

Produkt

Ressourcen

Company

Lösungen

Consent Preferences

Email : contact@cubig.ai

CUBIG LTD (United Kingdom)

Company Number: NI735459
Address: 21 Arthur Street, Belfast, Antrim, United Kingdom, BT1 4GA

CUBIG CORP (Republic of Korea)

Business Registration Number : 133-81-45679

E-Commerce Registration : 2023-Seoul-Seocho-2822

Address: 4F, NAVER 1784, 95, Jeongjail-ro, Bundang-gu, Seongnam-si, Gyeonggi-do, Republic of Korea

Produkt

Ressourcen

Company

Lösungen

Consent Preferences

Email : contact@cubig.ai

CUBIG LTD (United Kingdom)

Company Number: NI735459
Address: 21 Arthur Street, Belfast, Antrim, United Kingdom, BT1 4GA

CUBIG CORP (Republic of Korea)

Business Registration Number : 133-81-45679

E-Commerce Registration : 2023-Seoul-Seocho-2822

Address: 4F, NAVER 1784, 95, Jeongjail-ro, Bundang-gu, Seongnam-si, Gyeonggi-do, Republic of Korea

Produkt

Ressourcen

Company

Lösungen

Consent Preferences