How is this approach different from data masking?

Masking optimises for what's removed — names, IDs, and identifying fields are replaced with redaction markers. That works for documents where the sensitive part is cleanly separable, but it breaks on operational data because the structure the AI needs to reason about gets destroyed in the process. The approach described here uses structure-preserving tokenisation: sensitive elements are replaced with placeholders that retain format, type, and relationships, so the AI sees a coherent document rather than a fragmented one. The mapping back to original values stays inside the enterprise.

Does this work for any external LLM, or only specific ones?

The approach is provider-agnostic by design. From the external LLM's perspective, it receives a normal request — it has no way to know the document has been transformed, and no need to. This means swapping ChatGPT for Claude, Gemini, or a new vendor is a configuration change rather than an architectural rewrite. The transformation layer is the constant; the external model is the variable.

What happens to the mapping between tokens and original values?

The mapping is the most sensitive component of the architecture — in effect, the key that re-identifies the data. Standard and good practice is that the mapping is held exclusively by the enterprise, in storage the external LLM provider has no access to. This is a non-negotiable design property. If a vendor's architecture allows the mapping to leave the enterprise environment, the approach's protection collapses.

Where does the transformation layer have to run?

Inside the enterprise environment — on-premise, in the company's own cloud VPC, or on dedicated infrastructure that the enterprise controls. The constraint is that the transformation happens before the data reaches the external network. Vendors that offer this approach as an external SaaS — where transformation happens on the vendor's infrastructure — have collapsed the architecture into a different problem. The whole point is that the transformation runs where the data already lives.

What workflows does this approach not solve?

Workflows where the AI must operate on the literal sensitive content as part of its task. Personalised content generation that addresses the customer directly. Verification workflows that must check against the actual identifier. Investigative searches that require the original strings. A useful rule of thumb: if the AI's output could be expressed as 'do this analytical thing to this kind of data and tell me what you find,' the approach usually works. If the output requires 'act on this specific customer/case/identifier,' it usually doesn't.

How does this differ from running an on-premise open-source model?

On-premise deployment solves the data problem by replacing the AI capability with something internal — the data never leaves, but the model is whatever the enterprise can host. That works when the workflow is bounded enough for a smaller model to suffice. The transformation-layer approach keeps the frontier external models in the loop and changes what crosses the boundary instead. The heavy lifting still happens on the most capable models; only the form of the data is different.

← Learn

KI-Output wiederherstellen: Die letzte Meile zwischen Modellantwort und Geschäftspraxis

Die tokenisierte Antwort eines externen LLM ist noch nicht einsatzbereit. Erst die Rekonstruktion macht daraus verwertbaren Output — und genau hier investieren die meisten Teams zu wenig, bis der Prozess im Produktivbetrieb ins Stocken gerät.

KI-Architektur~9 Min. LesezeitAktualisiert Mai 2026

Zusammenfassung

Rekonstruktion — der Schritt, der tokenisierten LLM-Output wieder auf Originalwerte abbildet — ist technisch überschaubar, aber architektonisch entscheidend. Die meisten Enterprise-KI-Piloten investieren zu wenig darin und scheitern im Produktivbetrieb am selben Punkt: Das Modell funktioniert, die Integration funktioniert — doch der Output verlangt manuelle Nacharbeit, und der erhoffte Produktivitätsgewinn verpufft. Echte Rekonstruktion ist mehr als ein einfaches Zurücksetzen: Ein LLM erzeugt neuen Text, der Token in unbekannten Kontexten referenziert, manchmal mit Formatierungsabweichungen, manchmal halluziniert, manchmal token-weise gestreamt. Die Rekonstruktion muss innerhalb der Unternehmensinfrastruktur ausgeführt werden, gemeinsam mit dem Mapping — sobald sie auf externer Middleware läuft, bricht der durch die Tokenisierung erzielte Schutz zusammen. Drei Integrationsmuster (Inline, Streaming, Event-Driven) decken die meisten Workflows ab. Halluzinierte Token erfordern eine explizite, konfigurierbare Strategie: markieren, verwerfen oder neu anfordern. Jede Operation muss auditiert und in separaten Logs unter denselben Zugriffskontrollen wie das Mapping gespeichert werden. Fünf Betriebsfehler wiederholen sich: manuelle Bereinigung, falscher Ausführungsort, statische Ersetzung, fehlende Protokollierung, Anbieterabhängigkeit. Wenn die Rekonstruktion stimmt, wird sie zur unsichtbaren Infrastruktur. Wenn nicht, scheitert das gesamte Architekturversprechen still auf der letzten Meile.

1. Der stille Widerspruch im Kern der Unternehmens-KI

Im Jahr 2026 stehen viele Unternehmen vor einem strukturellen Problem, das selten offen benannt wird.

Externe Large Language Models — ChatGPT, Claude, Gemini und andere — erzielen messbar bessere Ergebnisse als intern betriebene Modelle. Sie bewältigen Kontextfenster, an denen interne Systeme scheitern. Sie verbessern sich alle paar Monate, ohne dass das Unternehmen Kosten für Nachtraining trägt. Nach den meisten Kriterien, die für Unternehmen relevant sind, sind sie die naheliegende Wahl.

Und dennoch: In einer Vielzahl regulierter Unternehmen dürfen diese Modelle rechtlich oder vertraglich keinen Zugriff auf die Daten erhalten, auf denen der Betrieb tatsächlich basiert. Kundendaten können nicht an US-gehostete Endpunkte übermittelt werden. Betriebsprotokolle unterliegen sektorspezifischen Datenhaltungsanforderungen. Dokumente enthalten Bezeichner, bei denen vertragliche Vereinbarungen eine Weitergabe außerhalb definierter Grenzen ausschließen. Die Daten, bei denen KI den größten Nutzen entfalten würde, sind genau die, die sie nicht einsehen darf.

Das Ergebnis ist ein Muster, das CIOs in europäischen Banken, Versicherungen, Telekommunikationsunternehmen und Krankenhäusern kennen. Pilotprojekte laufen auf synthetischen oder anonymisierten Stichproben. Die Benchmarks sehen vielversprechend aus. Der Vorstand wird informiert, dass KI kommt. Dann trifft der Produktivbetrieb auf Daten, die im Piloten nicht berücksichtigt wurden — und der Workflow kommt zum Stillstand. Einige Teams geben auf. Andere entwickeln interne LLMs, die die Erwartungen nicht erfüllen. Wieder andere leiten Daten still über Kanäle um, die dafür nicht vorgesehen sind — ein Phänomen, das heute als Shadow-KI bezeichnet wird.

Dieser Artikel beschreibt die drei gängigen Ansätze, die KI-Teams als erstes ausprobieren, zeigt auf, wo jeder einzelne versagt, und stellt einen anderen Ansatz vor — einen, der in produktiven Deployments in Telekommunikation, Gesundheitswesen, Finanzwesen und Verteidigung eingesetzt wird und die eigentliche Frage neu formuliert.

2. Warum dieses Problem schwieriger ist als es aussieht

Die erste Reaktion beim Auftreten dieses Problems ist meist der Griff zu einem verfügbaren Werkzeug: einer Datenmaskierungsbibliothek, einer PII-Erkennungs-API oder einer privaten Bereitstellung eines Open-Source-Modells. Jedes dieser Werkzeuge löst einen Teil des Problems — und scheitert an einem anderen Punkt im Workflow.

Der Grund liegt darin, dass Unternehmensdaten nicht so strukturiert sind, wie die Werkzeuge es voraussetzen. Ein Datenschutz-Tool für Verbraucher geht davon aus, dass der sensible Teil eines Datensatzes ein Name, eine E-Mail-Adresse oder eine Telefonnummer ist — Felder, die erkannt und ersetzt werden können. Ein Unternehmensdokument hingegen ist ein Service-Ticket mit zwölf Querverweisfeldern, einer Freitextbeschreibung mit Kundenformulierungen, einem angehängten Protokollauszug und Verweisen auf interne Asset-IDs. Sensible Informationen liegen ebenso in der Struktur wie in den Einzelfeldern. Wird die Struktur entfernt, verliert die KI die Grundlage ihrer Arbeit.

Hinzu kommt: Datenhaltungsanforderungen in Unternehmen betreffen oft weniger die Art der Daten als ihren Übertragungsweg. Ein Dokument kann intern legal verarbeitbar, aber nicht in ein Drittland übermittelbar sein — aufgrund von Kundenverpflichtungen, sektorspezifischen Datenhaltungsregeln oder der eigenen Datenschutzstrategie. Die Einschränkung ist geografischer und vertraglicher Natur, nicht nur kategorialer.

Das ist die tatsächliche Situation, vor der KI-Teams in Unternehmen stehen: strukturierte operative Daten, die für KI gerade wegen ihrer Detailtiefe wertvoll sind, gebunden durch Anforderungen, die ihre Weitergabe verhindern — während die leistungsfähigsten Modelle jenseits dieser Grenze verfügbar sind.

3. Die drei gängigen Ansätze — und wo jeder versagt

Die meisten Diskussionen über Unternehmens-KI münden in einen von drei Ansätzen. Jeder ist für sich genommen nachvollziehbar. Keiner davon führt allein zu produktionsreifen Workflows, wenn es auf sie ankommt.

3.1 Ansatz 1 — Daten übermitteln und Risiko akzeptieren

Der einfachste Ansatz ist die Übermittlung der Daten an das externe LLM unter Berufung auf die vertraglichen Zusicherungen des Anbieters — Datenverarbeitungsverträge, Standardvertragsklauseln, regionale Endpunkte. So funktioniert der Großteil der öffentlichen LLM-Nutzung in der Praxis.

Dieser Ansatz funktioniert für Workflows, bei denen die Daten von vornherein nicht sensibel sind — Marketingtexte, öffentliche Dokumente, allgemeine interne Anfragen. Er versagt in dem Moment, in dem der Workflow Kundendaten, operative Systeme oder vertraglich gebundene Informationen berührt. Die Zusicherung des Anbieters ist vertraglicher, nicht architektonischer Natur. Für die Workflows, bei denen es wirklich darauf ankommt, ist die vertragliche Ebene häufig die Grenze, an der eine rechtliche Prüfung im Unternehmen ansetzt.

3.2 Ansatz 2 — Maskierung und Schwärzung vor der Übermittlung

Der nächste Reflex ist, sensible Inhalte intern zu halten. Namen, IDs und identifizierende Felder werden vor der Übermittlung an das LLM maskiert oder geschwärzt. Das Modell sieht eine bereinigt Version.

Für Dokumente, bei denen der sensible Teil klar abgrenzbar ist — etwa ein Vertrag, bei dem die Parteien geschwärzt werden, oder ein Lebenslauf, bei dem der Name entfernt wird — funktioniert dieser Ansatz. Bei operativen Daten scheitert er aus zwei Gründen. Erstens zerstört die Maskierung die Struktur, die die KI benötigt: Eine Tabelle, in der Kundennamen durch [REDACTED] ersetzt wurden, ist keine Tabelle mehr, über die die KI sinnvoll schlussfolgern kann. Zweitens enthält operative Daten zahlreiche Bezeichner, die einfache Maskierungslösungen nicht erkennen — Ticket-Nummern, Asset-IDs, interne Codes, Netzwerkkennungen, Freitextverweise — und jeder dieser Bezeichner kann je nach Kontext sensibel sein.

Das grundlegende Problem: Maskierung optimiert für das Entfernte, nicht für das Nutzbare. Für Workflows, bei denen die KI Zusammenhänge in den Daten verstehen muss, zerstören entfernungsbasierte Ansätze den Workflow, auch wenn sie die sensiblen Inhalte erfolgreich verbergen.

3.3 Ansatz 3 — Vollständige On-Premise-Bereitstellung

Der dritte Ansatz ist der Verzicht auf externe LLMs zugunsten eines Open-Source-Modells auf eigener Infrastruktur. Die Daten verlassen das Unternehmen nicht. Vertragliche Fragen und Datenhaltungsanforderungen lösen sich damit auf.

Dieser Ansatz funktioniert — aber er hat Kosten, die zu Beginn nicht immer sichtbar sind. Interne Modelle, auch gute, liegen bei den Dimensionen, die Unternehmen tatsächlich interessieren — Schlussfolgerungen über komplexe Dokumente, Umgang mit unbekannten Formaten, Verarbeitung langer Kontexte — typischerweise zwölf bis achtzehn Monate hinter den führenden externen Modellen zurück. Der Betriebsaufwand ist erheblich: GPU-Infrastruktur, Modell-Serving-Stack, Evaluierungspipeline, ein Team mit dem nötigen Know-how. Und es gibt die Schere: Alle sechs Monate springen externe Modelle vor, und die Lücke zwischen dem, was das interne Modell kann, und dem, was das Unternehmen inzwischen erwartet, wird größer.

Für bestimmte Workflows — insbesondere dort, wo Datenhaltungsanforderungen absolut sind und der Workflow so überschaubar ist, dass ein kleineres Modell ausreicht — ist dieser Ansatz die richtige Wahl. Für die meisten anderen Anwendungsfälle löst er das Datenproblem auf Kosten der KI-Vorteile.

3.4 Was diese drei Ansätze gemeinsam haben

Allen drei Ansätzen liegt dieselbe Annahme zugrunde: Die Frage lautet, ob die Daten an das externe LLM gesendet werden sollen — und wenn nicht, was stattdessen gesendet werden soll. Sie behandeln die Grenze als gegeben und fragen, was sie passieren kann.

Ein anderer Ansatz stellt eine andere Frage.

Ansatz	Funktioniert bei	Versagt bei	Kernkompromiss
Daten senden, Risiko akzeptieren	Nicht sensible Daten — Marketingtexte, öffentliche Dokumente, allgemeine Anfragen	Workflows mit Kundendaten, operativen Systemen oder vertraglichen Datenbindungen	Vertraglicher, kein architektonischer Schutz
Maskierung und Schwärzung	Klar abgrenzbare sensible Inhalte — Vertragsparteien, Lebenslaufname	Operative Daten, bei denen Struktur Bedeutung trägt; nicht offensichtliche Identifikatoren	Optimiert für das Entfernte, nicht für das Nutzbare
Vollständige On-Premise-Bereitstellung	Überschaubare Workflows; absolute Datenhaltungsanforderungen	Workflows, die fortgeschrittenes Schlussfolgern, langen Kontext oder unbekannte Formate erfordern	Datenproblem gelöst auf Kosten der KI-Leistungsfähigkeit

4. Ein anderer Ansatz — das Grenzüberschreitende verändern

Dieser Ansatz beginnt mit einer anderen Prämisse. Statt zu fragen was kann an das externe LLM gesendet werden, lautet die Frage: Was benötigt das externe LLM, um nützlich zu sein — und kann das anstelle der Originaldaten übermittelt werden?

Für eine große Klasse von Unternehmens-Workflows lautet die Antwort: Das LLM benötigt die Struktur, die Zusammenhänge, die gestellte Frage und die Form der erwarteten Antwort. Es benötigt nicht den tatsächlichen Kundennamen, die eigentliche Kontonummer, den realen Asset-Identifikator. Es benötigt einen Platzhalter, der sich im Kontext der Aufgabe genauso verhält wie der echte Wert.

Wenn sensible Elemente durch strukturierte Token ersetzt werden — Platzhalter, die Format, Typ und Beziehungen erhalten, außerhalb der Ursprungsumgebung aber keine Bedeutung haben — überquert nicht mehr das Original die Grenze. Es ist eine Transformation der Daten, die alles behält, was die KI benötigt, und alles entfernt, was innerhalb der Grenze verbleiben soll.

Das Mapping zwischen Token und Originalwerten verbleibt innerhalb der Unternehmensumgebung. Die KI verarbeitet die tokenisierte Version und gibt eine tokenisierte Antwort zurück. Intern werden die Token auf die Originalwerte zurückgemappt; das Ergebnis ist eine betriebsfertige Ausgabe mit echten Kundennamen, echten Zahlen und echten Referenzen.

Dies ist keine Maskierung — die Token erhalten Struktur und Format. Es sind keine synthetischen Daten — der Workflow operiert auf echten Produktivdaten. Es ist keine On-Premise-Bereitstellung — die eigentliche Verarbeitungsleistung erbringen weiterhin die führenden externen Modelle. Es ist eine Transformationsschicht zwischen der Unternehmensumgebung und der externen KI, die verändert, was die externe KI sieht — ohne zu verändern, was die Unternehmensumgebung weiß.

Verschiedene Communities verwenden unterschiedliche Begriffe für Teile dieses Ansatzes. In der Datenschutzpraxis wird der Ersetzungsschritt üblicherweise als Tokenisierung bezeichnet — sensible Werte werden durch rückmappbare Platzhalter ersetzt. Wenn Tokenisierung mit Strukturerhalt, formatkongruenten Platzhaltern und optionalen statistischen Schutzmaßnahmen kombiniert wird, spricht man von einer Kapselungsschicht (Encapsulation Layer) — einer übergeordneten Architektur, bei der die Tokenisierung den Kernmechanismus bildet. Die Terminologie variiert; der architektonische Gedanke ist konsistent: Die Grenze bleibt unverändert, die KI-Leistungsfähigkeit bleibt erhalten. Was sich verändert, ist die Form der Daten, die die Grenze überquert.

Abbildung 1 · Originaldaten und Mapping verlassen das Unternehmen nicht. Nur tokenisierte Daten und tokenisierte Antworten überqueren die Grenze zum externen LLM.

●

Die Architektur in einem Satz. Originaldaten und Token-Wert-Mapping verbleiben in der Unternehmensumgebung. Nur tokenisierte Daten und tokenisierte Antworten überqueren die Grenze zum externen LLM.

5. Wie dieser Ansatz in der Praxis funktioniert

Die Architektur gliedert sich in vier Phasen mit jeweils eigenständigen Designentscheidungen.

5.1 Erkennung

Bevor Daten transformiert werden, muss das System identifizieren, was in diesem Kontext als sensibel gilt. Erkennung ist in der Praxis schwieriger als zunächst erwartet: Sensible Elemente in operativen Daten sind nicht nur Namen und IDs, sondern die spezifischen Merkmale, die dieses Unternehmen als schutzwürdig definiert hat — Projektkennzeichen, Vertragsbedingungen, interne Asset-Verweise, sektorspezifische Identifikatoren. Generische PII-Erkennung erfasst etwa vierzig Prozent dessen, was tatsächlich relevant ist. Die restlichen sechzig Prozent muss das Unternehmen selbst definieren — in einer Form, die sich mit dem Geschäft weiterentwickeln kann. Produktionsreife Erkennung muss strukturierte Felder und unstrukturierten Freitext bewältigen — mit semantischem Verständnis statt reinem Musterabgleich.

5.2 Transformation

Sind sensible Elemente identifiziert, müssen sie durch Platzhalter ersetzt werden, die die strukturelle Rolle des Originals erhalten. Ein Kundenname in einem Freitextfeld wird zu einem Token, das die KI als Namen erkennt und konsistent referenziert. Eine Kontonummer bleibt eine Kontonummer — lediglich ohne semantische Bedeutung außerhalb des Systems. Die Transformation muss Tabellen, Querverweise, Hierarchien und Dokumentstrukturen intakt lassen. Gut umgesetzt liest sich das Ergebnis wie ein kohärentes Dokument mit anonymen, aber realistischen Platzhaltern. Schlecht umgesetzt ist es mit [REDACTED]-Markierungen durchsetzt, die den Zusammenhang zerstören.

Einige Implementierungen ergänzen die Tokenisierung um zusätzliche Schutzmaßnahmen — statistische Rauschüberlagerung, Durchsetzung von k-Anonymität über Batches oder Anwendung von Differential-Privacy-Techniken auf bestimmte Attribute. Dies reduziert das Restrisiko, dass ein versierter Angreifer Entitäten anhand der tokenisierten Daten re-identifizieren könnte. Ob diese Schicht erforderlich ist, hängt vom jeweiligen Bedrohungsmodell ab. Für die meisten Unternehmens-Workflows ist strukturerhaltende Tokenisierung allein ausreichend, sofern das Mapping gut kontrolliert wird. Für Workflows, bei denen Daten auch auf Architekturebene innerhalb der EU oder anderer definierter Grenzen verbleiben müssen — etwa unter DSGVO (GDPR) oder BSI C5 — ist der zusätzliche Schutz den Mehraufwand wert.

5.3 Externe Verarbeitung

Das tokenisierte Dokument wird über die vom Unternehmen genutzten APIs oder Integrationen an das externe LLM übermittelt. Aus Sicht des LLM ist dies eine normale Anfrage — es kann nicht wissen, dass das Dokument transformiert wurde, und muss es auch nicht wissen. Das LLM führt seine Aufgaben aus — Zusammenfassung, Extraktion, Klassifikation, Schlussfolgerung — und gibt eine tokenisierte Antwort zurück, die dieselben Token enthält wie die Eingabe.

5.4 Wiederherstellung

Innerhalb der Unternehmensumgebung wird die tokenisierte Antwort auf die Originalwerte zurückgemappt. Platzhalter für Kundennamen erhalten die echten Namen zurück. Platzhalter-Kontonummern werden zu echten Kontonummern. Die Struktur und die Schlussfolgerungen der KI bleiben erhalten; lediglich die Platzhalter werden ersetzt. Das Ergebnis ist eine betriebsfertige Ausgabe, die direkt in den ursprünglichen Workflow eingespeist werden kann.

Die Wiederherstellungsphase wird von den meisten Teams unterschätzt. Sie bestimmt, ob die KI-Ausgabe im Produktivbetrieb tatsächlich nutzbar ist oder ob jemand sie manuell nacharbeiten muss. Eine gute Wiederherstellungsschicht ist unsichtbar: Der Nutzer übergibt ein Dokument, die KI liefert eine Analyse, und die Analyse kommt mit echten Werten zurück. Transformation und Wiederherstellung laufen als Infrastruktur, nicht als nutzerseitige Schritte.

6. Für welche Workflows dieser Ansatz tatsächlich geeignet ist

Dieser Ansatz ist nicht universell. Er funktioniert für eine bestimmte Klasse von Workflows — und Klarheit darüber, welche das sind, ist entscheidend für die Entscheidung, ihn einzusetzen.

Geeignet sind Workflows, bei denen die KI-Aufgabe struktureller oder analytischer Natur ist und sensible Elemente vorab identifizierbar sind. Beispiele:

Vertragszusammenfassungen
Erstellung von Störungsberichten aus Betriebsprotokollen
Extraktion von Risikoklauseln aus Due-Diligence-Dokumenten
Erstellung klinischer Notizen aus strukturierten Patientendaten
Ursachenanalyse aus Netzwerk-Alarmsequenzen
Klassifikation von Schadenmeldungen aus Versicherungsunterlagen

In jedem dieser Fälle analysiert die KI Struktur und Inhalt. Die personenidentifizierenden Teile sind Mittel zum Zweck, nicht der Zweck selbst.

Nicht geeignet sind Workflows, bei denen die KI den tatsächlichen sensiblen Inhalt als Teil ihrer Aufgabe verarbeiten muss. Personalisierte Inhalte, die sich direkt an einen Kunden richten. Prüfworkflows, die gegen den tatsächlichen Identifikator abgleichen müssen. Recherchen, die die Originalzeichenketten erfordern.

Als Faustregel gilt: Lässt sich die KI-Ausgabe als "Führe diese analytische Aufgabe durch und berichte das Ergebnis" beschreiben, ist der Ansatz geeignet. Erfordert die Ausgabe "Handele bezüglich dieses konkreten Kunden, Falls oder Identifikators", ist er es nicht.

7. Was vor der Bereitstellung zu entscheiden ist

Die Einführung dieses Ansatzes ist keine Standardentscheidung. Sie bringt Architekturentscheidungen mit sich, die zu Beginn einfacher zu treffen sind als im Nachhinein.

7.1 Wo die Transformation ausgeführt wird

Die Transformationsschicht muss innerhalb der Unternehmensumgebung betrieben werden — On-Premise, in der unternehmenseigenen Cloud-VPC oder auf dedizierter Infrastruktur. Die Anforderung besteht darin, dass die Transformation erfolgt, bevor die Daten das externe Netzwerk erreichen. Die Schicht ist damit kolokal mit den Quellsystemen, nicht mit dem KI-Endpunkt.

7.2 Wer das Mapping kontrolliert

Das Mapping zwischen Token und Originalwerten ist die sensibelste Komponente der Architektur. Es ist der Schlüssel zur Re-Identifikation der Daten. Bewährte Praxis ist, dass das Mapping ausschließlich vom Unternehmen gehalten wird — in einem Speicher, auf den der externe LLM-Anbieter keinen Zugriff hat. Dies ist eine nicht verhandelbare Designeigenschaft, keine Konfigurationsoption. Erlaubt die Architektur eines Anbieters, dass das Mapping die Unternehmensumgebung verlässt, kollabiert der Schutz des Ansatzes.

7.3 Wie Sensitivität definiert wird

Generische personenbezogene Datenkategorien nach DSGVO (GDPR) — Namen, E-Mail-Adressen, Telefonnummern — sind der Ausgangspunkt, nicht das Ziel. Das Unternehmen muss definieren, was in seinem Kontext als sensibel gilt: interne Projektkennzeichen, Kundensegmentierungsmerkmale, sektorspezifische Referenzen. Die Definition muss versioniert werden, denn Sensitivität ist nicht statisch — heute sind es Finanzdaten, morgen ein M&A-Codename, übermorgen Asset-Referenzen einer regulierten Einheit. Eine statische Definition veraltet schnell.

7.4 Wie der Workflow mit der Ausgabe umgeht

Die Wiederherstellung muss innerhalb der Unternehmensumgebung erfolgen und in den jeweiligen Auslieferungskanal des Workflows integriert sein — das Ticketing-System, die Dokumentenverwaltungsplattform, die Prüfoberfläche des Analysten. Ist die Wiederherstellung ein separater manueller Schritt, wird sie von den Nutzern übergangen — und der Wert der Architektur löst sich auf.

7.5 Was geschieht, wenn sich der externe Endpunkt ändert

Externe LLMs sind keine stabile Infrastruktur. Modelle werden abgekündigt, Anbieter ändern ihre Preisgestaltung, neue Optionen entstehen. Der Ansatz funktioniert am besten, wenn die Transformationsschicht anbieterneutral ausgelegt ist — wenn der Wechsel von ChatGPT zu Claude oder zu einem neuen Anbieter eine Konfigurationsänderung ist, keine Architekturüberarbeitung.

8. Die Grenzen dieses Ansatzes — offen benannt

Der Ansatz löst ein reales Problem — aber nicht jedes Problem. Die Grenzen sind es wert, klar benannt zu werden.

Ungeeignet ist der Ansatz, wenn die eigentliche KI-Aufgabe die Originaldaten erfordert — Prüfaufgaben, Recherchen, Personalisierungsaufgaben, bei denen der tatsächliche Identifikator den Gegenstand bildet.
Er erhöht die Latenz. Erkennung, Transformation und Wiederherstellung erfordern jeweils Zeit. Für die meisten Unternehmens-Workflows ist dies nicht spürbar — der Mehraufwand sind Sekundenbruchteile in einem Workflow, der ohnehin mehrere Sekunden dauert. Für latenzkritische Anwendungen kann der Mehraufwand relevant sein.
Er erfordert kontinuierliche Investitionen in die Erkennungs- und Definitionsschicht. Sensitivität ist nicht statisch; Merkmale entwickeln sich mit dem Geschäft; die Definition muss mitentwickelt werden. Ein Team muss diese Verantwortung übernehmen und in enger Abstimmung mit der Geschäftsentwicklung stehen. Technologie einzukaufen, ohne die Definition zu pflegen, führt zur schleichenden Entwertung der Architektur.
Er ersetzt keine organisatorischen Entscheidungen darüber, welche Daten überhaupt verarbeitet werden sollten. Einige Workflows sollten unabhängig von jeder Transformation nicht an externe Modelle gesendet werden — die Daten sind zu sensibel, der Workflow zu kritisch, das Fehlerszenario zu kostspielig. Dieser Ansatz ist für Workflows gedacht, bei denen die Antwort "mit der richtigen Architektur sinnvoll einsetzbar" lautet — nicht für Workflows, bei denen die Antwort "grundsätzlich nicht" ist.
Er setzt voraus, dass das Unternehmen die Schicht in der eigenen Umgebung betreibt. Anbieter, die diesen Ansatz als externes SaaS anbieten — bei dem die Transformation auf der Anbieterinfrastruktur erfolgt — haben die Architektur in ein anderes Problem überführt. Der Kern des Ansatzes ist, dass die Transformation dort ausgeführt wird, wo die Daten bereits liegen.

9. Konsequenzen für die KI-Strategie

Für die meisten regulierten Unternehmen in der EU führt der Weg zu produktionsreifen KI-Lösungen im Jahr 2026 über eine Variante dieses Ansatzes. Die wirtschaftlichen Vorteile externer LLMs sind zu erheblich, um sie zu ignorieren. Die Anforderungen an Datenhaltung sind zu real, um sie zu umgehen. Die bestehenden Werkzeuge — Maskierung, On-Premise-Bereitstellung — lösen Teile des Problems, nicht das Ganze.

Dieser Ansatz ist keine abgeschlossene Kategorie. Es gibt Implementierungen von verschiedenen Anbietern mit unterschiedlichen Designentscheidungen zu Erkennung, Transformationsstärke, Wiederherstellungslogik und Bereitstellungstopologie. Die Auswahl hängt von unternehmenssspezifischen Fragen ab: Welche bestehenden Systeme muss die Schicht integrieren? Wie ist die Sensitivitätsdefinition beschaffen? Auf welche Bereitstellungsstrategie hat sich das Sicherheitsteam festgelegt? Wie wird der Workflow-Mix zwischen externen und On-Premise-Modellen aussehen?

Was alle Implementierungen verbindet, sind vier architektonische Kerneigenschaften:

Originaldaten verbleiben innerhalb der Unternehmensgrenze
Die KI-Leistungsfähigkeit bleibt erhalten
Die Transformation läuft auf einer Schicht unter Unternehmenskontrolle
Das Mapping, das die Wiederherstellung ermöglicht, verbleibt unter ausschließlicher Kontrolle des Unternehmens

Wenn diese vier Eigenschaften gegeben sind, beginnen Workflows, die im Pilotbetrieb feststeckten, in den Produktivbetrieb überzugehen.

Der eingangs beschriebene Widerspruch löst sich nicht vollständig auf — es wird immer Workflows geben, bei denen Anforderung und Leistungsfähigkeit nicht in Einklang zu bringen sind. Für den breiten Bereich der Unternehmens-KI-Aufgaben ist dieser Ansatz jedoch die architektonische Antwort, die es erlaubt, KI-Strategie und Datenstrategie aus dem Konflikt zu führen.

Wesentliche Erkenntnisse

Regulierte Unternehmen stehen vor einem strukturellen Widerspruch: Die leistungsfähigsten KI-Modelle sind extern; die nützlichsten Daten dürfen die Grenze nicht verlassen
Die drei gängigen Reaktionen — Risiko akzeptieren, Maskierung und Schwärzung, On-Premise-Betrieb — scheitern jeweils an vorhersehbaren Punkten
Ein anderer Ansatz verändert nicht ob, sondern was die Grenze überquert — durch strukturerhaltende Tokenisierung
Vier Phasen: Erkennung → Transformation → Externe Verarbeitung → Wiederherstellung
Geeignet für analytische Workflows mit vorab identifizierbaren sensiblen Elementen; ungeeignet für Personalisierungs- oder Verifikationsaufgaben
Vier nicht verhandelbare Designeigenschaften: Transformation im Unternehmen, ausschließliche Kontrolle des Mappings, fortlaufend gepflegte Sensitivitätsdefinition, Wiederherstellung als Infrastrukturkomponente
Grenzen: erhöhte Latenz, laufende Investitionen in die Erkennungsschicht, kein Ersatz für organisatorische Grundsatzentscheidungen
Anbieterneutral ausgelegt — ein Wechsel zwischen ChatGPT, Claude oder Gemini ist eine Konfigurationsänderung, keine Architekturüberarbeitung

Häufig gestellte Fragen

Wie unterscheidet sich dieser Ansatz von Datenmaskierung?

Maskierung optimiert für das Entfernte — Namen, IDs und Identifikatoren werden durch Schwärzungsmarkierungen ersetzt. Das funktioniert bei Dokumenten, bei denen der sensible Teil klar abgrenzbar ist, scheitert aber bei operativen Daten, weil die für die KI notwendige Struktur dabei zerstört wird. Der hier beschriebene Ansatz nutzt strukturerhaltende Tokenisierung: Sensible Elemente werden durch Platzhalter ersetzt, die Format, Typ und Beziehungen erhalten — sodass die KI ein kohärentes Dokument verarbeitet. Das Mapping auf die Originalwerte verbleibt im Unternehmen.

Funktioniert dieser Ansatz mit jedem externen LLM?

Der Ansatz ist anbieterneutral ausgelegt. Aus Sicht des externen LLM empfängt es eine normale Anfrage — es kann nicht erkennen, dass das Dokument transformiert wurde, und muss es nicht. Ein Wechsel von ChatGPT zu Claude, Gemini oder einem neuen Anbieter ist eine Konfigurationsänderung, keine Architekturüberarbeitung. Die Transformationsschicht ist die Konstante; das externe Modell ist die Variable.

Was geschieht mit dem Mapping zwischen Token und Originalwerten?

Das Mapping ist die sensibelste Komponente der Architektur — es ist der Schlüssel zur Re-Identifikation der Daten. Bewährte und gebotene Praxis ist, dass das Mapping ausschließlich vom Unternehmen in einem Speicher gehalten wird, auf den der externe LLM-Anbieter keinen Zugriff hat. Dies ist eine nicht verhandelbare Designeigenschaft. Erlaubt die Architektur eines Anbieters, dass das Mapping das Unternehmen verlässt, kollabiert der Schutz des Ansatzes.

Wo muss die Transformationsschicht betrieben werden?

Innerhalb der Unternehmensumgebung — On-Premise, in der unternehmenseigenen Cloud-VPC oder auf dedizierter Infrastruktur unter Unternehmenskontrolle. Die Anforderung ist, dass die Transformation erfolgt, bevor die Daten das externe Netzwerk erreichen. Anbieter, die diesen Ansatz als externes SaaS anbieten, haben die Architektur in ein anderes Problem überführt. Der Kerngedanke ist, dass die Transformation dort ausgeführt wird, wo die Daten bereits liegen.

Für welche Workflows ist dieser Ansatz nicht geeignet?

Ungeeignet ist der Ansatz für Workflows, bei denen die KI den tatsächlichen sensiblen Inhalt als Teil ihrer Aufgabe verarbeiten muss: personalisierte Inhalte, die sich direkt an Kunden richten; Prüfworkflows, die gegen den tatsächlichen Identifikator abgleichen müssen; Recherchen, die die Originalzeichenketten erfordern. Als Faustregel gilt: Lässt sich die KI-Ausgabe als "Führe diese analytische Aufgabe durch und berichte das Ergebnis" beschreiben, funktioniert der Ansatz. Erfordert die Ausgabe "Handele bezüglich dieses konkreten Kunden, Falls oder Identifikators", ist er ungeeignet.

Wie unterscheidet sich das von einem On-Premise-Open-Source-Modell?

On-Premise-Bereitstellung löst das Datenproblem, indem die KI-Leistungsfähigkeit durch etwas Internes ersetzt wird — die Daten verlassen das Unternehmen nicht, aber das Modell ist auf die Möglichkeiten des intern betriebenen Systems begrenzt. Das funktioniert, wenn der Workflow so überschaubar ist, dass ein kleineres Modell ausreicht. Der Transformationsschicht-Ansatz behält die führenden externen Modelle und verändert stattdessen, was die Grenze überquert. Die eigentliche Verarbeitungsleistung erbringen weiterhin die leistungsfähigsten Modelle; nur die Form der Daten ist anders.

Have a deployment question?

Bring your industry, your regulatory profile, and your data. We respond within one business day.

Request a Live Demo

Email : contact@cubig.ai

CUBIG LTD (United Kingdom)

Company Number: NI735459
Address: 21 Arthur Street, Belfast, Antrim, United Kingdom, BT1 4GA

CUBIG CORP (Republic of Korea)

Business Registration Number : 133-81-45679

E-Commerce Registration : 2023-Seoul-Seocho-2822

Address: 4F, NAVER 1784, 95, Jeongjail-ro, Bundang-gu, Seongnam-si, Gyeonggi-do, Republic of Korea

Produkt

Ressourcen

Company

Lösungen

Consent Preferences

Email : contact@cubig.ai

CUBIG LTD (United Kingdom)

Company Number: NI735459
Address: 21 Arthur Street, Belfast, Antrim, United Kingdom, BT1 4GA

CUBIG CORP (Republic of Korea)

Business Registration Number : 133-81-45679

E-Commerce Registration : 2023-Seoul-Seocho-2822

Address: 4F, NAVER 1784, 95, Jeongjail-ro, Bundang-gu, Seongnam-si, Gyeonggi-do, Republic of Korea

Produkt

Ressourcen

Company

Lösungen

Consent Preferences

Email : contact@cubig.ai

CUBIG LTD (United Kingdom)

Company Number: NI735459
Address: 21 Arthur Street, Belfast, Antrim, United Kingdom, BT1 4GA

CUBIG CORP (Republic of Korea)

Business Registration Number : 133-81-45679

E-Commerce Registration : 2023-Seoul-Seocho-2822

Address: 4F, NAVER 1784, 95, Jeongjail-ro, Bundang-gu, Seongnam-si, Gyeonggi-do, Republic of Korea

Produkt

Ressourcen

Company

Lösungen

Consent Preferences

Email : contact@cubig.ai

CUBIG LTD (United Kingdom)

Company Number: NI735459
Address: 21 Arthur Street, Belfast, Antrim, United Kingdom, BT1 4GA

CUBIG CORP (Republic of Korea)

Business Registration Number : 133-81-45679

E-Commerce Registration : 2023-Seoul-Seocho-2822

Address: 4F, NAVER 1784, 95, Jeongjail-ro, Bundang-gu, Seongnam-si, Gyeonggi-do, Republic of Korea

Produkt

Ressourcen

Company

Lösungen

Consent Preferences

Email : contact@cubig.ai

CUBIG LTD (United Kingdom)

Company Number: NI735459
Address: 21 Arthur Street, Belfast, Antrim, United Kingdom, BT1 4GA

CUBIG CORP (Republic of Korea)

Business Registration Number : 133-81-45679

E-Commerce Registration : 2023-Seoul-Seocho-2822

Address: 4F, NAVER 1784, 95, Jeongjail-ro, Bundang-gu, Seongnam-si, Gyeonggi-do, Republic of Korea

Produkt

Ressourcen

Company

Lösungen

Consent Preferences