Warum zwei Ausführungspfade notwendig sind
Unternehmen verfügen selten über ein einheitliches regulatorisches Profil. Ein Telekommunikationsanbieter kann NOC-Analysen über Pfad A und sicherheitskritische Incident-Workflows über Pfad B abwickeln. Ein Krankenhaus kann Pfad A für Routinedokumentation und Pfad B für die klinische Entscheidungsunterstützung nutzen. Ein Rüstungsunternehmen kann ausschließlich Pfad B einsetzen. Ein einziger Ausführungspfad erzwingt einen einzigen regulatorischen Mindeststandard. Zwei Pfade ermöglichen es der Governance, den Pfad dem Workflow anzupassen.
Pfad A — externes zugelassenes LLM, ausschließlich mit Kapseldaten
Die Kapsel (strukturerhaltend, Differential-Privacy-geschützt) wird an einen zugelassenen externen LLM-Endpunkt übertragen — ChatGPT, Claude, Gemini, Perplexity oder eine beliebige LLM API. Operative Rohdaten verlassen die Unternehmensumgebung nicht. Nur die Kapsel wird übertragen. Das LLM verarbeitet die Kapsel und liefert eine tokenisierte Antwort zurück. Der State Vault stellt die Antwort innerhalb der Unternehmensumgebung wieder her.
- Stärke: Zugang zu leistungsfähigen Frontier-Modellen
- Einschränkung: Erfordert einen zugelassenen externen LLM-Endpunkt und richtlinienkonforme Freigabe
Pfad B — lokales On-Premise-Leichtgewichtmodell
Ein kleines, privates Leichtgewichtmodell läuft vollständig innerhalb der Unternehmensumgebung. Die Kapsel wird lokal verarbeitet. Keine externe Datenübertragung. Einsatz bei Air-Gapped-Netzwerken, klassifizierten Betriebsumgebungen, OT-Umgebungen und streng regulierten Bereichen, in denen jeder externe Endpunkt ausgeschlossen ist.
- Stärke: Keine externe Datenübertragung, vollständige Datenresidenz
- Einschränkung: Modellleistung ist durch den lokalen Modell-Footprint begrenzt
Pfadauswahl: ein Entscheidungsrahmen
| Faktor | Pfad A | Pfad B |
|---|---|---|
| Externe Übertragung zulässig | Ja (nur Kapsel) | Nein |
| Air-Gapped-Netzwerk | Nicht anwendbar | Erforderlich |
| Frontier-Modell-Leistung | Ja | Durch lokales Modell begrenzt |
| Latenzprofil | Variabel (netzwerkabhängig) | Lokal, vorhersehbar |
| Compliance-Posture | „Keine Offenlegung von Rohdaten" | „Keine externe Datenübertragung" |
Deployment-Topologien
On-Premise
Capsule Runtime und lokales On-Premise-Leichtgewichtmodell werden innerhalb des unternehmenseigenen Rechenzentrums bereitgestellt. Pfad B ist der Standard. Pfad A ist nur verfügbar, wenn ein zugelassener externer Endpunkt durch Richtlinie freigegeben wurde.
Air-Gapped
Capsule Runtime und lokales On-Premise-Leichtgewichtmodell werden in einem vollständig isolierten Netzwerk betrieben. Pfad A ist konstruktionsbedingt nicht verfügbar. Pfad B übernimmt alle Workflows. Typisch für klassifizierte Operationen, Verteidigung und streng regulierte OT-Umgebungen.
Hybrid
Capsule Runtime On-Premise; beide Pfade aktiv. Richtlinien steuern die Zuordnung einzelner Workflows. Typisch für Telekommunikation und Finanzwesen, wo einige Workflows externe Endpunkte tolerieren und andere lokale Ausführung erfordern.
In-Region (Datensouveränität)
Capsule Runtime und Leichtgewichtmodell werden in einer bestimmten Region bereitgestellt (z. B. EU für DSGVO (GDPR)-pflichtige Workloads). Pfad A kann ebenfalls auf in-regionsspezifische externe Endpunkte beschränkt werden. Typisch für multinationale Unternehmen mit regionalen Datenhaltungspflichten.
Cloud (AWS Marketplace)
Capsule Runtime wird über den AWS Marketplace bereitgestellt. Das Cloud-Konto des Kunden hostet sowohl die Runtime als auch das lokale Leichtgewichtmodell. Pfad A optional, abhängig von der Richtlinie.
Embedded Integration
Capsule SDK wird in eine bestehende Anwendung eingebettet (NOC-Konsole, Ticket-System, Krankenhausportal, Missionssystem). Beide Pfade werden unterstützt; die eingebettete Anwendung wählt den Pfad je Workflow.
Slack App
Capsule-Plug-in für Slack-Workflows. Pfad A typisch für allgemeine Teams; Pfad B für regulierte Teams, die Slack als UI-Schicht über einer On-Premise-Runtime nutzen.
Technischer Ablauf innerhalb von Pfad B
- Der Connector Lane leitet operative Daten an die Capsule Runtime weiter (REST, Webhook, Log Tap, SDK).
- Strukturerhaltende Kapsulierung — Operative Kennungen werden tokenisiert, Sequenz und Struktur bleiben erhalten.
- Differential-Privacy-basierter Schutz begrenzt das Inferenzrisiko auf der Kapsel.
- Die Kapsel wird an das lokale Leichtgewichtmodell im selben Netzwerk übermittelt.
- Das Modell erzeugt eine tokenisierte Ausgabe.
- Der State Vault stellt die originalen operativen Kennungen in der Ausgabe wieder her.
- Das Ergebnis wird in den ursprünglichen Workflow zurückgeführt (Ticket, Runbook, EHR, Missionszusammenfassung).
- Governance-Protokollierung — Pfad, angewandte Richtlinie und Prüfpfad werden aufgezeichnet.
Kein Schritt in Pfad B verlässt die Unternehmensgrenze.
Die Zero Exposure-Aussage — korrekt abgegrenzt
"Zero Exposure" ist eine Aussage, die eines definierten Geltungsbereichs bedarf, um belastbar zu sein. Die von LLM Capsule verwendeten abgegrenzten Formulierungen:
- Pfad A: „Keine Offenlegung operativer Rohdaten gegenüber externen LLMs."
- Pfad B: „Keine externe Datenübertragung beim On-Premise-/lokalen Ausführungspfad."
Die Verwendung von „Zero Exposure" als übergeordnetem Slogan ohne Geltungsbereich ist zu vermeiden. Die technische Garantie ist pfadspezifisch und richtlinienabhängig.
Bewertungskriterien für Einkäufer
- Pfadabdeckung. Werden beide Pfade unterstützt oder nur einer?
- Granularität der Pfadzuweisung. Können verschiedene Workflows unter derselben Governance unterschiedliche Pfade nutzen?
- Lokaler Modell-Footprint. Welche Hardware wird für das On-Premise-Leichtgewichtmodell benötigt?
- Air-Gapped-Unterstützung. Ist die Runtime ohne externe Konnektivität vollständig betriebsfähig?
- State Vault lokal. Bleibt der State Vault auch bei Pfad A lokal?
- Pfad-Audit. Wird der angewandte Pfad je Anfrage, je Workflow und je Richtlinie protokolliert?
- Zwei Ausführungspfade in einer KI-Datenschicht: externes zugelassenes LLM mit Kapsel (Pfad A) oder lokales On-Premise-Leichtgewichtmodell (Pfad B).
- Pfad B bewältigt Air-Gapped-, klassifizierte, OT- und streng regulierte Betriebsumgebungen ohne externe Datenübertragung.
- Die Pfadauswahl erfolgt richtliniengesteuert je Workflow; die Governance protokolliert den angewandten Pfad.
- Sechs Deployment-Topologien: On-Premise, Air-Gapped, Hybrid, In-Region, Cloud, Embedded Integration, Slack App.
- Die Zero Exposure-Aussage ist pfadgebunden: „Keine Offenlegung von Rohdaten gegenüber externen LLMs" (Pfad A) oder „Keine externe Datenübertragung" (Pfad B).