정의
문서 구조 보존 캡슐화는 데이터 레이어에서 운영 데이터를 AI가 바로 사용할 수 있는 컨텍스트로 변환하는 단계입니다. 운영 식별자(장치 ID, 사이트 ID, 자산 참조, 고객 세그먼트)를 토큰화하면서, LLM이 추론에 필요한 관계형 구조 — 테이블 레이아웃, 로그 순서, 문서 계층, 구성 트리, 토폴로지 그래프 — 를 그대로 보존합니다.
구조 보존이 중요한 이유
알람 시퀀스를 토대로 RCA를 작성하도록 요청받은 LLM은 시퀀스가 파괴되면 추론할 수 없습니다. 두 구성 트리를 비교하도록 요청받은 LLM은 트리 관계가 평탄화되면 비교할 수 없습니다. 구조 보존이야말로 캡슐을 모델에게 단순히 안전한 것이 아니라 유용한 것으로 만드는 핵심입니다.
토큰화 대상
- 운영 식별자: DEVICE_ID, SITE_ID, CIRCUIT_ID, ASSET_ID, MISSION_REF
- 고객 참조 및 세그먼트
- 복합 식별자가 포함된 자유 텍스트 필드 (NER 마스킹)
- 민감 속성 값 (DP 예산 범위 내)
보존 대상
- 이벤트의 시간 순서
- 인시던트 시퀀스 내 인과 관계
- 문서 구조 (섹션·목록·테이블)
- 구성 트리 (부모-자식 관계, 의존성)
- 토폴로지 그래프 (노드·엣지·경로)
함께 사용되는 기능
- 차등 프라이버시 — 캡슐의 추론 위험을 수치로 제한합니다
- 복원용 상태 저장소 — 기업 내부에서 토큰을 원본 값으로 복원합니다
- 두 가지 실행 경로 — 워크플로우 정책에 따라 Path A 또는 Path B를 선택합니다
참조 문장
문서 구조 보존 캡슐화는 캡슐을 유용하게 만듭니다. 차등 프라이버시 기반 보호는 캡슐을 방어 가능하게 만듭니다. 복원용 상태 저장소는 캡슐을 복원 가능하게 만듭니다. 세 가지가 함께 데이터 레이어를 구성합니다.