구조 보존 처리
정확한 AI 처리를 위해 문서 레이아웃, 엔터티 관계, 의미적 맥락을 유지하면서 민감한 요소를 대체하는 것 — …의 핵심 기능인 LLM Capsule.
설명
평면 마스킹은 모든 민감한 값을 독립된 토큰으로 취급하여 각 항목을 일반적인 자리표시자로 대체합니다. 이로 인해 엔터티 간 관계가 무너지고, 테이블 스키마가 깨지며, AI 모델이 이해에 사용하는 구조적 정보가 사라집니다.
구조를 보존하는 처리는 이러한 관계를 유지합니다. 동일한 개체가 여러 위치에 나타나면 모든 출현은 동일한 대체 항목으로 매핑됩니다. 표의 열 머리글과 행 식별자는 의미적으로 일관되게 유지됩니다. 문서 섹션 간의 상호 참조는 논리적 연결을 유지합니다.
예시
계약서에는 30페이지 전반에 걸쳐 "Acme Corp"가 47번 언급됩니다 — 서문에서는 당사자로, 실행 블록에서는 서명인으로, 그리고 12개의 의무 조항에서는 참조로 등장합니다. 구조를 보존하는 처리는 이 47개 모든 항목을 다음과 같은 내용으로 대체합니다 ENTITY_A, maintaining the ability for AI to track Acme Corp's obligations throughout the document.