01
LLM Capsule은 사용자가 개인정보 및 민감정보 노출 걱정 없이
ChatGPT와 같은 Public LLM을 사용할 수 있게 해주는 보안 솔루션입니다.
LLM Capsule은 사용자가 개인정보 및 민감정보 노출 걱정 없이
ChatGPT와 같은 Public LLM을 사용할 수 있게 해주는 보안 솔루션입니다.
LLM Capsule은 텍스트에 포함된 개인 및 민감정보를 자동으로 탐지하고
이를 안전하게 캡슐화하여 보안 위협을 원천적으로 차단합니다.
LLM Capsule을 통해 Private LLM의 안정성과 Public LLM의 우수한 성능 모두를
누구나 합리적인 비용으로 이용할 수 있습니다.
LLM Capsule은 사용자가 문서를 안전하게 처리할 수 있도록 설계되어 있으며,
안전하게 변환된 문서를 기반으로 즉시 LLM에 요청 및 질의하여 응답 받을 수 있도록 구성되어 있습니다.
행안부 '개인정보 비식별 조치 가이드라인' 준수
개인정보 보안 100%
캡슐화 기술 + Prompt EngineeringBenchmark Dataset 정답률 98%
01 Original Document
(민감정보가 포함된 원문)
이름: 홍길동 / 나이: 29세 (입사연도: 2023년 3월 1일)
전공: 컴퓨터공학 / 부서: IT
이메일: hong@cubig.ai
이름: 김철수 / 나이: 38세 (입사연도: 2022년 9월 22일)
전공: 경영학 / 부서: 기획
이메일: cskim@cubig.ai
이름: 김영희 / 나이: 27세 (입사연도: 2024년 1월 2일)
전공: 수학과 / 부서: IT
이메일: younghee1234@cubig.ai
...
02 Safety Transformed
(민감정보 캡슐화)
03 Prompt 입력
(LLM Capsule + Public LLM)
04 LLM Result
(민감정보가 보호된 결과)
05 Restored Result
(민감정보가 포함된 결과)
1종 오류 : 정확도 98.10%* 6가지 종류의 개인정보에 대한 개인정보 인식 기술 검증
2종 오류 : 정확도 99.14%
※ 정형화 된 개인정보 보호 : 정확도 100%
오류 | 설명(Test) |
---|---|
1종 오류 |
캡슐화가 되어야 하는데, 되지 않은 경우 (민감정보 포함 문장 105개로 테스트) |
2종 오류 |
개인정보와 같은 민감정보가 아닌데, 캡슐화가 된 경우 (민감정보 불포함 문장 1,402개로 테스트) |
LLM Capsule & Public LLM : 유사도 약 98%* LLM에 원본 데이터가 아닌 캡슐화 데이터를 전송하여 질의 또는 요청
※ Privacy-Utility Trade-off 개선
Test | 실험 Setting |
---|---|
ChatGPT | ChatGPT로 원문 전송시, 응답 저장 |
LLM Capsule | LLM Capsule로 캡슐화(Anonymization 방식)를 진행한 문장을 ChatGPT 3.5에 전송하였을 때 응답 저장 |
응답 비교 | ChatGPT와 LLM Capsule의 응답 유사성 비교 |
Minumum 사양에서도 안정적인 작동
사용중인 기존의 LLM 그대로 활용 가능
Private LLM 대비 1/300 가격으로 제공
기업의 민감한 정보를 캡슐화하여 민감정보 보호
기업 내부의 인트라넷 활용 가능