지점 1 — 수백만 건 문서의 등급 분류 부담
실제 어떻게 막히는가
N²SF 절차의 두 번째 단계가 정보 등급 분류(C/S/O)입니다. 정책 문서에는 한 줄로 적혀 있습니다. "기관이 보유한 정보자산을 등급별로 분류한다." 그런데 막상 시작하면 첫 번째 질문이 떠오릅니다.
"우리 기관이 가진 문서가 몇 개죠?"
광역지자체급이면 수백만 건, 중앙부처 본부급이면 수천만 건이 일반적입니다. 전자결재 결재 문서, 민원 처리 내역, 정책 보고서, 회의록, 공지사항, 외부 발송 문서 — 이 모든 것이 분류 대상입니다.
이걸 하나씩 분류하면 어떻게 될까요? 한 사람이 하루에 500건씩 분류한다고 가정해도(현실적으로 어렵습니다), 100만 건을 분류하려면 한 사람이 8년 동안 분류만 해야 합니다. 분류 기준을 통일하고 검토 단계를 거치면 시간은 더 늘어납니다.
왜 그렇게 막히는가
이 막힘의 본질은 정책 절차가 아니라 물리적 규모입니다. N²SF 가이드라인은 등급 분류의 원칙은 명확히 제시하지만, "수백만 건을 어떻게 효율적으로 분류할 것인가"의 실행 방법은 다루지 않습니다.
여기에 부서 간 책임 분담 문제가 더해집니다. 기관 전체 문서를 누가 분류할 것인가? 정보화담당관실이 다 할 수는 없습니다. 그렇다고 각 부서에 맡기면 분류 기준이 부서마다 달라집니다. 이 합의 자체가 또 막힘 요소가 됩니다.
풀어내는 방향
개별 분류 작업을 처음부터 끝까지 사람이 하지 않는 것이 핵심입니다. 가장 효과적인 풀이 두 가지를 정리합니다.
방향 1 — 전자결재 시스템 메타데이터 연동 (가장 일반적)
전자결재 시스템에는 결재 시점에 이미 다음과 같은 메타데이터(flag)가 등록되어 있습니다.
- 작성 주체: 작성 부서·작성자
- 문서 제목
- 외부·타부서 공개 여부
- 결재 라인·접근 권한
- 문서 종류·분류 코드
이 중 특히 "외부·타부서 공개 여부" flag가 S/O 분류에 거의 직접 매핑됩니다. 외부 공개 가능으로 표시된 문서는 O 등급, 내부 한정으로 표시된 문서는 S 등급으로 자동 분류 가능합니다. 작성 부서·문서 종류 같은 다른 flag와 조합하면 정확도가 더 높아집니다.
AI 솔루션이 전자결재 시스템의 표준 API를 호출해서 이 메타데이터를 조회하도록 설계하면, 별도의 대규모 분류 작업 없이 등급을 자동으로 도출할 수 있습니다. 새 분류 체계를 처음부터 만드는 것이 아니라, 이미 운영되고 있는 분류 체계를 활용하는 접근입니다.
방향 2 — 자체 분류기 sLLM 구축 (섬세한 분류가 필요한 기관)
기관 자체의 분류 정책이 복잡하거나 메타데이터만으로 식별이 어려운 비정형 문서가 많은 경우, 별도의 분류 전용 sLLM을 구축하는 것이 효율적 선택지가 됩니다. 본문이 분류 기준을 학습하면, 메타데이터가 없거나 모호한 문서도 자동 분류할 수 있습니다.
이때 분류기용 sLLM은 업무용 sLLM과 본질적으로 다른 카테고리로 봐야 합니다.
- 업무용 sLLM: GPT·Claude 등 상용 LLM과 성능 경쟁을 해야 함. 모델 발전 속도를 따라잡기 위한 지속적 고도화 필요 → 비용·인력 부담 누적
- 분류기용 sLLM: 기관 문서의 등급 분류라는 좁은 작업만 잘하면 됨. 한 번 학습된 모델을 장기간 안정적으로 운영 가능 → 지속적 고도화 부담 거의 없음
이런 차이 때문에, 일반적으로 sLLM 자체구축의 약점으로 지적되는 부분(상용 모델과의 격차, 모델 교체 부담)이 분류기 용도에서는 거의 작동하지 않습니다. 분류기용 sLLM은 한 번 잘 구축하면 장기간 안정적으로 운영 가능하고, 그 안정성이 오히려 강점이 됩니다.
두 방향은 상호 배타적이지 않습니다. 1차로 전자결재 메타데이터 연동으로 대부분의 문서를 자동 분류하고, 메타데이터로 식별이 어려운 비정형 문서나 특수 케이스만 분류기 sLLM이 처리하는 하이브리드 구조가 가장 실용적인 접근입니다.
위 두 방향에 더해, 다음 보조 접근도 함께 고려할 수 있습니다.
- 대표 샘플 기반 분류: 모든 문서를 분류하지 않고, 부서·업무·문서종류별 대표 샘플을 분류한 뒤 그 규칙을 자동 적용
- 단계적 분류: 우선 활용 시나리오에 직접 사용되는 정보만 분류, 나머지는 운영하면서 점진 확장
지점 2 — 활용 시나리오와 모델 2 O 등급 한정의 충돌
실제 어떻게 막히는가
모델 2는 외부 상용 LLM 활용 시 정보를 O 등급으로 한정합니다. 정책적으로 명확한 선이지만, 막상 활용 시나리오 정의 단계에서 현장 부서와 워크숍을 해보면 다른 그림이 나옵니다.
직원들이 정작 활용하고 싶은 업무는 다음과 같은 것들입니다.
- 정책 검토 보고서 작성 보조 — 내부 검토 의견 참조 필요
- 법령 해석 자문 — 기관 자체 해석·내부 자문 자료 활용 필요
- 회의록 요약 — 내부 회의 내용 입력 필요
- 민원 응답 초안 작성 — 과거 민원 처리 사례 참조 필요
이 업무들에서 활용하고 싶은 정보의 핵심은 모두 S 등급입니다. 즉 모델 2 O 등급 한정 도입을 진행하면, 직원들 입장에서는 "정작 쓰고 싶은 데서는 못 쓰는" 상태가 됩니다.
왜 그렇게 막히는가
이 막힘은 정책의 결함이 아니라, 정책의 보수적 선과 현장 활용 욕구 사이의 간극입니다. 모델 2는 안전을 위한 최소 기준선을 제시하는 것이고, 현장 활용 욕구는 그 선 너머에 있는 것이 자연스럽습니다.
문제는 의사결정자들이 이 간극을 사전에 인식하지 못한 채 도입을 시작하는 경우입니다. 정책 부합성에 집중해서 시나리오 A(O 등급만)로 도입했는데, 운영 단계에서 직원 만족도가 낮고 활용도가 안 올라서 도입 효과를 입증하기 어려워집니다.
풀어내는 방향
이 간극을 인정하고 시작하는 것이 첫 단계입니다. 활용 시나리오 정의 단계에서 다음을 명확히 합니다.
- O 등급으로만 가능한 시나리오는 무엇인가
- S 등급 활용이 필요한 시나리오는 무엇인가
- 두 영역이 직원 활용 욕구에서 차지하는 비중은 각각 얼마인가
이 분석 결과에 따라 도입 방식이 갈립니다.
- O 등급 비중이 충분하면: 모델 2 표준 절차(시나리오 A)로 진행. 다만 활용 가능 시나리오를 사전에 명시해서 직원 기대 관리
- S 등급 활용이 필수면: 차등정보보호 기반 보호 레이어 도입(시나리오 B). 자체 위험평가 절차가 추가되지만 활용 폭이 본질적으로 달라짐
- 단계적 접근: O 등급으로 시작 → 운영 6~12개월 후 사용 패턴 분석 → S 등급 확장 결정
지점 3 — 비교 가능한 후보 솔루션이 너무 적음
실제 어떻게 막히는가
RFP를 띄우는 단계에서 자주 발생하는 막힘입니다. 평가 기준은 만들었는데 평가 대상이 부족합니다.
특히 시나리오 B(S 등급 활용)로 가려는 경우, 검증된 보호 레이어 솔루션의 시장이 매우 좁습니다. 차등정보보호(Differential Privacy) 기반의 보호 기법을 보유하고, 국내 인증·검증을 받은 솔루션은 손에 꼽을 정도입니다.
반면 단순 마스킹·키워드 차단 기반의 AI DLP 솔루션은 상대적으로 많습니다. 그래서 RFP를 띄우면 마스킹 솔루션이 다수 제안되고, 보호 레이어 솔루션은 1~2개만 들어오는 상황이 됩니다. 평가위원회 입장에서는 "비교가 안 된다"는 문제에 부딪힙니다.
왜 그렇게 막히는가
이 막힘의 본질은 시장 성숙도입니다. 차등정보보호는 학술적으로는 2006년 제안된 개념이지만, 국내 공공시장 적용 가능 수준의 솔루션이 본격 등장한 것은 최근입니다. 기술 자체의 진입 장벽이 높고(수학적 보안 보증·재식별 공격 방어 검증 등), 공공시장 진입을 위한 인증 트랙도 길어서 솔루션 공급이 한정되어 있습니다.
풀어내는 방향
후보가 적다고 마스킹 솔루션으로 타협하는 것은 위험합니다. 단순 마스킹 기반 솔루션은 운영 단계에서 보안 우려가 재발생하거나, 감사 단계에서 N²SF 정합성 논증이 도전받을 수 있습니다.
대안은 다음과 같습니다.
- 평가 기준의 명시적 강화: RFP에서 "보호 기법의 종류(마스킹/차등정보보호 등)·학술적 근거·재식별 공격 검증 자료"를 명시적 평가 항목으로 요구. 이렇게 하면 마스킹 솔루션은 자연스럽게 평가 단계에서 차별화됩니다
- 후보가 적어도 PoC 수행: 1~2개 후보만 있더라도 PoC를 통해 실제 보호 강도·운영 적합성을 검증. 비교 평가는 어려워도 단독 적합성 평가는 가능
- 단계적 도입으로 시간 확보: 시나리오 A로 먼저 도입 후 시나리오 B 솔루션 시장 성숙을 기다리는 접근. 1~2년 후 시장이 더 성숙해 있을 가능성
지점 4 — 예산 산정과 도입 시점의 불일치
실제 어떻게 막히는가
공공기관 예산은 통상 1년 전에 편성됩니다. 즉 2026년 사업 예산은 2025년 7~8월에 잡힙니다. 그런데 AI 시장의 변화 주기는 6개월 미만입니다. 새 모델이 나오고, 새 보안 가이드라인이 추가되고, 시장 가격이 변동됩니다.
그 결과 사업 시작 시점에 다음 중 하나가 발생합니다.
- 예산 부족: 1년 전 견적 기반 예산이 현재 시장 가격에 못 미침
- 시나리오 변경 불가: 1년 전에 시나리오 A로 예산 잡았는데 시나리오 B가 필요한 상황 발견. 그러나 예산 항목 변경 불가
- 적절한 솔루션 부재: 1년 전 시장에 없던 새 솔루션이 등장했지만 평가 대상에 못 넣음
왜 그렇게 막히는가
공공 예산 체계의 본질적 특성입니다. 안정적 예산 운용을 위해 1년 전 편성은 필수이고, 그 사이 시장 변화는 막을 수 없습니다. 이 간극은 AI뿐 아니라 모든 빠르게 변하는 IT 영역에 공통입니다.
풀어내는 방향
AI 도입을 한 번에 큰 사업으로 하지 않고, 사전 검토와 본 도입을 분리하는 접근이 효과적입니다.
- 사전 검토 사업 + 본 사업 분리: 1차 연도에 소액 사전 검토 사업(시나리오 정의, 등급 분류, 모델링)을 수행. 결과를 기반으로 2차 연도에 본 도입 사업 정확하게 산정
- 단계별 분할 발주: 사업 자체를 1차(기반 구축)·2차(확장 운영)로 나누어 시장 변화 반영 여지 확보
- 예산 편성 시점 사전 검토: 7~8월 예산 편성 이전에 시나리오 정의와 시장 조사를 완료. 정확한 예산 산정 가능
- 유연한 예산 항목 설계: 솔루션비·인프라비·인건비를 별도 항목으로 잡아 시장 변화에 대응 가능한 구조
지점 5 — 도입 후 "쓸 만한 업무가 없음"
실제 어떻게 막히는가
가장 무거운 막힘은 마지막입니다. 솔루션 도입까지는 성공했는데, 운영 단계에서 활용도가 기대 대비 현저히 낮은 경우입니다. 이 패턴은 보통 두 가지 형태로 나타납니다.
형태 1 — DLP·차단 솔루션의 과차단
안전을 위한 차단 솔루션을 도입했는데, 정상 업무 요청도 차단되는 경우가 대다수입니다. 직원이 보고서 작성에 관련 자료를 요청해도 키워드 매칭으로 차단되고, 민원 응답 초안을 요청해도 차단됩니다. 차단 정책을 완화하면 보안 우려가 커지고, 강화하면 사용성이 무너지는 딜레마에 빠집니다.
결과: 직원들 사이에 "그거 켜놓으면 일이 안 됨"이 정설이 되어 우회하거나 그냥 사용하지 않습니다. 결국 도입 의미가 사라지고, 다음 연도 예산 평가에서 "AI 도입 효과 불분명"으로 평가받습니다.
형태 2 — O 등급 한정의 빈약함
시나리오 A(O 등급만 활용)로 안전하게 도입했는데, 정작 활용 가능 정보가 너무 좁아서 직원들이 쓸 일이 없는 경우입니다.
예를 들어 법무 부서가 가장 활용하고 싶어 하는 정보는 판례입니다. 공개 판례는 O 등급이지만, 기관 자체의 해석·내부 검토 의견은 S 등급입니다. AI에게 판례만 보여주고 "이 사안에 대한 의견을 달라"고 하면, 일반적인 응답만 돌아옵니다. 정작 필요한 건 "우리 기관의 과거 비슷한 사안 처리 사례를 참조한 응답"인데, 그건 S 등급 정보가 들어가야 가능합니다.
비슷한 패턴이 거의 모든 부서에서 발생합니다. 정책 부서는 내부 정책 검토 의견을 참조해야 하고, 민원 부서는 과거 민원 처리 사례를 참조해야 하고, 인사 부서는 내부 인사 자료를 참조해야 합니다. 외부 보도자료나 일반 공지사항만으로 처리할 수 있는 업무는 정작 AI 도움이 없어도 가능한 영역인 경우가 많습니다.
왜 그렇게 막히는가
두 형태 모두 공통점은 "안전성을 위해 활용성을 희생"한 구조입니다. 보안 측면에서는 흠잡을 데 없지만, 도입의 본래 목적인 업무 효율화는 달성되지 않습니다. 그리고 이 한계는 도입 단계에서 보이지 않고, 운영 단계에서야 본격적으로 드러납니다.
풀어내는 방향
이 막힘을 피하려면 도입 단계에서 다음을 점검해야 합니다.
- 활용 가능 시나리오 사전 검증: 도입 전에 "정말 직원들이 쓸 시나리오가 있는가"를 실제 부서별 워크숍으로 확인. 추상적 "업무 효율화"가 아니라 구체적 활용 사례를 5~10개 식별
- DLP 정책의 정밀화: 단순 키워드 차단이 아니라 등급·맥락 기반의 정밀한 통제. 정상 업무는 통과시키고 실제 위험만 차단하는 설계
- 보호 레이어 도입 검토: 활용 가능 시나리오 중 S 등급 활용이 필수인 영역이 많으면, 차등정보보호 기반 보호 레이어로 시나리오 B 도입. 활용 폭이 본질적으로 달라짐
- 단계적 운영 점검: 도입 후 3개월·6개월 시점에 활용도 정량 점검. 활용도가 낮으면 즉시 진단 → 추가 조치
다섯 가지 막힘을 관통하는 한 가지 진단
위 다섯 가지 막힘 지점은 표면적으로는 서로 다른 영역에서 발생하지만, 한 가지 공통점이 있습니다. 정책 문서가 제시한 절차를 그대로 따랐을 뿐인데도 막힌다는 점입니다.
이게 의미하는 바는 분명합니다. N²SF와 모델 2가 제시한 정책 절차는 안전한 도입의 최소 기준선이지, 도입 성공을 보장하는 종합 가이드가 아닙니다. 정책 절차를 따르되, 그 절차가 우리 기관의 물리적 규모·활용 현실·시장 상황과 만났을 때 어떻게 변형되어야 하는지를 각 기관이 스스로 설계해야 합니다.
그 설계의 출발점은 막힘의 실제 모습을 정확히 진단하는 것입니다. "보안과 활용성의 균형" 같은 추상적 진단이 아니라, "수백만 건 문서 분류는 사람이 다 못 한다", "직원이 쓰고 싶은 건 대부분 S 등급이다", "검증된 솔루션 후보가 1~2개뿐이다" 같은 구체적 진단입니다. 진단이 정확하면 풀이는 보입니다.
- 지점 1 (등급 분류 부담) — 전자결재 메타데이터 연동, 분류기 sLLM, 또는 두 방식의 하이브리드
- 지점 2 (시나리오 충돌) — O/S 활용 비중 사전 분석, 보호 레이어 도입 또는 단계적 접근
- 지점 3 (솔루션 부족) — 평가 기준 강화로 차별화, 단독 적합성 평가, 단계적 도입
- 지점 4 (예산 불일치) — 사전 검토 사업 분리, 단계별 분할 발주, 유연한 예산 항목 설계
- 지점 5 (활용 안 됨) — 시나리오 사전 검증, DLP 정밀화, 보호 레이어로 활용 폭 확장
자주 묻는 질문
이 5가지 외에 다른 막힘은 없나요?
있습니다. 다만 위 5가지가 가장 자주, 그리고 가장 크게 막히는 지점입니다. 다른 막힘으로는 사용자 교육 미흡, 거버넌스 부재, 외부 자문 일정 확보 어려움 등이 있으며, 모두 위 5가지의 변형이거나 결과로 볼 수 있습니다.
5가지 모두를 한 사업에서 풀어야 하나요?
모두 동시에 풀려고 하면 사업이 한없이 길어집니다. 도입 단계별로 우선 풀어야 할 지점이 다르므로, 단계별로 가장 큰 막힘을 식별해서 그 지점을 우선 풀어내는 접근이 효율적입니다. 예를 들어 N²SF 1~2단계에서는 지점 1·2가, 솔루션 평가 단계에서는 지점 3이 우선입니다.
전자결재 API 연동은 어떻게 진행하나요?
대부분의 공공기관 전자결재 시스템은 표준 API를 제공합니다. 문서 메타데이터(보안등급, 문서종류, 부서, 결재 라인)를 조회하는 API를 사용해서 AI 솔루션이 등급을 자동 식별하도록 연동합니다. 구체적 연동 방식은 기관의 전자결재 시스템(온나라·자체 시스템 등)에 따라 달라지며, 솔루션 벤더와 함께 설계하는 것이 일반적입니다.
단계적 도입(시나리오 A → B)이 정말 가능한가요?
가능합니다. 시나리오 A로 시작해서 6~12개월 운영하면서 활용 패턴을 분석하고, 그 결과를 바탕으로 시나리오 B 확장 여부를 결정합니다. 다만 시나리오 B로 확장할 때 보호 레이어 솔루션 도입이 추가되므로 별도 예산 확보가 필요합니다. 처음부터 두 단계 모두를 염두에 두고 사업을 설계하면 부드럽게 확장 가능합니다.
도입 후 활용도가 낮으면 어떻게 진단하나요?
도입 후 3개월·6개월 시점에 다음을 측정합니다. (1) 부서별·업무별 사용 빈도, (2) 차단된 요청 비율과 차단 사유, (3) 사용자 만족도 조사. 차단 비율이 비정상적으로 높으면 정책 정밀화가 필요한 신호이고, 특정 부서 사용 빈도가 낮으면 활용 시나리오 재정의가 필요한 신호입니다. 정량 데이터에 기반한 진단이 추측보다 훨씬 효과적입니다.
참고 자료
- 국가정보원, 「국가 망 보안체계(N²SF) 보안 가이드라인」, 2024
- 국가정보원, 국가보안기술연구소(NSR), 「국가 망 보안체계 보안 가이드라인 — 정보서비스 모델 해설서: 모델 2. 업무환경에서 생성형 AI 활용」, 2025.9
- 본 글의 막힘 패턴은 큐빅의 공공기관 도입 자문 사례에서 관찰된 패턴을 익명화·일반화하여 정리한 것입니다.