FOCUS

개인정보 보호 문제를 해결할
AI 데이터 익명화 기술

김태훈 | 딥핑소스 대표

영상 데이터를 이용한 AI 기술 발전의 필요성과 해결과제

최근 AI의 빠른 발전으로 매 순간 대량의 데이터가 생산되면서 정보 분석에 사용되고 있다. AI가 학습하거나 분석하는 데이터에는 사람 얼굴이나 전화번호 등의 개인정보가 포함될 수 있다. 본고에서는 AI 용 데이터의 개인정보를 제거하면서도 데이터의 AI 활용도를 유지하기 위한 익명화 기술을 소개한다. 특히 AI의 다양한 분야들 중 특히 개인정보 문제가 자주 발생하는 영상 처리 분야를 주로 다룬다. 소개하는 AI 용 익명화 기술은 CCTV 등 카메라에 적용되어 쇼핑몰, 마트, 물류, 전시장 등의 공간을 방문자의 개인 정보나 인권 침해 없이 안전하게 분석하고 방문자에게 편의를 제공하고 있다.

카메라는 넓은 공간 내의 상황을 즉시 포착하고 육안으로 쉽게 확인할 수 있는 장점이 있어 널리 사용되어 왔으며, 이를 더 효율적으로 하기 위해 AI 기술이 빠르게 적용되어 왔다. 공간에 설치된 CCTV나 액션캠, 드론, 실내 주행 로봇 등을 통해서 특정 공간 내 방문자의 공간 이용 패턴, 근로자의 수 및 보호장구 착용 여부, 공간 이용자의 안전 상황뿐만 아니라 건물의 상태, 장비의 작동 등을 동시에 관찰하여 실시간에 보안 및 안전 관리자와 공간 운영자에게 다양한 정보를 제공할 수 있다.

또한 저장된 영상은 다양한 상황을 기록하는 증거자료로 활용되어 사건 사고 발생 시 사고의 경위를 분석하는 사후 처리에도 유용하다. 이와 같은 편리함으로 기업에서는 백화점이나 몰 등의 상업 시설뿐만 아니라 병원, 건설 현장 및 공장 등에 카메라 설치를 추진하려는 수요가 높다. 공간 내 방문자 및 근로자에게 편의를 제공하고 안전 관리 강화 및 운영 최적화를 목적으로 운영하고 있다.

해결과제1: 인권 침해 우려와 개인정보 보호 문제
그러나 카메라에 AI를 적용하는 데에는 개인정보 침해 우려와 이로 인한 데이터 부족이라는 어려움이 있다. 대다수의 방문자 및 근로자들은 CCTV 등 영상 촬영 장비의 설치 및 확대가 개인정보 및 인권 침해 가능성이 있다고 판단하여 거부감을 갖고 있다.

또한 카메라 등의 영상 정보 처리기기로부터 수집되는 데이터를 활용하는 데에 있어 개인정보 보호법이 엄격히 적용되어, 영상 데이터에 개인정보가 존재하는 한 데이터의 적법한 활용을 위해 주의가 필요하다. 이는 국내뿐만 아니라 GDPR로 개인 정보와 사생활이 보호받는 유럽이나 CCPA와 NY Privacy Act 등이 적용되는 미국 등 해외 대부분의 국가에서 동일하다. 따라서 카메라의 높은 활용도를 유지하면서 개인정보 및 인권 침해 염려가 없도록 데이터를 수집하고 분석하는 방안이 필요하다.

해결과제2: 데이터 부족으로 인한 AI 개발의 어려움
AI를 실제 현장에 적용하고 활용하기 위해서는 AI 기술의 개발이 필요하며, 이 과정에서 방대한 양의 학습 데이터가 사용된다. 그러나 기존의 제안된 데이터로 개발된 AI는 실제 공간에 설치 운영될 때 데이터의 화질, 카메라 각도, 조명, 시설물, 사람들의 복장 등의 다양한 환경이 AI 기술 개발 때와 큰 차이가 있어 높은 정확도를 보장하기 어렵다. 이를 극복하기 위한 다양한 AI 기술이 연구되고 있으나, 현재까지 가장 확실한 방안은 AI를 적용하는 현장에서 충분한 양의 데이터를 수집하고 가공한 뒤 이들 데이터로부터 AI가 주요 정보들을 추가로 반복 학습하는 것이다.

그러나 학습 데이터 구축을 위해 카메라 영상을 저장하고 가공하는 과정에서 새로 취득된 영상 데이터에 담긴 모든 개인정보주체의 동의를 받아야 하므로 개인정보 침해 위험 없이 AI에 현장 데이터를 적용하는 것은 현실적으로 불가능하다. 데이터 부족으로 인해 실제 현장에 적용 가능한 수준의 정확도를 갖는 AI가 개발되기 어렵고 결과적으로 AI의 현장 적용 가능성이 낮은 현실이다. 따라서 개인정보를 제거하면서 데이터를 수집하고 가공하여 AI의 혁신을 이루는 방안이 필요하다.

비식별화 방법을 통해 개인정보 보호 문제 해결

카메라에서 취득된 영상데이터를 이용하여 공간 방문자 및 근로자의 개인 정보와 인권 침해 없이 안전하게 분석하거나 새로운 AI를 학습하기 위해 데이터의 비식별화 기술이 활용되고 있다.

데이터를 손쉽게 비식별 처리하기 위해 [그림 1]과 같이 영상 내 사람들의 얼굴을 검출한 뒤 얼굴 영역을 삭제(masking)하거나 블러(blurring)시켜 개인 식별 정도를 제거하는 기법들이 자주 사용된다. 이 경우 개인정보 침해 우려는 없지만 데이터의 AI 활용도가 크게 떨어진다.

비식별화 기법들

예를 들어 AI는 블러 처리와 얼굴이 높은 연관 관계가 있다고 학습하게 되어 실제 상황에서 얼굴만 보이는 사람은 검출하지 못하고, 흐릿하게 포착된 영역을 사람 얼굴로 오판하기도 한다.

또한, 데이터 비식별 처리 과정에서 검출에 실패한 얼굴의 경우 블러 처리되지 않고 원본 영상 그대로 남게 되어 개인정보 침해가 일어난다. 현재 최신(state-of-the-art) 얼굴 검출 기술의 정확도는 실험실 데이터를 대상으로도 불과 90% 초중반 수준이며1), 비식별화 기술이 이에 의존한다면 개인정보 유출 우려가 여전히 남게 된다.

비식별화 단점을 보완한 익명화 기술
기존 비식별화 기법의 단점을 극복하고 데이터의 AI 활용도를 높이기 위해 개발된 딥핑소스의 데이터 익명화 기술은 영상 데이터에서 개인을 식별할 수 있는 개인정보를 제거하면서도 AI가 영상을 분석하는데 필요한 주요 정보들은 보존한다.2) [그림 2]와 같이 데이터는 육안으로도 얼굴 인식 등의 AI로도 개인을 식별할 수 없는 형태로 변조되며, 익명 처리된 데이터는 원본으로 되돌리지 못한다. AI는 익명 처리된 데이터를 별도의 복호화(해독) 과정 없이 그대로 분석하여 공간 내 사람의 위치나 행동뿐만 아니라 위험 등의 상황도 분석할 수 있다.

딥핑소스

익명화된 데이터를 분석했을 때의 정확도는 AI가 익명 처리되지 않은 원본 영상 데이터를 분석했을 때와 동일한 수준이다. 사람의 얼굴만을 찾아서 삭제하거나 블러 처리하던 기존 기술과는 달리, 딥핑소스의 익명화 기술은 영상 전체를 알아볼 수 없게 변조하므로 옷차림 등의 부가 정보로 개인이 식별될 위험도 없다. 또한, 개인 정보뿐만 아니라 공간 내 시설물 등 비밀 정보도 무단으로 수집되거나 유출될 염려 없이 보호할 수 있다. [그림 2] 하단과 같이 영상 내 일부분만 익명 처리 하는 것도 가능하여, AI 학습용 데이터 구축에도 활용될 수 있다.

개인정보 침해 없는 익명화 AI 카메라 활용 예

익명화 기술을 적용하면 다수의 카메라를 활용하여 공간 내 다수의 방문자들의 이동, 행동, 상황 등을 분석할 수 있다. 기존 AI 카메라 도입의 가장 큰 어려움이었던 개인 정보뿐만 아니라 낮은 AI 정확도 문제 또한 해결할 수 있다. 익명화 AI 카메라의 대표적인 활용 예는 다음과 같다.

공간 분석
특정 기간 및 작업 구역 별 근로자 동선, 위치 정보, 히트맵(heat-map) 등을 누적, 수치화하여 시각적 리포트 제공할 수 있으며, 필요시 데이터의 상세 정보를 대시보드를 통해 조회함으로써 공간의 운영 효율을 측정할 수 있고, 위험 상황이나 사고 발생 시 사고 발생 경위나 향후 사고가 발생할 가능성을 조기 감지할 수 있다.

안전 관리
 위험지역 내 잔류자 파악 : 재난 상황 발생 감지 시 재난 장소에 근로자나 방문자 등의 존재 유무를 파악할 수 있다. 사람의 이동을 파악하여 부상을 입었거나 고립되어 이동이 어려운 상황도 조기 감지할 수 있다. 대시보드에서 설정한 출입 금지 구역에 진입하거나 접근하는 사람이 발견될 때 관리자에게 알람을 보낼 수 있다.
 보호 장비 착용 여부 확인: CCTV나 근로자가 착용한 카메라를 통해 근로자들의 보호 장구 착용 여부를 실시간에 확인하고 장비 미착용이나 오착용 시 알람을 준다.
 부상 등 특이 상황 감지: 방문자나 근로자가 넘어지거나 쓰러지는 등 부상 가능성이 있는 상황, 화재나 범죄 위험 등의 특이 상황을 감지하여 관리자에게 즉시 알람을 전송할 수 있다.

익명화 기술을 통해 향후 AI 분야에 지속 가능한 가치창출 기대
소개한 AI 용 데이터의 개인정보 익명화 기술은 신호로 표현 가능한 모든 데이터에 적용할 수 있어 영상뿐만 아니라 음성, 텍스트 등의 데이터에도 도입 가능하다. 익명화 카메라 기반 영상 분석 시스템은 개인정보 및 인권을 보호하면서도 공간을 분석하여 고객의 데이터에 기반한 공간 최적화와 마케팅에 적용될 수 있고, 산업 현장에서 근로자의 안전을 지키는데 유용할 것으로 기대된다.

변화하는 디지털 전환 시대에 맞춰 공간의 데이터를 활용함으로써 방문자에게 편의를 제공하고, 인력과 장비의 운영을 비롯한 작업 효율을 향상시킬 수 있다. 또한 이는 공간 운영의 최적화와 작업 환경 및 작업 결과물의 질을 높이면서도 동시에 비용의 절감 효과도 가져올 수 있다. 향후 AI를 안전하게 활용함으로써 지속 가능한 가치를 창출하는 ESG 경영을 실현할 수 있을 것으로 기대한다.

1) https://paperswithcode.com/sota/face-detection-on-wider-face-hard
2) 딥핑소스는 AI용 데이터 익명화 관련 국내외 특허 70건 이상 보유