- FOCUS
- 김건우
- 한국전자통신연구원 인공지능융합보안연구실 책임연구원
4세대 CCTV 시대로의 전환
고도화된 현대 사회에서 점차 은밀, 흉폭해지는 범죄, 사고 등 각종 안전현안을 해결하는 치안의 최전 방에서 CCTV의 역할과 중요성이 증가하고 있음은 누구나 인지하고 있는 사실이다. 범죄 현장에 출동한 경찰이 주위에 설치된 CCTV 영상을 우선 확보하는 것만 보더라도 영상정보는 현장의 상황을 가장 정확하고 충실하게 표현하는 매개체로, 범죄 현장이 CCTV 사각지대이거나 유의미한 영상 확보에 실패해서 초동 수사에 난항을 겪고 있다는 언론 기사도 자주 접할 수 있다. 이렇듯 CCTV는 이미 우리 사회 곳곳의 안전을 책임지는 안전 파수꾼으로서, 통계청에 따르면 2022년을 기준으로 전국에 설치된 총 CCTV 대수는 1,960만대로, 공공 기관에서 160만대 이상을 운용하고 있으며, 매년 설치 대수가 급격히 증가하고 있는 점을 감안하면 현재는 2,000만대를 훌쩍 넘을 것으로 추측된다.
CCTV의 세대별 진화
CCTV는 현재 3세대까지 발전된 것으로 평가받고 있는데, 초기 1세대 아날로그 CCTV는 외부와 물리적으로 연결이 차단된 폐쇄형 네트워크 환경에서 아날로그 형태의 SD급 영상 데이터가 수집, 저장 및 단순 관제되었다. 2세대 디지털 CCTV는 좀 더 정확하고 효율적인 데이터 관리를 위해서 영상 데이터를 디지털 포맷으로 전환하여 저장, 관리하였으며, IP 주소를 통해서 인터넷과 연결됨으로써 공유, 협업 등 가용성·효율성 측면에서 괄목할만한 성장이 이루어졌다. 현재 진행중인 3세대 지능형 CCTV는 CCTV, 관제/ 분석 서버 등에 인공지능을 탑재함으로써 기존 단순 모니터링, 검색 위주의 제한적 안전서비스에서 벗어나 시스템 스스로 관심 객체와 상황 등을 인식 ,추적, 검색함으로써 보다 효율적인 관제와 즉각적인 대응이 가능해졌다. 지능형 CCTV 초기에는 제약적 환경에서 객체 검출, 식별, 추적과 침입 등 단순 위험상황 인식이 주였다면 최근에는 다중 CCTV 연 계형 추적, 폭행, 군중 이상상황 감지 등 비제약적 환경에서 행위 인식, 협업, 은닉 정보의 생성/추론, 고속화 등에 관한 연구가 활발히 진행되고 있다. 그러면 과연 제 4세대 CCTV는 어떠한 패러다임으로 발전할 것인가?

누구나 접근 가능한 개방형 CCTV
온-디바이스 AI는 현재 글로벌 IT 트렌드를 주도하는 키워드로, 외부 네트워크 연결없이 스마트 디바이스가 보유한 지능을 통해서 정보를 수집, 처리, 분석, 추론하는 업무를 자율적으로 수행하는 것을 의미한다. CCTV에도 이러한 온-디바이스 AI 개념 인 엣지 AI CCTV 기술에 대해서 많은 연구가 오래 전부터 수행되었고 객체 탐지 등 일부 AI 기능이 탑 재된 상용 CCTV 제품이 이미 널리 설치, 운용되고 있다. 엣지 AI CCTV 기술이 서버에 집중된 부하 분산을 통한 실시간 고속 처리, 프라이버시 보호, 현장 맞춤형 AI 서비스 등의 장점이 있는 반면, 저사양 CCTV HW의 연산 능력 한계로 인한 고성능 AI 기 술 탑재 불가, 주기적인 AI 모델 관리, 학습 및 업데 이트 어려움 등 현실적인 단점으로 인하여 서버기 반 AI CCTV 기술에 비해서 기대만큼의 성장 속도를 보여주지 못하는 것도 엄연한 현실이다. 나날이 새로운 AI 모델이 공개되고 괄목할만한 성능 향상이 이루어지고 있지만, 그 결과물이 엣지 AI CCTV 에 제대로 반영되지 못하는 주요 원인 중의 하나는 CCTV 디바이스 플랫폼 자체의 ‘폐쇄성’ 때문일 것 이다.

대부분의 상용 CCTV 디바이스는 리눅스 운영체제를 기반으로 모든 기능은 CCTV 제조 시에 제조사에 의해서 개발, 탑재, 판매하고 있어, 사용자나 서비스 제공자가 새로운 기능을 추가하기 위해서는 제조사의 협조를 받아서 개발하거나, 해당 기능이 탑재된 개방형 CCTV의 필요성 AI CCTV를 신규 구매하는 수밖에 없다. 즉, 현재의 폐쇄형 CCTV 플랫폼상에서는 CCTV 제조사의 협조 없이는 자율적으로 CCTV에 새로운 기능을 탑재하거나 운용, 시험할 수 없다. CCTV 내부 시스템에 대한 외부 접근이 엄격히 제한되기 때문에 보안적인 측면에서는 장점이 있을 수 있으나, 사용자의 가용성 측면에서는 CCTV 제조사가 제공하는 기능에만 국한되고 AI 기술력에 종속되는 뚜렷한 한계가 있다. 즉, 사용자는 CCTV 디바이스 제조 시 탑재된 AI 기능만 사용할 수 있으며, 성능마저도 CCTV 제조사의 기술력에 의존하게 되는데, 영세한 대부분 국내 CCTV 제조 업체의 현실을 감안하면 온-디바이스 AI 라는 글로벌 트렌드를 선도적으로 추구하기에 많은 어려움이 있다.
개방형 영상보안플랫폼을 위한 OSSA 사실 표준

따라서, Bosch, 한화비전, Milestone, Pelco, VivoTek 등 글로벌 영상업체들이 주도하여 IoT 디 바이스 자체적으로 안전/보안 기능을 탑재, 운용하고 다른 디바이스와 협업할 수 있는 통합 표준 프레임워크인 OSSA(Open Security & Safety Alliance, 현재는 Onvif 표준 단체와 통합) 사실 표준을 제정하였다.

OSSA 표준은 CCTV 등 IoT 디바이스에 안드로이드 운영체제를 탑재하고, 다양한 AI/보안 기능의 자유 로운 개발, 탑재, 연동 등이 가능한 표준 프레임워크를 정의함으로써 ‘개방형 CCTV’ 新 생태계를 조성한다. 즉, 개방형 CCTV 생태계에서 CCTV 사용자는 자신 이 원하는 고성능 AI/보안 기능을 앱-스토어 등 클 라우드에서 구매, 자신의 CCTV에 설치해서 자유롭게 운용할 수 있고, 개발자는 다양한 AI/보안 기술을 개방형 CCTV 표준을 준용하는 앱 형태로 개발, 등 록, 판매한다. 또한, 서비스 제공자는 CCTV가 설치 되는 도메인에 최적화된 AI CCTV 솔루션을 제공하며 지속적이고 용이한 AI 성능 유지와 관리가 보장 된다. 즉, 누구나 사용하는 스마트폰과 같이 CCTV에도 나만의 기능을 자율적으로 탑재, 운용, 관리할 수 있는 ‘My CCTV’ 서비스 시대를 기대해도 좋을 듯 하다. 전 세계의 많은 AI 개발자들이 개방형 CCTV에 탑재될 수 있는 초고성능의 모델을 지속적으로 등록하고 사용자/서비스 제공자는 자신의 요구사항에 적합한 AI 모델을 선택함으로써, 서버 기반 AI CCTV 성능에 버금가는 현장 맞춤형 서비스를 제공 받을 수 있다. 신뢰할 수 있는 My CCTV 서비스 확 산을 위해서는 CCTV 스스로 영상과 시스템을 외부 불법 접근, 악성 코드 등으로부터 보호하고 사용 자의 사생활을 보장할 수 있는 내재화된 자율 보호 (Security by Design), 능동적 방어 체계의 구축 또한 필수 기능이다.

위험징후를 선제적으로 감지·예측하는 CCTV

지금까지는 AI CCTV 기술이 주로 현재 발생하고 있는 실시간 위험상황(침입, 쓰러짐, 폭행, 화재 등) 을 감지하고 메타데이터를 생성·검색하는 등 사후 해결에 초점을 맞추고 있다면, 앞으로는 가까운 미래의 범죄를 사전에 예측, 예방하는 예측 치안 (Predictive Policing) 기술에 대한 연구가 더욱 활발히 진행될 것으로 보인다. 이미 미국, 영국, 일본 등 선진국에서는 잠재적인 범죄 활동을 식별하기 위해 수학적, 예측적 분석 기법을 법 집행에 활용하고 있으며, 분석 대상 또한 범죄통계정보에서 SNS 정보, 날씨·교통 등 도시환경 정보, 영상 정보, 총 소리 등 소스의 스펙트럼이 지역·사회적 특성에 맞게 다양화되고 있는 추세이다.

범죄 예측을 위한 기본 통계 모델

범죄 징후를 사전에 감지, 예측하는 방식은 인근 반복 모델(Near-Repeat Model)과 위험 영역 모델 (Risk Terrain Model)을 기반으로 한다. 인근 반복 모델은 한 지점에서 범죄가 발생하면 일정 기간 내에 인근 지역에서 동일한 유형의 범죄가 반복적으로 발생할 가능성이 크다는 것으로, 예를 들면 주거침입절도의 경우 한번 침입을 당한 주거지가 재차 피해를 당할 가능성이 4~12배 높고 주 거침입절도범 중 76%가 한번 범행한 집을 2~5번 까지 재차 침입한다는 통계적 결과가 있다. 즉, 이 모델을 통해서 핫-스팟(Hot-Spot), 핫-타임(Hot- Time)을 설정하고 범죄가 시·공간적으로 집중되는 현상을 실시간 파악하여 사전 대응할 수 있다. 누가 범죄를 저지르는 것을 아는 것보다 언제 어디에서 범죄가 발생하는 지를 아는 것이 중요하다는 인식이 도출된다. 위험 영역 모델은 공간이 내포한 범죄 위험 요인을 통해서 범죄 위험도를 설명하는 것으로, 예를 들면 주거침입절도의 경우, 피해 여부, 전과자의 주거지, 주요 도로 인접 여부, 16~24세 남성의 공간적 집중도, 아파트와 숙박업소의 위치 등이 요인으로 작용 할 수 있다. 또한, 성범죄는 유동인구가 많은 유흥업소 밀집 지역, 방화와 절도는 주거지역 등에서 많이 발생하며, GIS 분석 기법이 활용되기도 한다. 전 세계적으로 이미 다양한 범죄예측시스템이 운용되고 있는데, 미국은 각 도시별로 PredPol, CompStat, HunchLab, 영국 경시청에서 사용하는 OASys, NDAS, 일본은 히타치가 개발한 PCA, 그 외 중국, 인도 등에서도 CCTV 영상, 위성 영상과 결합한 범죄 징후 감지 기술이 연구, 서비스로 운용 되고 있다.

과거와 현재를 아우르는 다차원 범죄 예측 기술
기존 범죄예측 기술은 과거 발생한 범죄통계정보에 기반해서 가까운 미래의 범죄 유형별 발생 가능성을 확률적으로 측정하는 방식으로 비용 대비 높은 치안 효과를 거두고는 있지만, 현재 발생하는 상황이 전혀 반영되지 못하는 단점이 있다. 미래 상황은 현재 발생하는 실시간 상황의 연장선에 있으며, 현재는 미래에 전개될 상황과 가장 밀접한 관련이 있기 때문이다. 즉, 현재 발생하는 상황과 과거 동일 지역/시간대에 발생했던 범죄 패턴과의 유사도를 분석하여 범죄 징후를 감지하는 다차원 범죄 예측 기술이 개발되었다. 다차원 범죄예측 기술은 현재 발생하는 상황을 정확하게 인식하기 위한 CCTV 영상 데이터와 과거 범죄통계정보가 융합되어 범죄 발생 가능성이라는 확률적 추론 결과를 도출하는 방식으로 기존 방식보 다 정확한 예측이 가능할 뿐 아니라 현장 상황을 자동 식별, 추적할 수 있어 즉각적인 범죄징후 상황 파악과 대응이 가능하다는 장점이 있다. 범죄 예측서비스의 실효성은 이미 미국 등 선진국의 사례에서 검증되어 70% 수준의 범죄 예측 성능, 총기, 살인 등 강력범죄의 20~30% 감소 효과가 있다는 보고가 있다. 단순 범죄 통계정보 기반의 단순 범죄 예측만으로도 이러한 강력범죄 예방효과가 있다면, AI CCTV와 융합된 다차원 범죄 예측서비스는 현장의 구체적인 상황을 고려하는 맞춤형 범죄 예방 효과를 거둘 수 있을 것으로 기대된다.

AI CCTV가 중심이 되는 미래형 첨단치안시스템

국내 CCTV 산업은 과거 글로벌 DVR 시장을 반짝 선점했을 뿐, 최근에는 미국과 중국에 뒤처지는 AI 기술력, 중국의 대규모 물량 중심의 저가공세, AI 반 도체 핵심부품 경쟁력 저하 등 전반적으로 영세한 산업 규모를 벗어나지 못하고 있다. 다행히 공공분야를 필두로 Re-id, 군중 이상상황 인식, 접근 제어 등 실증서비스 적용이 추진 중이며, 민간분야에도 다양한 AI CCTV 기술이 확산되고 있는 추세이다. 더 나아가 글로벌 CCTV 시장 경쟁력 확보를 위해서 원천기술력 확보는 물론 AI CCTV 산업의 패러다임을 정확하게 예측하여 선제·집중 공략하는 Break- through R&D 전략이 필요하다. 필자가 주장하는 글로벌 CCTV 시장을 선점할 수 있는 키워드는 <개방>과 <예측>이다. 누구나 최고 수준의 AI CCTV 기술을 사용할 수 있고 능동적으로 참여할 수 있는 My CCTV 생태계, 개인의 사생활이 보호되고 신뢰할 수 있는 CCTV 서비스 체계, 시민 들이 안전을 체감할 수 있는 예측치안 서비스를 통 해서 미래형 첨단치안시스템이 실현될 수 있으며 그 중심에는 AI CCTV가 있다.
