FOCUS

[통계의 가치를 바꾸다!]
누구보다 빠르게 알려주는 경제사회지표
나우캐스트 포털!!!

김영란 | 통계청 빅데이터통계과 사무관

국가통계의 한계를 어떻게 극복할 것인가

사회는 계속 빠르게 변화하고 이와 비례하여 불확실성도 커지는 상황에서 데이터에 기반한 의사결정은 모든 영역에서 필수요건이 되고 있다. 2020년 초에 발생한 코로나19는 우리의 삶뿐만 아니라 사회의 전반에 너무도 많은 변화를 가져왔다. 아직도 끝나지 않은 팬데믹의 영향을 시의성 있는 수치로 파악하고 경제정책 수립에 활용하기 위한 상세 수준의 정보에 대한 요구는 더욱 가속화되고 있으며, 이들의 요구에 대해 정부의 공식 통계보다 실시간으로 생성되는 민간데이터가 더 활발하게 이용되고 있는 것이 사실이다.

현재 공표되는 국가 승인통계는 약 1,300 여 종으로 일부 동향 통계를 제외하면 약 87%가 1년 이상의 주기로 공표되고 있으며, 이는 코로나19로 인한 경제․사회 상황을 확인하는 것은 최대 1~2년 후에나 가능하다는 것을 의미한다. 즉, 기존 국가통계는 코로나19와 같은 급작스러운 경제 충격이나 사회 변동의 원인을 규명하고 영향을 분석하기에는 시의성이 떨어진다고 할 수 있다.

코로나 펜데믹 상황에서 가용 데이터의 한계

또한, 조사 기반의 승인통계는 소규모 표본으로 인해 대부분 전국이나 시도 수준에서 공표하므로 상세 지역 및 하위 그룹 간 변동을 설명하기에는 어려움이 있다.

그리고 코로나19 상황에 대해 공공, 민간기관 특성에 따라 경제, 사회 현황판들은 각각 분산되어 운영되고 있고, 각 기관의 정보 집계 기준과 데이터 업데이트 주기가 상이함에 따라 발생하는 정보 간 차이 또한 가용 데이터의 한계로 지적되고 있다.

이러한 환경에서 통계청은 전통적인 방식인 조사 통계의 한계로 지적되어 오던 통계의 시의성과 상세성을 극복하고자 실시간으로 발생하는 민간데이터를 활용하여 공식 통계에 대한 대안 가능성을 검토하고자 하였다.

이에, 신용카드 거래 정보, 모바일 통신 위치 정보 및 취업사이트 정보 등을 이용하여 이 데이터들과 관련 있는 기존의 국가승인통계의 수치를 대체하여 설명할 수 있는 지표의 개발 가능성을 평가하고자 하였으며 그 결과 가계, 사업체, 일자리 및 공중보건 등 4대 부문의 상황을 신속하게 포착할 수 있는 속보성 지표를 개발하게 되었다. 이 지표들은 코로나19 발생 직전인 2020년 1월을 기준으로 한 변화량으로 수치화하고 각 지표별 비교항목을 통하여 코로나19로 인한 경제·사회의 충격을 다양한 관점에서 시각적으로 묘사하는 나우캐스트 포털 시스템을 구축하고 2022년 4월에 서비스하게 되었다.

‘2021년 데이터 플래그십 사업’ 과제로 「나우캐스트 포털」구축

나우캐스트 포털 구축 사업은 과학기술정통부와 한국지능정보사회진흥원이 주관하는 ‘2021년 데이터 플래그십 사업’ 과제로 추진되었다. 국가기관으로서는 통계청이 유일하게 선정되었으며, 오픈소스 기반의 비즈니스 솔루션을 공급하는 ㈜배닌과 빅데이터 분석 및 머신러닝 모델링을 구현하는 AMA.comm이 컨소시엄으로 참여하였다.

나우캐스트 포털은 민간데이터를 이용하여 기존 국가통계를 대체할 수 있는지 가능성을 탐색하고 이에 대한 타당성을 검증한 후 자료를 지표화하였다. 후보 지표에 대한 데이터는 데이터 보유기관과 협의를 하고 데이터 요건 정의 후 검증용 데이터를 확보하였다. 민간데이터에 대한 요건 정의와 데이터 품질을 확보하는 과정이 반복되면서 상당한 노력과 시간이 투입되었다.

국가승인통계 작성을 위한 지표 개발이 아니어서 데이터 보유기관은 통계법에 따른 자료제공 의무가 없었다. 이 부분은 데이터 보유기관과의 협력을 위해 업무협약, 비밀보호협정 등을 체결하여 데이터를 확보하였다.

개발이 완료된 지표는 포털에서 다양한 방법으로 구현할 수 있도록 시스템을 구축하였다. 실제로 지표 개발과 시스템 구축은 거의 동시에 진행되었는데 이는 사업 기간의 제약과 지표화 부문에서 요건 정의, 품질 확인 등의 과정 반복으로 소요 시간이 너무 길어서 시스템을 효율적으로 구축하기 위해서 애자일 방법으로 병행해서 진행하였다. 아래의 그림은 나우캐스트 포털 구축 과정을 도식화 한 것이다.

나우캐스트 포털 구축 흐름도
다양한 민간데이터와 공공데이터 활용

지표 개발에 사용된 데이터는 신용카드사, 은행, Van 사, 온라인 채용회사, 통신사 등의 민간데이터를 집계 형태로 활용하였고 승인통계 대체 가능성 검토를 위한 검증용 공공데이터는 통계청의 서비스업동향조사, 한국은행의 신용카드 실적과 가계신용총괄표 그리고 여전업협회의 카드 승인금액 등을 이용하였다.

당초 목표한 지표의 제공 주기는 주간이었으나 데이터 생성 주기 및 제공 기관의 여건에 따라 월로 변경된 지표도 발생하였다. 또한, 데이터 품질이 속보성 지표로서 조건이 충족되지 않은 경우는 다른 데이터로 대체되기도 하였다. 각 부문별 지표와 원천 데이터, 검증용 공공데이터 등을 아래와 같이 정리하였다.

부문별 지표 및 필요 데이터
데이터 분석

데이터 분석은 코로나19 상황의 지표별 변동을 측정하기 위하여 2019년 1월부터 2021년 4월까지의 데이터를 이용하였다. 데이터 분석의 첫 단계는 민간데이터와 기존 관련 있는 승인통계와의 추이, 동행 정도, 데이터의 포함범위 등을 비교하여 데이터를 평가하고 승인통계를 대체할 수 있는지의 가능성을 검토한 후 이에 대한 타당성을 검증하였다.

타당성 검증이 끝난 데이터는 지수 적용 조건을 설정하여 지표화하였으며 지표에 대한 다양한 분석을 제공하기 위하여 지표별 특성에 따라 분류 항목을 선정하였다.

데이터 분석 단계

(1단계) 타당성
검증타당성 검증의 기본 프레임워크는 데이터에 대한 기초 분석과 상관관계 분석이다. 기초 분석은 관련 승인데이터와 민간데이터를 비교하는 것으로 예를 들어 ‘가계 지출’과 ‘사업체 매출’의 경우 승인데이터는 한국은행의 신용카드 이용금액, 통계청의 서비스업동향조사 중 재별_상품별 판매액 그리고 여전업협회의 국내카드 승인실적을 벤치마킹하였고 민간데이터는 한국크레딧뷰로와 신한카드의 카드결제정보 및 한국정보통신의 가맹점 결제정보를 비교하였다

기초 분석을 마치면 각 지표와 업종에 대한 데이터의 상관분석을 실시하여 그 정도가 0.9 이상이면 민간데이터를 채택하였다. 만약 상관관계가 0.9 미만일 경우는 그 지표에 대한 업종 단위의 상관분석을 다시 실시하여 그 상관관계에 따라 표출할 업종을 선택하였다.

(2단계) 지표화
지표화 목적은 사용자가 데이터를 직관적으로 이해 할 수 있도록 수치로 표현하고 승인되지 않은 지표로 원자료 값 노출 방지와 특정 시점을 기준으로 한 상대값으로 표현하고자 하는 것이다. 이는 속보성과 추이성을 동시에 고려한 것으로 계절성을 제거한 효과도 포함한다.

지표화를 위해 일 평균 적용, 전년 동주/동월 대비 비교, 지수화 그리고 이동 평균의 4가지 방법을 시도하였다. 전년 동주 대비 변화율은 가계 지출, 가맹점 매출의 경우 10일, 25일 등 특정 일자에서 급격한 변화를 보이지만 10일 또는 25일의 포함 여부가 일치하지 않는 경우는 오차가 증폭되는 것으로 나타나 이 방법은 적용하지 않았다.

그러나 전년대비로 판단할 수 없는 음력 명절 및 여름, 겨울 등의 계절성 효과와 코로나19 발생에 따른 효과는 수치의 변화에 대한 탐색이 필요했다. 이런 점을 종합하여 음력 명절 및 계절적 효과와 코로나19 발생에 따른 효과는 제거하지 않고 그대로 보여주기로 하였다. 대신 포털에서는 각 시점에 이벤트를 추가하여 명절, 코로나19 등에 따라 나타난 수치의 큰 변화에 대한 설명을 돕고자 했다.

수치는 특정 기간(2020. 1월)을 기준으로 변화율로 지수화하여 표출하였다. 하지만 지표의 성격에 따라 변화율을 사용하지 않은 지표도 있다. 마지막으로 데이터의 이동 평균 방법은 모든 지표에 반영하지 않고 일부 주 단위 데이터에 대하여 일자별 특수성을 줄이기 위하여 지수화 한 그래프와 4주 이동 평균한 그래프를 동시에 표출하였다.

(3단계) 분류항목 선정
데이터 분석의 마지막 단계는 각 지표의 특성에 따라 세부 비교항목을 다르게 구성하여 유의성, 효과성을 높이도록 지표별 분류 항목을 선정하였다. 특히 지역과 업종 분류는 나우캐스트 포털에서 사용하기 위하여 시군구는 78개, 업종은 24개로 재정의하였다.

시스템 구축

나우캐스트 포털 시스템 구축은 사업 기간의 제약으로 데이터 검증 및 지표화와 동시에 애자일 방법으로 3차까지 사이클을 반복하며 병렬로 진행하였다. 기초 데이터에 대한 요건 정의가 이루어지는 동안 시스템 개발을 위한 사전 준비 및 요구사항 정의 및 분석을 수행하였고 3차까지 통합 검증을 완료하였다. 나우캐스트 포털 시스템은 ‘나우캐스트 포털’과 ‘나우캐스트 관리’ 시스템으로 구분된다.

주요 서비스 및 기능

나우캐스트 포털은 민간 및 공공데이터를 활용하여 개발한 4대 부문 즉, 가계, 사업체, 일자리, 공중 보건의 속보성 경제·사회 지표를 시의성 있게 주 또는 월별로 정보를 제공하여 경제 위기나 코로나와 같은 충격이 유발한 경제․사회적 영향을 신속하게 묘사하는 것을 목적으로 한다. 나우캐스트 포털의 몇 가지 서비스를 소개하고자 한다.

나우캐스트 포털 시스템 구성도 and 나우캐스트 포털 메인 화면

❶ 경제사회 속보성 지표
나우캐스트 포털 지표는 4대 부문 즉, 가계, 사업체, 일자리, 공중보건의 8개 속보성 지표를 서비스 중이다. 주로 민간데이터를 사용하여 속보성을 확보하고 국가승인통계와의 비교 및 분석으로 데이터 검증과 적합성 여부를 판정하여 지표를 선별하였다. 지표는 향후 확대할 계획이다.

❷ 시각화 서비스
나우캐스트 포털은 지도 기반의 열지도, 추세선 등으로 정보를 직관적으로 이해할 수 있도록 시각화 기반의 서비스를 제공한다. 또한, 지표가 표출되는 그래프의 특정 영역에 마우스를 위치하면 해당 부문의 수치를 보여줌으로써 즉각적으로 지표의 정보 확인이 가능하다.

❸ 분류 항목 제공
나우캐스트 포털은 지표의 심층적인 분석을 위해 지표 특성별로 분류항목을 제공한다. 각 지표 특성에 따라 분류항목을 구성하여 비교의 유의성과 효과성을 증대시키고 분류항목 선택 시 그래프의 특정 영역을 지정하는 시각적 방식으로 구현하여 하위그룹 간 비교 대상 선정의 편의성 또한 제고하였다. 각 지표별 분류 항목은 ‘나우캐스트 포털 서비스 지표’를 참고하기 바란다.

❹ 부가 서비스
나우캐스트 포털에서는 지표에 대하여 시각화 자료로 구현된 그래프와 데이터를 다운로드하여 활용이 가능하다. 또한, 지표와 관련된 연구 결과물을 pdf 파일 등으로 제공한다. 포털에서 제공하는 서비스는 이용자 편의를 위하여 페이스북, 인스타그램 등 소셜 네트워크 서비스(SNS)로 공유할 수 있는 기능을 제공한다.

나우캐스트 포털 서비스 지표

❺ 주요 이벤트 주석
나우캐스트 포털의 속보성 지표는 지표의 변동에 영향을 미친 주요 사건, 정책 발효일 등의 이벤트를 그래프에 아이콘과 함께 주석으로 표시하여 각 지표의 변동 요인에 대한 이해를 돕는다.

❻ 제공 기관 홍보
나우캐스트 포털에 데이터 제공기관의 기업 로고 등을 배너로 표출하고 링크를 제공하여 민간데이터 제공기관을 적극 홍보하고 통계청과의 파트너십 유지 및 기업의 사회 공헌적 참여를 적극 유도하고 있다. 또한, 나우캐스트 포털의 지속적인 운영과 데이터 수급의 안정성을 도모하고 향후 지표 추가를 위하여 참여기관의 확대를 도모하고 있다.

통계의 가치를 바꿀 수 있는 시스템으로

나우캐스트 포털은 코로나 등 경제충격의 영향을 누구보다 빠르게 알려주는 경제사회 속보성 지표를 서비스함으로써 기존 공식통계의 한계였던 시의성을 극복하고 더 나아가 승인통계를 대체하거나 보완할 수 있는 수치로 통계의 가치를 바꿀 수 있는 시스템을 추구한다.

나우캐스트 포털은 민간데이터를 활용하여 체계적이고 전문적으로 승인통계에 대한 대체와 보완을 검토하였다는데 큰 의의가 있다. 나우캐스트 포털이 미국의 이코노믹트래커(Ecomomictracker)를 벤치마킹하여 우리나라 상황에 맞도록 구축한 것이지만 이러한 시도는 해외의 통계청보다도 선구적으로 이루어졌다. 국가적 펜데믹 상황인 코로나19에 대한 영향을 기존 승인통계로 파악하기 어려운 것들을 민간데이터를 이용하여 시의성 있게 흐름을 파악할 수 있었고 이는 국가적 재난 등 위기 상황으로도 확대가 가능할 것이다.

또한, 전문성이 없는 일반 국민도 직관적으로 알기 쉽게 시각화 서비스를 통해 정보를 제공하는 나우캐스트 포털을 통해 일반 국민이 경제주체로서 데이터에 기반한 경제활동을 지원할 수 있을 것이다. 누구보다 빠르게 경제사회 지표를 알려주는 나우캐스트 포털이 통계의 가치를 바꿀 수 있기를 기대한다.