ISSUE
생성형 AI시대, 데이터 리터러시가 생존의 경쟁력이다
이재원 | 경희대학교 경영대학원 겸임교수1)
데이터 리터러시가 앞으로 10년의 무기가 된다

“세상에 데이터가 없으면 어떻게 될 것 같으냐?”고 챗GPT에게 물었다. 정리를 잘해서 딱 부러지게 대답한다. “데이터가 없으면 우리가 필요로 하는 정보를 얻을 수 없고 원하는 서비스를 이용할 수 없다” 고 한다. 또한 “데이터는 경제적 가치를 가지고 있어 없으면 경제적 문제가 발생할 수 있으며, 사회적 문제를 해결할 수도 없다. “결국 데이터가 없으면 미래 예측이 어려워지며, 우리의
삶에 큰 영향을 미칠 수 있다.”고 대답한다.
이렇듯 데이터가 없는 세상은 상상하기 어렵다. 더구나 디지털 시대를 살아가는 요즘, 인공지능, 블록 체인, IOT, 메타버스 등 디지털 기술은 모두 데이터를 원료로 하여 움직인다. 특히 챗GPT를 포함한 생성형 AI 시대에는 데이터가 더욱 중요하다. 인공지능은 데이터로 학습하여 모델을 생성하고 데이터로 결과를 제시한다. 모든 것이 데이터로 움직인다. 따라서 일상이나 비즈니스에서 데이터에
대해 모르거나 제대로 활용하지 못한다면, 즉 데이터 리터러시로 무장하지 않으면 생존할 수 없다.

데이터 리터러시는 데이터data와 리터러시 literacy의 합성어로 흔히 ‘데이터 문해력(文解力)’ 이라고 번역된다. 데이터 리터러시는 데이터를 문맥에 맞게 읽고 사용하고 소통하는 능력은 물론이고 데이터에 담겨 있는 의미를 파악하고 목적에 맞게 활용하는 능력을 의미한다. 결국 데이터를 어떻게 잘 이해하고 활용하느냐 즉, 데이터 리터러시가 미래 경쟁력의 관건으로 작용한다.
데이터 리터러시에 자신이 없는 이유는 무엇일까글로벌 컨설팅 전문기업 액센츄어Accenture의 설문조사를 보면 데이터 리터러시에 자신감을 느끼는 사람은 21%에 불과하다고 한다. 상황이 이렇다 보니 직장인들과 학생들이 모두 코딩이나 R, 파이썬 Python 등 분석 도구 배우기에 열심이다. 기업에서도 데이터 분석 전문인력을 확충하거나 전담부서를 두어 경쟁에 뒤떨어지지 않게 노력하고 있다. 하지만 배운 분석 도구들이 실제 현업에서 생각만큼 제대로 활용되고 있지 않는 것 같다. 데이터 분석 보고서는 넘쳐나지만 굳이 분석을 안 해도 알 만한 일반적인 결론만 들어 있는 경우가 많다. 목적과 문제해결이라는 본질은 놓아둔 채 기술만 열심히 익힌 결과다.
회사에서 제공하는 데이터 교육은 대부분 프로그램을 짜보는 기술 향상 교육에 치중돼 있다. 그러나 올바른 데이터 리터러시의 함양은 도구 활용 기술뿐만 아니라 데이터에 대해 올바른 시각을 가지고 올바른 방법으로 문제를 해결하는 역량을 함께 기를 때 가능하다. 이를 위해서는 우리 회사의 데이터는 어떻게 발생되어 수집되고 관리되는지부터 알아야 한다. 내가 필요한 데이터는 어디에 어떤 형식으로 저장되는지를 먼저 알아야 필요할 때 쉽게 찾아 쓸 수 있다. 분석 도구를 교육할 때도 직원들이 부서의 문제를 들고 직접 코딩해보도록 하고 성공적 활용사례를 공유하여 이를 응용할 수 있도록 해야 한다.
조직에서 데이터 활용 역량이 이미 비즈니스 성패를 가르고 있다넷플릭스는 추천 알고리즘을 구축하기 위해 2006년부터 3년에 걸쳐 100만 달러의 우승 상금을 걸었을 정도로 알고리즘 개발에 사활을 걸었다. 그때부터 사용자들의 검색, 시청 시간 및 기록, 평점 등 행태 정보를 수집하고 취향이 비슷한 사람들의 데이터, 컨텐츠 정보, 사용 장치까지 다양한 데이터를 결합하여 활용한다. 데이터에 기반한 추천 시스템이 없었다면 지금의 넷플릭스가 있었을까?
현대자동차도 더 이상 자동차 제조회사에 머무르지 않고 있다. 차량과 관련한 다양한 이 업종 데이터를 연결하여 고객들이 편리하게 자동차를 사용하도록 생태계를 만들었다. 주유 기록, 정비 내역 등 고객이 차량 관리 내역을 한눈에 파악하고(차량관리), 실시간 차량 위치 데이터를 이용하여 차 안에서 주문과 결제(차량편의) 등도 가능하게 만들었다. 자동으로 주행 거리 포인트를 제공하며(차량정보) 보험 가입도 편리하게(차량금융) 하고 있다.
인도의 조마토(Zomato)라는 회사는 데이터 분석을 기반으로 한 배달 앱을 만들어 13억 6,000만 인도 국민의 식습관에 혁명을 일으켰다. 인도의 자가용 소유 가정이 단 2%뿐이고 남의 집에서 요리한 음식을 절대 먹으려 하지 않아 인도 국민의 90%는 식당에서 외식을 하지 않는다. 하지만 인도 국민들이 이 앱에 열광하고 있다. 클릭 몇 번의 편리함으로 조마토는 20만 개 이상의 레스토랑 파트너와 약 10만 명의 배달 파트너가 있고 지금까지 약 1억 건 이상의 배달을 주문하고 있다고 한다. 모두 음식, 배달 시간, 가격, 할인에 대한 고객의 선호와 취향을 추적해 통찰을 얻고 다양한 지역 정보와 결합하는 데이터 활용에 능한 덕분이다.
젊은층 대상 의류 브랜드인 ‘디스커버리’ 로 유명한 국내 의류업체 에프앤에프(F&F)도 소비자들의 성향 데이터를 면밀히 분석하여 신상품 개발에 반영하였다. 2019년에는 ‘따뜻함’ 과 ‘커플’이란 키워드를 도출하여, ‘플리스’라는 겨울 커플룩을 히트시켰고 2020년에는 890g의 초경량 백팩 ‘라이크 에어 백팩’을 탄생시켰다. 감으로 움직였던 패션산업을 데이터를 수집·분석·활용하여 비즈니스를 혁신하였다. 이제 데이터 자산을 활용하여 비즈니스와 고객 경험을 혁신하는 것이 기업의 필수적인 경영 전략이 되어 버렸다.

카지노로 유명한 해러스 그룹의 게리 러브먼 회장은 데이터 지향적인 조직 문화를 구축하기 위해 혼신의 노력을 기울였다. 그는 “데이터 분석을 통해 알아낸 것인가?”라는 질문을 직원들에게 자주 했다고 하며 직원들은 누구나 이를 뒷받침하도록 데이터 분석에 입각한 증거를 제시해야했다. 심지어 러브먼은 “우리 회사에서 해고되는 사유는 3가지다. 첫째는 절도, 둘째는 성회롱, 셋째는 데이터 없이 말하는 것이다.”라고 말했을 정도로 데이터를 기업 경영의 가장 중요한 핵심으로 삼았다.
국내 숙박 플랫폼의 대표 주자인 야놀자도 “야놀자 만의 일하는 방식인 와이코드Y-CODE를 만들어 ‘데이터가 모든 판단의 기준이다.’라고 명시하여 조직의 사고와 행동의 기준으로 제시하고 있다. 특히, 이 회사는 데이터 관련 업무를 IT 부서뿐만 아니라 기획·영업·마케팅 부서에서도 직접 쿼리를 짜고 대시 보드를 만들어 데이터를 분석할 수 있도록 지원하고 있다.

데이터 활용 최강 기업으로 유명한 에어비앤비는 호스트(숙박 제공자)의 과거 행동을 기반으로 호스트의 선호도를 학습하는 알고리즘을 통해 머신러닝 모델을 개발했고 검색엔진에 적용했다. 그 결과 예약 전환율이 약 3.75% 상승해 더 많은 거래가 성사 됐다고 한다. 또한 이 회사는 데이터 접근성, 데이터 도구 활용, 데이터 교육이 데이터 기반 의사결정에 가장 중요하다고 보고 2016년 데이터 유니버시티를 설립했다. 설립한 이후 약 400개 이상의 과정이 진행됐고 4,000명 넘는 임직원의 대다수가 하나 이상의 과정을 수강했다고 한다. 특히 현업 맞춤형 교육인 데이터 U 인텐시브는 사업부 단위별로 부서에 서 사용하는 데이터를 가지고 교육한다.
이렇듯 사례를 든 기업들 모두 최고 경영자부터 솔선수범하고 데이터를 경영의 기준으로 삼도록 조직 문화를 바꾸었다. 또한 구성원이 데이터에 쉽게 접근할 수 있게 하고 매일의 업무에서 데이터에 기반한 의사결정을 하도록 교육하고 지원하였다. 과거에는 데이터라 하면 데이터 전문가나 전담부서의 일로 인식됐으나 지금은 고객과 현장의 문제해결을 위해서 전 직원의 데이터 리터러시를 반드시 높여 나가야 한다. 지금부터라도 변화를 만들어 조직의 모든 문화를 데이터 중심으로 바꿔 나가야 한다. 이를 위해 데이터에 쉽게 접근할 수 있도록 시스템과 도구, 거버넌스 등 인프라를 구축하고 직원들의 평가, 보상, 교육에 힘써야 할 것이다. 데이터 리터러시를 성공적으로 향상한 조직은 이것이 반복적 프로세스의 결과라는 것을 잘 알고 있다. 작은 것부터 시작해 피드백을 통해 지속적으로 향상해 나가는 것이 좋겠다.
직원들도 퍼스널(Personal)한 데이터 경쟁력을 갖추어야작년에 한 직원을 칭찬하고 점심을 사준 적이 있다. 작업 시간이 오래 걸리는 일들을 간단히 프로그램을 고쳐 나머지 직원들의 일을 크게 줄여줬기 때문이다. 이 직원은 며칠 고민한 끝에 새로운 함수를 찾아내서 한꺼번에 몇만 줄씩 올라가도록 간단한 프로그램으로 문제를 해결해버렸다. 그 덕분에 기존 작업 시간이 1~2시간에서 5분으로 줄었다고 하니 참 감사한 일이다. 개인이나 직원들의 데이터 활용 역량이 높아져야 특근도 없어지고 올바르게 문제해결도 할 수 있다. 그렇게 하기 위해서는 데이터를 잘 활용할 수 있도록 직원들의 역량이 높아져야 한다. 가트너는 “데이터를 언어처럼 배워라.”라고 강조한다. 우리가 모국어를 자유롭게 사용하듯이 이제 데이터도 모국어처럼 배워 능숙하게 활용해야 하는 시대다. 그러기 위해서는 다음의 사항은 반드시 머리에 넣어두자.
❶ 첫째, 현장에서 보면 수집한 데이터를 정리하여 그럴듯한 결론만 제시하는 경우가 종종 있는데 문제해결 중심의 결과가 나오도록 데이터를 분석해야 한다. 이를 위해 다양한 관점에서의 가설이 필요하다. 강력한 가설이 되기 위해서는 하나의 궁금증에서 시작해 그 데이터를 보다 보니 다른 것이 궁금해지는 꼬리에 꼬리를 무는 가설일수록 좋다.
❷ 둘째, 데이터 기초 분석 방법과 데이터 분석 도구 등에 대한 이해도 중요하다. 통계의 기초, 데이터 마이닝, 머신러닝과 딥러닝에 대해 개념만이라도 알아두자. R이나 파이썬과 같은 고급 분석도구를 모두 다 배울 필요는 없다. 때에 따라 엑셀이나 SQL로도 분석할 수 있다. 쉬운 것부터 시작해 자꾸 경험 해보고 익숙해진 다음 고급 분석 도구에 도전하면 된다.
❸ 셋째, 데이터 시각화와 스토리텔링도 활용해 소통 능력을 높여 보기 바란다. 본인에게 맞는 시각화 도구를 선택해 차트나 그래프를 자주 그려보고 위치나 색상도 강조해보고 하면서 이런 문제를 표현하려면 이런 기법이 좋더라는 것을 체득해야 한다.
❹ 넷째, 비판적으로 사고하고 분석의 시야를 넓혀야 한다. 데이터 분석을 통한 정답은 하나가 아니라 여러 가지가 있을 수 있으므로 입체적 사고가 필요하다. 그러기 위해 현업 업무 외에도 시장과 고객을 이해할 수 있는 마케팅, 심리학, 경영학 등에 대한 다양한 분야의 책도 읽어두면 도움이 될 것이다.
앞서 얘기했듯이 데이터 리터러시는 전문가들만을 위한 영역이 아니다. 데이터를 접하는 현업에 있는 실무자, 대학생, 주부, 청소년 모두가 올바른 관점과 필요한 역량을 갖추고 다양한 데이터를 기반으로 일상생활에서 문제해결 경험을 많이 쌓아가는 것이 데이터 리터러시를 높이는 지름길이다.
1) 이재원 저서 : <마이데이터 레볼루션 – 초개인화 시대가 온다>, <2030 데이터 리터러시 레볼루션 – 당신은 챗GPT 시대의 생존역량을 갖추었는가>