통계 이야기
데이터 앤 의사결정 리터러시 연결
강양석 ㅣ DEEP SKILL 대표
데이터 과학자도 의사결정 리터러시가 필요하다.
데이터는 오늘날 사회 전반에 걸쳐 필수적인 자산으로 자리 잡았다. 정부 정책, 기업 전략, 개인의 일상적 선택에 이르기까지 우리는 데이터를 기반으로 판단하고 행동하려는 경향이 점점 강화되고 있다. 그러나 데이터를 단순히 ‘읽을 수 있다’는 것만으로는 효과적인 의사결정을 내릴 수 없다. 아무리 정교한 분석이라도 그것이 무엇을 위해, 어떤 맥락에서, 어떻게 쓰일 것인지 명확하지 않으면 데이터는 쉽게 잘못된 확신으로 이어진다. 우리는 종종 데이터 리터러시를 갖춘 사람이 더 나은 결정을 내릴 것이라 기대하지만, 실제 현장에서는 데이터에 능숙한 사람이 오히려 판단 착오에 빠지기도 한다. 반대로, 복잡한 분석 기법은 몰라도 핵심 질문을 날카롭게 던지는 사람이 더 나은 전략을 제시하기도 한다. 그 차이는 의사결정 리터러시의 유무에서 비롯된다.
분석의 출발점은 데이터가 아니라 의사결정이어야 한다. 대부분의 분석은 데이터를 수집하고, 전처리 하고, 다양한 통계기법을 적용한 후 시각화로 마무리된다. 이 과정이 잘 수행되었다고 해서 반드시 좋은 결정이 도출되는 것은 아니다. 오히려 잘못된 질문을 바탕으로 한 정교한 분석은 잘못된 결정을 정당화 하는 도구가 되기도 한다. 한 국내 보험사는 고객 이탈률이 높아짐에 따라 빅데이터 기반 이탈 예측 모델을 구축했다. 고도화된 머신러닝 기법을 활용해 이탈 가능성이 높은 고객 리스트를 도출하고, 해당 고객들에게 할인 혜택과 맞춤형 메시지를 제공하는 마케팅 캠페인을 시행했다. 하지만 결과는 기대와 달리 이탈률 개선 효과는 미미했다. 원인은 간단했다. 이탈 예측은 성공했지만, 실제로 고객이 왜 이탈 하는지를 의사결정 관점에서 해석하지 못했기 때문이다. 예를 들어 가격 외에 서비스의 복잡성, 고객 센터의 응답 지연 등은 데이터에 포함되지 않은 정성적 요인이었고, 분석 결과는 그 맥락을 반영하지 못했다. 즉, 무엇을 분석할 것인가를 결정할 때, 의사결정자 관점에서 문제의 본질을 재정의하지 않고 데이터를 먼저 붙든 것이다.
반면, 미국 로스앤젤레스시는 범죄율을 줄이겠다는 단순 목표에서 출발하지 않았다. 대신 왜 특정 지역에서만 범죄가 집중되는가, 범죄 발생 전 조짐은 무엇인가라는 구체적 의사결정 질문을 던졌고, 그에 맞춰 데이터를 설계하고 수집했다. 경찰 순찰 기록, 조도 센서 데이터, 911 콜 기록, 빈집 정보 등 다양한 데이터를 통합해 범죄 발생 전후의 조건을 분석했고, 결과적으로 예방 순찰 중심의 전략으로 전환해 실제 범죄율을 낮추는 성과를 거뒀다. 이 사례는 분석이 아니라 의사결정의 재정의에서 출발했기에 데이터 분석이 효과적으로 작동한 예다.
데이터 과학자는 본래 기술 기반의 전문가로 인식되기 쉽다. 그러나 데이터 과학의 역할이 실제 세상의 문제를 해결하는 데 있다면, 기술적 능력만으로는 부족하다. 의사결정 리터러시란 데이터를 통해 무엇을 증명하고 어떤 선택을 해야 하는가를 구조적으로 사고하는 능력이다. 예컨대 기획자가 신제품을 출시할 시점을 결정해야 해요라고 말했을 때, 단순히 과거 3년간의 판매 데이터를 보여드릴게요라고 반응하는 분석가는 기술 중심이다. 반면 출시 시점이 중요한 이유가 수요 예측 때문인가요 아니면 경쟁사 움직임 때문인가요라고 되묻는 분석가는 의사결정 맥락을 이해하려는 사람이다. 후자의 분석가는 단지 데이터를 분석하는 것이 아니라 의사결정의 프레임을 함께 설계하는 파트너가 된다. 이처럼 데이터 과학자도 스스로가 다루는 분석이 의사결정과 어떤 관련을 갖는지 끊임없이 고민하고 있어야 한다.
다음 표는 기술 중심 데이터 과학자와 의사결정 리터러시를 갖춘 데이터 과학자의 차이를 비교한 것이다.

데이터 리터러시는 더 이상 분석가만의 기술이 아니다. 의사결정자 역시 데이터의 의미를 이해하고 분석 결과가 지닌 한계를 읽을 수 있어야 한다. 반대로 데이터 과학자도 자신이 생산하는 정보가 어떤 판단의 흐름에서 사용될지를 감각적으로 이해해야 한다. 이때 두 리터러시 사이의 연결은 일방향이 아닌 쌍방향 소통을 기반으로 한다. 즉 데이터를 해석하는 능력과 결정을 구조화하는 능력은 서로 다른 기술이 아니라 같은 사고 과정의 다른 면이다.
결론적으로 데이터 중심 사회에서 중요한 것은 데이터 그 자체보다 그것이 어떻게 판단과 연결되는가다. 분석 기술은 날로 발전하고 AI는 자동화를 앞당기고 있지만 여전히 무엇을 물어볼 것인가는 인간의 몫이다. 의사결정 리터러시는 데이터를 구조화된 질문의 언어로 바꾸고 불확실한 현실 속에서 판단 가능한 틀을 제공한다. 그리고 이 구조는 다음 장에서 다룰 논증 구조로 연결된다. 데이터와 판단 과학과 철학 분석과 해석의 교차점 우리는 이제 그 지점에서 사고해야 한다.
의사결정의 핵심은 논증구조이다.
의사결정이라는 것은 단순히 정보를 수집하고 그중 가장 타당한 선택지를 고르는 작업이 아니다. 실제 의사결정 과정은 복잡하고, 불완전한 정보 속에서 끊임없는 해석과 조정을 요구한다. 따라서 이를 효과적으로 수행하기 위해서는 사고의 구조를 명확히 이해하고, 다양한 주장과 관점을 조립하고, 조정하며, 최종적인 판단을 내리는 사고 프레임이 필요하다. 바로 이 지점에서 논증이라는 개념이 등장한다. 논증은 단순한 말싸움이나 의견 교환이 아니라, 주장을 설득력 있게 구성하고 타당하게 전개하는 일종의 사고의 건축물이라 할 수 있다. 그리고 이 논증을 통해 의사결정은 단순한 선택이 아닌 합리적인 판단의 결과로 자리 잡게 된다.
의사결정 리터러시의 핵심은 논증을 이해하고 다룰 수 있는 능력이다. 논증을 잘 구성한다는 것은 단순히 말을 논리적으로 잘하는 것을 넘어서, 주장의 기반이 되는 상황을 이해하고, 왜 그런 주장을 하는지 이유를 설명하며, 그 이유를 뒷받침하는 증거를 제시하고, 그 모든 것을 가능하게 만드는 전제까지 고려하는 사고 구조를 갖춘다는 의미다. 논증의 구조는 보통 상황 상황에 대한 해석에서 출발하여 주장 주장을 통해 어떤 방향으로 가야 하는지를 제시하고, 그 주장을 뒷받침하는 이유 이유를 설명한 뒤, 그 이유를 지지하는 증거를 제시하고, 마지막으로 그 모든 것을 가능하게 하는 숨겨진 전제 전제로 구성된다.
이 다섯 가지 요소는 각각 독립적이면서도 유기적으로 연결되어 있다. 상황은 논의의 출발점이며, 주장은 그 상황에 대한 입장, 즉 결론이다. 이유는 주장을 뒷받침하는 논리적 근거이며, 증거는 그 이유를 정량적 정성적으로 지지하는 실질적 자료다. 전제는 논증이 작동하기 위한 조건 혹은 배경 지식으로, 보통은 말로 드러나지 않지만 핵심적이다. 다음은 각 요소의 기능과 중요도를 정리한 표이다.

논증 구조에 대한 감각이 있는 사람과 그렇지 않은 사람의 주장은 명확히 구분된다. 예를 들어, “이 정책은 효과가 없다”는 주장을 할 때, 논증 구조를 이해한 사람은 “해당 정책이 효과가 없다는 주장은 최근 3년간 관련 수치가 하락세를 보이지 않았다는 증거에 근거한다. 이는 정책이 목표했던 성과 지표에 변화를 주지 못했다는 점에서 효과가 없다는 판단을 내리는 이유다. 이는 정책이 일정 수준 이상의 수치 개선을 동반해야 한다는 전제가 있다”라고 말한다. 반면 논증 구조를 잘 이해하지 못한 사람은 “다들 실패 했다고 말하잖아요” 혹은 “그건 그냥 내 생각이야”처럼 개인적 판단이나 일반 여론에 의존하는 주장을 하게 된다.
조직 내 의사결정 과정에서도 이러한 차이는 분명하게 드러난다. 어떤 안건에 대해 찬반이 갈릴 때, 논증에 능숙한 사람은 자신의 입장을 명확히 표현하고, 타인의 주장에 대해 반론을 제기할 수 있으며, 새로운 대안을 제시하는 데 능하다. 즉, 논증은 단순히 정답을 찾아가는 직선적인 사고가 아니라, 주장을 내고, 그에 대한 반론을 받아들이며, 새로운 주장을 만들어내는 정반합의 순환적 사고 구조를 가능하게 한다. 이는 갈등을 회피하는 것이 아니라 갈등을 통해 더 나은 결론에 이르게 하는 길이다.
이러한 정반합적 사고는 특히 복잡하고 이해관계가 얽힌 조직의 의사결정 과정에서 더욱 중요하다. 예를 들어, 어느 도시가 신규 교통망 확충을 고민하는 경우, “혼잡하니 지하철 노선을 추가하자”는 주장과 “예산이 부족하니 민간 투자 우선이다”라는 반론이 부딪히게 된다. 이때, 논증 구조에 익숙한 의사결정자는 이 두 입장을 절충해 “예산 제약을 고려한 단계적 민관 협력 모델을 도입하되, 향후 교통량 증가 추세를 반영해 점진적 확장을 고려한다”는 식의 정합적 대안을 도출할 수 있다.
결국, 의사결정 리터러시란 복잡한 문제 속에서 다양한 관점과 주장을 구조적으로 통합해내는 능력이며, 논증 구조에 대한 감각은 그 핵심이다. 우리는 흔히 데이터를 중심으로 한 ‘증거’를 강조하지만, 그 증거가 어디에서 나왔고 무엇을 지지하며 어떤 논리를 따라가는지 이해하지 못하면 오히려 판단을 왜곡시킬 수도 있다. 그래서 다음 장에서는 이 논증 구조 안에서 데이터 리터러시가 어떤 역할을 수행하는지를 본격적으로 살펴볼 것이다. 데이터는 단지 사실의 나열이 아니라, 주장을 강화하고 의사결정을 정교하게 만드는 중요한 사고의 도구이기 때문이다

논증구조 관점으로 데이터 분석을 이해하자.
데이터 리터러시를 이야기할 때 우리는 주로 데이터를 정확히 읽고 해석하고 시각화할 수 있는 기술을 떠올린다. 하지만 그것은 리터러시의 절반일 뿐이다. 데이터를 ‘잘 읽는 것’보다 더 중요한 것은 그 데이터가 어떤 주장과 판단 구조 안에서 작동하는지를 이해하는 것이다. 다시 말해 데이터 리터러시는 고립된 기술이 아니라 논증이라는 사고 틀 안에서 재해석되어야 한다. 앞서 살펴본 논증 구조, 즉 상황 주장 이유 증거 전제라는 구성 안에서 데이터를 바라볼 때 비로소 데이터의 역할이 명확해지고, 데이터 분석 결과가 설득력 있는 의사결정으로 연결될 수 있다
일반적으로 데이터 분석은 논증 구조 중 ‘증거와 이유’의 사이를 메우는 역할을 수행한다. 예를 들어 “재택근무가 생산성을 높인다”는 주장에 대해 “업무 몰입도가 향상되기 때문이다”라는 이유가 주어졌 다면, 그 이유를 지지하기 위한 증거로 “지난 6개월간 재택근무자의 프로젝트 완료율이 평균 대비 12% 높았다”는 데이터를 제시할 수 있다. 이때 데이터는 그저 사실의 나열이 아니라 이유를 지지하는 ‘정당성의 도구’로 쓰인다. 즉 데이터는 논증의 가장 설득력 있는 지점인 ‘이유의 증거화’를 통해 논리를 강화 한다. 여기서 중요한 점은 데이터가 단순히 주장 자체를 정당화하는 것이 아니라, 주장과 이유 사이의 연결을 강화하는 방식으로 작동한다는 것이다.
하지만 데이터의 역할은 단지 ‘증거’에 국한되지 않는다. 논증의 모든 요소는 데이터 과학과 연결될 수 있으며, 각 요소마다 데이터 과학자가 기여할 수 있는 방식이 다르다. 예를 들어 상황 정의에서 데이터는 탐색적 분석과 외부 환경 분석을 통해 문제의 실체를 규명하는 데 도움을 줄 수 있다. 주장의 단계에서는 시나리오별 예측 모델링을 통해 선택지를 비교할 수 있다. 이유의 단계에서는 변수 간 인과관계를 분석 하거나 가설 검정을 통해 논리적 연결을 점검할 수 있다. 그리고 증거는 말할 것도 없이 실증적 자료를 제공하는 주된 수단이다. 마지막으로 전제는 문화적 맥락이나 조직의 철학처럼 수치화되기 어려운 요소 이지만, 텍스트 마이닝이나 정성 데이터 분석을 통해 일부 드러낼 수 있는 가능성도 있다.
아래는 논증 요소별로 데이터 과학이 기여할 수 있는 방식과, 각 요소에서 분석 시 고려해야 할 주요 사항을 정리한 표이다

이처럼 논증 요소 하나하나가 데이터 과학적 관점과 연결될 수 있으며, 분석가는 자신의 작업이 이 중 어디에 위치하는지를 명확히 인식해야 한다. 자신이 수행한 분석이 단순히 데이터를 정리한 것인지, 아니면 어떤 이유를 설명하는 것인지, 혹은 전제를 흔드는 해석을 제공하는 것인지 스스로 질문하는 과정이 필요하다.
예를 들어 한 교육 기관이 “온라인 강의가 오프라인 강의보다 효과적이다”라는 주장을 펴고자 할 때, 단순히 만족도 조사를 그래프로 제시하는 것만으로는 부족하다. 이때 논증 구조 안에서 데이터를 배치 하면 전체 흐름이 달라진다. 상황은 “코로나19 이후 온라인 강의가 일상화되었다”이며, 주장은 “온라인 강의가 학습 효과 측면에서 더 낫다”이다. 이유는 “개별 진도 조절과 반복 학습이 가능하기 때문”이고, 증거는 “반복 수강 비율이 높은 학습자의 평가 점수가 평균보다 15% 높았다”라는 분석 결과다. 전제는 “학습 효과는 학습자 만족도보다 성취도로 평가해야 한다”는 암묵적 기준이다. 이 논증 안에서 데이터 분석은 단순한 시각화가 아니라, 이유와 전제에 논리적 설득력을 부여하는 핵심 역할을 하게 된다.

결국 데이터 리터러시는 단순한 통계 기법 습득을 넘어, 데이터를 의사결정의 구조 속에서 사고하는 능력으로 확장되어야 한다. 데이터는 그 자체로 아무것도 주장하지 않는다. 주장을 설계하고 구조화하는 것은 사람의 몫이며, 데이터는 그 논리적 구조 속에서 설득력을 더하는 보강재일 뿐이다. 따라서 우리는 이제 데이터 리터러시를 ‘논증 구조 속 사고의 언어’로 다시 정의해야 한다. 그래야만 데이터 과학은 단순한 도구가 아니라 판단의 체계로 기능할 수 있다. 다음 장에서는 이러한 논증 구조와 더욱 직접적으로 연결된 추론 방식과 데이터 기법들의 관계를 살펴볼 것이다. 추론은 논증의 핵심 작동 방식이며, 데이터 분석 기법 역시 다양한 추론 구조와 닮아 있기 때문이다.
분석도 추론이다.
논증이 설득력 있게 작동하기 위해서는 단지 주장을 나열하고 근거를 덧붙이는 것을 넘어서, 그 주장과 근거 사이를 연결하는 추론의 과정이 명확해야 한다. 추론은 주어진 정보로부터 새로운 결론을 이끌어 내는 사고 방식으로, 논증의 핵심 작동 메커니즘이라 할 수 있다. 우리는 일상적으로 추론을 사용해 판단을 내린다. 그러나 이 추론이 어떤 방식으로 작동하는지 자각하지 않으면, 논증은 쉽게 비약으로 흐르거나, 오류가 포함된 채 받아들여질 수 있다. 데이터 분석 역시 마찬가지다. 데이터를 분석하는 대부분의 기법은 단순한 수치 계산이 아니라, 일정한 전제에서 출발해 의미 있는 결론을 이끌어내려는 추론의 도구다. 따라서 데이터 분석 기법을 제대로 이해하기 위해서는 그것이 어떤 추론 구조를 따르고 있는지를 파악할 필요가 있다.
추론은 크게 네 가지 방식으로 구분할 수 있다. 첫째는 연역적 추론으로, 일반적인 원리나 법칙에서 개별 사례를 이끌어내는 방식이다. 예를 들어 모든 사람은 죽는다, 소크라테스는 사람이다, 따라서 소크라 테스는 죽는다 같은 구조가 이에 해당한다. 둘째는 귀납적 추론으로, 여러 개별 사례로부터 일반적인 결론을 도출하는 방식이다. 세 번째는 가추적 추론인데, 이는 관찰된 현상에 가장 잘 들어맞는 설명을 역으로 구성하는 방식이다. 즉 가장 그럴듯한 원인을 추정해내는 것이다. 마지막으로 유추적 추론은 유사한 구조나 성질을 갖는 두 대상을 비교해, 한 대상의 특성을 다른 대상에도 적용하는 방식이다. 예를 들어 A학교에서 시도한 교육 정책이 성공했다면, 유사한 조건을 가진 B학교에서도 효과가 있을 것이라는 추론이 여기에 해당한다.
이러한 추론 방식은 데이터 분석 기법의 작동 원리와 매우 밀접하게 닮아 있다. 예를 들어 회귀 분석은 특정 변수들이 결과 변수에 어떤 영향을 미치는지를 추정할 때, 기본적으로 인과적 연역 또는 귀납적 구조를 따르고 있다. 시계열 분석은 시간 흐름에 따른 패턴을 일반화하려는 귀납적 추론의 대표적인 예다. 클러스터링은 가추적 사고와 유사하다. 주어진 데이터 속에서 어떤 패턴이나 그룹이 존재하는지, 즉 관찰된 특성을 설명할 수 있는 잠재적 구조를 역으로 구성해내기 때문이다. 분류(Classification) 기법은 유추적 추론과 닮아 있다. 이미 분류된 사례들과 유사한 특성을 가진 새로운 사례가 어떤 그룹에 속할지를 판단하는 과정이기 때문이다. 마지막으로 인과 추론은 명시적 전제와 개입 가능성을 고려하여 가장 논리적인 결론을 이끌어내는 연역적 추론의 전형에 가깝다.
다음 표는 추론 방식과 주요 데이터 분석 기법 간의 관계를 정리한 것이다

이처럼 데이터 분석 기법은 단지 기술적 도구가 아니라, 각각의 추론 방식을 체계화한 사고 방식의 표현 이다. 그래서 분석가는 단지 어떤 기법을 쓸 것인지가 아니라, 그 기법이 어떤 추론을 내포하고 있는지를 이해해야 한다. 그래야만 분석의 설계가 의사결정의 논증 구조와 자연스럽게 연결되고, 분석 결과 역시 판단 가능한 형태로 전달될 수 있다.
예를 들어 어떤 지방정부가 “청년 창업 지원이 지역 경제를 활성화시킨다”는 주장을 평가하고자 할 때, 다양한 추론 방식이 복합적으로 활용된다. 연역적 추론은 기존 문헌에 따라 창업 증가 → 고용 증가 → 경제 활성화라는 인과 체계를 전제로 정책 효과를 측정하려 한다. 귀납적 추론은 과거 비슷한 정책 시행 이후의 지역 경제 지표 변화를 살펴본다. 가추적 추론은 지역별 산업 생태계나 창업 생존율과 같은 특수 조건을 분석해 효과가 있는 지역과 없는 지역의 차이를 설명하려 한다. 유추적 추론은 유사한 경제 규모나 인구 구조를 가진 타 지자체의 사례를 근거로 효과를 예상한다. 이처럼 실제 의사결정 과정에서는 다양한 추론이 혼합적으로 작동하며, 각각은 다른 데이터 기법과 연계된다.
결국 데이터 분석을 잘한다는 것은 단지 정확하게 계산하고 깔끔하게 시각화하는 것을 의미하지 않는다. 그것은 논증 구조 안에서 자신의 분석이 어떤 추론을 기반으로 작동하고 있는지를 이해하고, 그 추론의 타당성과 한계를 스스로 점검할 수 있는 사고력을 갖추는 것을 의미한다. 분석가는 단지 데이터를 처리 하는 엔지니어가 아니라, 복잡한 판단의 맥락에서 어떤 추론이 합리적인지를 설계하고 검증하는 사고 설계자여야 한다. 다음 장에서는 이러한 관점을 바탕으로, 데이터 과학자가 더 높은 수준의 의사결정 능력을 갖기 위해 갖추어야 할 태도와 시대적 배경, 그리고 왜 지금 두 리터러시의 통합적 식견이 절실 한지 정리할 것이다.

데이터 과학자는 어떻게 의사결정 리터리시를 효과적으로 가질까?
지금 이 시대에 데이터 과학자에게 요구되는 역량은 이전과는 본질적으로 다르다. 과거에는 통계 기법에 능하고, 프로그래밍을 잘 다루며, 분석 도구를 다룰 수 있는 사람이면 충분했다. 그러나 이제는 단순히 데이터를 처리하는 능력만으로는 중요한 역할을 할 수 없다. 데이터 분석 그 자체보다 중요한 것은 그것이 ‘무엇을 위한 것인가’를 이해하고, 그 목적을 위해 사고를 구조화하고 판단할 수 있는 능력이다. 다시 말해, 데이터 과학자에게는 더 이상 데이터 리터러시만으로 충분하지 않으며, 의사결정 리터러시를 함께 갖춘 통합적 사고력이 필수적인 시대가 된 것이다.
이러한 변화의 배경에는 기술의 진화가 자리 잡고 있다. 특히 인공지능 기술의 급속한 발전은 전통적인 분석 기술의 가치에 근본적인 의문을 던지고 있다. 예전에는 분석가가 스스로 모델을 설계하고 데이터를 정제하며 가설을 검증해야 했지만, 이제는 많은 부분을 AI가 자동화할 수 있다. 예측 모델, 분류 모델, 군집화 분석 같은 기법은 대부분의 경우 오픈소스 툴과 자동화된 AI 플랫폼에서 기본 제공된다. 분석을 잘하는 사람과 그렇지 않은 사람 사이의 기술 격차는 빠르게 줄어들고 있다. 반면, 어떤 질문을 던질 것인가, 어떤 논리 구조로 판단을 설계할 것인가, 그리고 어떤 이해관계 속에서 결정을 도출할 것인가 라는 문제는 여전히 인간의 사고력에 달려 있다.
그래서 최근 데이터 과학의 중심이 점점 소프트 스킬 중심으로 이동하고 있다. 단지 코드를 잘 짜는 능력 보다, 복잡한 문제를 구조화하고, 팀 내에서 설득력 있게 의견을 제시하며, 타인의 관점을 이해하고 조율 할 수 있는 능력이 더 높은 평가를 받는다. 실제로 많은 조직에서 데이터 분석가 채용 시, 기술 테스트뿐 아니라 커뮤니케이션 능력, 프레젠테이션 역량, 맥락 이해도 등을 함께 평가한다. 특히 기업의 전략 기획 부서나 정책 결정과 연계된 공공기관에서는 분석 역량보다 문제 정의 능력과 판단 구조 설계 능력을 더 중요하게 본다. 이 변화는 단지 기술의 변화가 아니라 직무의 본질적 변화를 의미한다.

이러한 배경에서 데이터 과학자가 더 높은 의사결정 능력을 갖추기 위해서는 다음과 같은 사고 전환이 필요하다. 첫째, 데이터를 중심으로 사고하는 것이 아니라, 결정을 중심으로 사고하는 태도다. 분석은 판단을 위한 도구이지 목표가 아니다. 둘째, 데이터 분석을 논증 구조 안에 배치할 수 있어야 한다. 상황 주장 이유 증거 전제라는 논증 프레임 속에서 내가 생산한 정보가 어떤 역할을 하는지를 자각해야 한다. 셋째, 다양한 추론 구조에 대한 이해를 바탕으로 내가 사용하고 있는 분석 기법이 어떤 사고 메커니즘을 반영하고 있는지를 해석할 수 있어야 한다. 넷째, 의사결정자와의 대화를 통해 기술 언어를 전략 언어로 번역할 수 있어야 한다. 분석 결과를 잘 설명하는 것이 아니라, 분석의 핵심이 의사결정에 어떤 방식으로 기여할 수 있는지를 명확히 전달해야 한다.
이 모든 것은 결국 리터러시의 통합이라는 문제로 귀결된다. 데이터 리터러시와 의사결정 리터러시는 분리된 능력이 아니다. 앞서 보았듯 데이터는 이유와 증거를 강화하지만, 전제와 주장, 상황을 설계하는 것은 사고력의 몫이다. 이 둘을 함께 다룰 수 있을 때, 분석은 단지 정확한 결과의 제시가 아니라, 설득 가능한 판단의 구조를 만드는 작업으로 전환된다. 그리고 이것이야말로 오늘날 데이터 과학자가 의사결 정자로 성장하기 위해 반드시 갖추어야 할 역량이다.
우리는 데이터 중심 사회를 살아가고 있다. 그러나 동시에 판단의 책임은 여전히 인간에게 남아 있다. AI는 무한한 계산 능력을 제공하지만, 무엇을 계산할 것인가는 결국 사람의 몫이다. 데이터를 다루는 모든 사람은 이제 ‘정보를 제공하는 사람’이 아니라, ‘판단을 설계하는 사람’이 되어야 한다. 그 시작은 바로 데이터 리터러시와 의사결정 리터러시를 하나의 사고 체계로 통합해 이해하는 데 있다. 그것이 이 시대의 데이터 과학자에게 요구되는 가장 중요한 식견이다.
