통계 이야기

학교 통계 교육에서 데이터 윤리

권나영 ㅣ 인하대학교 수학교육과 교수

우리나라 수학과 교육과정은 학교 수학을 몇 개의 영역으로 나누고 있다.
통계와 관련된 영역은 영역명에서 꾸준히 변화해 왔는데, 2009 개정까지는 학교급에 상관없이 ‘확률과 통계’라는 영역명을 유지하다가 2015 개정에서부터 초등학교에서는 ‘자료와 가능성’ 이라는 이름으로, 중·고등학교는 ‘확률과 통계’라는 영역으로 바뀌었다.
그리고 최근 개정된 2022 개정 교육과정부터 초·중학교에서는 ‘자료와 가능성’이란 영역명을 사용해 초등학교와 중학교의 연계성을 강화하고, 고등학교는 선택과목명으로 ‘확률과 통계’를 사용한다. 영역명이나 과목명 및 학교 교육에서 가르치는 내용과 범위의 차이는 사회 및 교육환경 변화에 따른 교육과정 설계 변경에 따른다.

그렇다면 학교 수학에서 통계와 관련된 영역은 왜 꼭 필요할까?

1

21세기는 디지털화가 가속되면서 데이터 수집 및 저장, 분석 수요가 많아지고 이에 따라 사회를 살아가는데 필요한 통계와 관련된 소양을 기르는 것이 중요해졌다. 학교 수학에서는 학년에 따라 통계 관련 개념 등의 내용을 배우고 자료 수집 및 분석 관련 활동을 한다. 이 활동을 통해 학생들은 통계적 소양을 기를 수 있다.
통계적 소양은 명확히 정의된 연구는 없지만, 대체로 자료를 조직하고 표를 작성하고 자료를 다양한 표현으로 나타내는 기능들로 이루어져 있고, 통계적 정보나 연구 결과를 이해하는데 이용된다고 한다.
통계적 소양은 단순히 통계적 지식이나 기술 습득에 그치는 것이 아니라, 실생활에서 접하는 통계 정보나 자료, 현상들을 해석하고 비판적으로 평가하고 이렇게 정리된 정보로 의사소통을 하는 것 등 사회로 나아간 이후의 삶과도 관련된다.
우리는 의사결정을 할 때 데이터에 의존한다. 그런데 데이터가 왜곡되어 있어 결정에 문제가 생길 수도 있고 데이터를 처리하는 능력이 부족할 수도 있다.
데이터를 분석하는 과정을 컴퓨터나 공학 도구에게 맡겨서 처리 능력을 해결할 수도 있지만, 그렇다고 해석상의 오류나 의도적인 결과 해석으로 인해 발생하는 통계 윤리의 문제는 여전히 남아있다. 이렇게 데이터를 다루는 일에서 발생하는 문제점들을 데이터에 대한 윤리 이슈라고 한다.
구체적으로는 데이터 생성에서부터 활용에 이르는 전 과정에서 개인의 사생활을 보호하고, 데이터의 신뢰성과 투명성을 유지하며, 사회적 책임을 다하기 위해 필요한 기준을 데이터 윤리라고 한다. 지금부터는 학교 수학에서 통계와 관련된 활동을 할 때 지켜야 할 데이터 윤리에 대해 논의하려고 한다.
학교 수학에서 데이터 윤리를 논의하기에 앞서 한 일화를 살펴보겠다.

2024년도 2학기에 학교현장실습학기제에 참여하는 한 예비교사의 수업을 참관한 적이 있다. 마침 중학교 1학년 자료의 정리와 해석 단원 마무리 시간으로 학생들이 만든 통계 포스터 발표가 있었다.
학생들은 조를 나누어 조사하고 싶은 주제별로 자료를 조사하고 그 결과를 통계 수업 시간에 배운 그래프나 그림을 이용해 분석 자료를 만들고 발표하는 시간이었다. 학생들은 개인적으로 궁금한 질문들(예를 들어, 점심 메뉴로 무엇을 선호 하는지, 키가 얼마인지 등)을 반 학생들 또는 다른 반 친구들에게 물어보고 자료를 수집한 뒤, 막대 그래프, 원 그래프, 꺽은선 그래프 등 다양한 모양으로 포스터를 만들어 발표하였다.
조별 활동으로 진행되어, 조원들의 이지통계나 엑셀 등을 이용해 자료를 입력하고 원하는 모양으로 만들어내고 의미 있는 분석을 하는 등의 능력에서 차이도 있었고, ppt로 만드는 능력에서의 차이, 발표자의 발표 능력에 따른 전달력에서 차이가 있는 등 재미있는 수업이었다.

2

이 일화를 보면 최근 중학교에서 많이 하고 있는 통계 관련 발표대회나 포스터대회를 떠올릴 수 있다. 물론 수학 시간에 수행 평가로도 많이 진행되고 있다.
이런 활동을 통해, 예전 학교 수학 교육과정에는 통계 단원에서 이론적으로 자료를 표와 그래프로 표현하는 방법, 이를 분석하는 방법을 다루던 것과 달리, 최근에는 학생들이 직접 자료를 수집하고 그 자료를 표현하고 분석하는 과정을 하는 활동으로 바뀐 것을 알 수 있다.
실제로 1990년대 중반에 등장한 “빅데이터”라는 용어가 2000년대에 들어와서 학계와 산업계의 주목을 받기 시작하였고, 2010년 초반부터 교육 분야에서도 러닝 어낼러틱스(Learning Analytics)라는 개념과 함께 빅데이터가 주목받게 되면서 데이터와 관련된 통계 교육이 중요해지기 시작하였다.
우리나라는 2009 개정에서부터 최근 2022 개정 교육 과정 문서에 이르기까지 통계 영역에 실생활 소재를 가지고 자료를 조사하고 표나 그래프로 표현하고 의미를 해석하는 내용을 강조하면서 실제 수업에서도 변화가 나타나기 시작하였다.
2009 개정 교육과정 이후부터 과정 중심 평가를 위한 수행평가의 한 예로 통계 포스터가 많이 활용되면서 그 변화는 더욱 두드러졌다. 이런 수업 활동 들은 학교 교육과정에서 이론적이기만 하던 통계 교육이 실제 맥락에서의 통계 교육으로 바뀌고 있는 현실을 엿볼 수 있게 한다.
교사교육자로서 저자는 일화에 있던 수업을 참관 하면서 예비교사가 실습 중 수업에서 학생들이 무슨 자료를 수집하게 하고 어떻게 분석하고 분석결과를 어떻게 표현하게 했는가 등에만 집중하였다. 그런데 여기서 한 걸음 더 나아가, 학교 수학에서 데이터 윤리를 함께 고려해야 한다고 주장하고 싶다. 다음 일화를 살펴보자.

2024년도 9월 즈음 아들이 아침에 학교 갈 준비를 하다 말고 갑자기 채팅방을 보고 있기에 뭘 하는지 물어봤더니 수업에서 하는 설문이라며 빨리 답해줘야 한다고 얼른 버튼을 눌렀다. 무슨 설문인지 물었더니 수학 시간에 발표를 해야 해서 조별로 질문을 만들고 반에서 운영하는 채팅방에 올려서 답을 받아서 정리해서 발표를 한다는 것이다
보아하니 통계 시간에 발표를 위한 설문이었던 것 같다. 그런데 질문이 “너가 자주 사용하는 앱이 무엇이냐?”는 걸 물어보는 단 하나였다.
여기서 갑자기 의문이 들었다. 반 애들을 대상으로 질문을 해서 자료를 수집하는데, 응답을 받아도 되는지에 대한 동의 절차 같은 건 없을까 하는 거였다. 아들에게 물어 봤더니 그런 건 선생님이 하라고 하지도 않았고 답만 받아서 숫자만 정리하면 된다고 하였다. 자료를 정리하고 발표를 하는데, 과연 숫자만 필요한 걸까?

이 글을 읽고 있는 독자들은 이 일화를 보면서 반 친구 들을 대상으로 간단한 질문을 물어보고 결과를 정리해 발표하는데 무슨 데이터 윤리까지 생각해야 하는가라고 여길 수도 있다. 그런데 앞에서도 밝혔듯이 데이터 윤리는 데이터 생성에서부터 활용에 이르는 전 과정에서 필요한 기준이다.
학생들이 학교에서 하는 통계 수업에서의 설문조사는 사실 통계 업체에서 하는 설문조사와는 비교가 되지 않을 정도로 단순하고 짧은 질문 수준이라고 생각할 수 있다. 하지만 학생들은 이 과정에서 설문조사라는 개념을 알게 되고 이런 식으로 타인의 개인 정보를 수집하는 과정을 아주 간단한 방식으로 경험하게 된다. 이 첫 과정에 타인에게 개인적인 질문으로 정보를 수집하는 행위를 하기 전에 이 질문에 대한 응답을 수업 자료로 써도 되는지 동의를 얻는 과정이 필요하다는 것을 알려 주어야 한다. 이것은 데이터 윤리 교육의 가장 첫 걸음 이다.
우리는 학교 통계 교육에서 통계 전문가를 길러내려는 것이 아니라, 앞으로 사회에서 삶을 살아가기 위해 필요한 통계적 소양을 기르기 위해 쉽고 초보적인 방식 으로 자료 수집과 분석의 과정을 경험하게 한다. 이 학생들이 나중에 커서 길거리에서 설문조사원을 만나 설문에 응답하게 될 수도 있고, 자신의 분야에서 필요한 설문 조사를 자신이 만들게 될 수도 있다. 이럴 때 데이터 윤리를 알고 있다면 자신이 원하지 않는 설문조사에 응하지 않아도 된다는 사실을 알고 그에 대응할 수 있을 것이고 설문조사를 만들어야 한다면 이 때 필요한 원칙들을 지키기 위해 노력할 것이다.
데이터 윤리를 지키지 않은 자료 수집과 분석의 문제점을 알게 하는 가장 손쉬운 방법은 자료 수집과 분석을 처음 경험하는 학교 통계 교육 단계에서 언급하는 것이라고 생각한다. 이 단계는 처음 통계를 접하는 순간이기 때문에, 통계를 다루기 위해 필요한 내용과 기능에 대한 것뿐만 아니라 기초적인 윤리에 대해서도 함께 배우는 것이 중요하다.

3

디지털 기반 사회에서 빅데이터는 계속 생성되고 우리 들은 매일 데이터가 관련된 환경에 노출될 것이다. 우리 자신이 관련된 데이터는 어떤 식으로든 생성되고 활용 하고 활용당할 수 있음을 인식하는 것이 중요하다. 학교 통계 교육은 학생들에게 이러한 인식을 생성하게 하는 첫 경험을 주게 될 것이다.
지금 교사에게 요구하는 것은 교사가 통계 전문가가 되기를 바라는 것이 아니라, 통계 시간에 관련된 활동을 하면서 학생들에게 가장 기본적인 데이터 윤리에 대한 것도 함께 노출하기를 바라는 것이다. 예를 들면, 학생들에게 데이터 윤리의 정의에 대해 한 번 알려줄 수도 있고, 설문조사 등의 자료 수집 활동에서 유의점 등으로 설명할 수도 있다. 중요한 것은 데이터 윤리라는 것이 통계를 하는 과정에 중요한 원칙이라는 인식을 심어주는 것이다.
빅데이터를 생성하고 분석하는 것은 기계와 기술로 대체될 수 있을 지라도 그 기술로 발생할 수 있는 문제에 대응하기 위해 맥락과 상황에 맞는 윤리 원칙을 세우는 것은 인간의 역량이다. 인공지능과 디지털 사회가 발전될수록 데이터 윤리는 점점 더 정교화될 것이고 그 기준을 정립하고 활용하기 위해서는 학생 시절 통계 관련 활동에서 데이터 윤리에 대해 직접 경험하고 실천해 보는 것이 가장 좋은 교육이 될 것이다.