FOCUS

의료 빅데이터의
효과적인 관리 및 활용

박세환 | (주)기술법인 엔펌 전문위원 Ph.D

Ⅰ. 서언

한 사람이 기대 수명(예상 수명1)) 주기 동안 생산하는 의료 데이터(인적 정보/건강보험정보/진료정보/진료관리 요약정보/사망기록정보 등)는 1,106.4TB(TB : 1012 byte)(1,100TB의 외생 데이터(행태적/사회경제적/환경적 요소로 구성), 6TB의 유전체 데이터, 0.4TB의 임상데이터)를 생산한다고 한다[1].

컴퓨터과학을 이용한 의료 빅데이터 분석 기법 등이 의과학(의료정보학/바이오 정보학/바이오 통계 등) 분야에서 ICT 기술과 융합되고 있다. 이에 따라 만성질환 및 난치성 질환과 유전체학(Genomics) 등에 적용되면서 기대 수명도 획기적으로 늘어나고 이와 함께 개인의 의료 정보도 가파르게 증가하고 있다. 이러한 의료-ICT 융합 기술의 발전은 보건 의료와 생명과학 산업 활성화에 크게 기여하고 있다. 아울러 이들 기술융합은 환자, 의료진 및 바이오 제약회사 간에 보다 밀접한 상호작용 관계로 이어지면서 시너지효과를 도출하고 있다. 특히 의료 빅데이터 분석기법은 이러한 상관관계를 더욱 향상시키는 데 크게 기여하고 있다. 보건의료 서비스 제공자와 의약품 제조사들은 개인뿐만이 아니라 특정 만성질환 및 난치성 질환자로부터 각종 질병 예방의학 등을 탐색하고 분석하는 능력을 제공하고 있기 때문이다[2].

국내 건강관리기관(질병관리본부/건강보험심사평가원/국민건강보험공단 등)이 보유하고 있는 의료 빅데이터(바이오, 헬스케어 등 포함)는 기업이나 의료기관 등이 보유한 임상데이터와 결합되어 개인 맞춤형 의료 서비스(하드웨어/상품/플랫폼/솔루션 등)와 신약 개발에 활용되고 있다. 최근에는 의료 빅데이터를 이용하여 희귀질환 치료제 개발과정에서 임상시험 대조군을 대체하고 있다.

또한 유전자분석 정보를 활용하여 환자의 약물 반응성을 파악하여 약물치료 효과를 향상시켜 가고 있다[2]. 이처럼 가명 정보 기반의 의료 빅데이터 활용은 의료서비스 패러다임 변화를 통해 사회적 비용을 감소시키면서 다양한 개인 맞춤형 의료 서비스 산업을 활성화시키고 있다. 의료 빅데이터를 이용한 선진 의료서비스가 효과적으로 정착되기 위해서는 민감성 의료 정보의 안전한 관리와 데이터 활용의 윤리적 책임 의식이 제고되어야 한다[3].

이 연구에서는 의료-ICT 기술 융합을 통해 의료 빅 데이터 분석 기법에 대한 새로운 해법을 제시하고 있는 유전자 서열 분석 기술, 데이터 분석에 필요한 장치를 갖추고 의료 빅데이터의 예측 기능을 제공하는 의료 빅데이터 분석 기술, 다양한 –omics 기업 및 학계와 협력하여 맞춤형 약품 개발에 주력하고 있는 신약 개발 기술 등 의료-ICT 융합 기술의 획기적인 발전 양상을 소개한다. 아울러 데이터 3법(개인정보보호법/정보통신망법/신용정보법)이 개정되면서 개인의 의료 빅데이터를 비식별화하여 민간 연구자에게 제공하는 것이 가능하게 된 의료 빅데이터 활성화를 위한 정책적 이슈를 기반으로 첨단 ICT 기술을 접목한 4차 산업혁명 시대 의료산업에 필수 요소로 주목받고 있는 의료 빅데이터 구축의 토대가 된 의료 빅데이터 활성화와 데이터 3법에 대해 설명한다.

또한 의료-ICT 융합 기술 분야에서 빠르게 확대되고 있는 주요 의료 빅데이터 활용 사례를 소개한다. 끝으로 데이터 3법의 핵심 사항인 민감성 의료정보 활용에 따른 리스크 최소화, 민감성 정보의 활용 방법에 대한 가이드라인, 임의의 장소로 의료 빅데이터의 안전한 이동, 손쉽게 의료 빅데이터를 생성-획득할 수 있는 방법, 의료 빅데이터의 supply chain에서 개인 의료 정보 보안을 위한 법적/제도적 기반 등 의료 빅데이터 효과적인 관리 및 활용에 따른 시사점을 제시한다.

Ⅱ. 의료-ICT 융합기술 발전 패러다임

1. 개요

한국은 전 세계에서 유례없이 빠른 속도로 고령화가 진행되면서 2017년 11월 1일 기준, 65살 이상 노인인구가 712만 명으로 전체 인구의 14%를 웃도는 고령사회 진입이 확정되었다.2) 고령사회의 진입은 지난 수십 년간 경제성장을 이끈 인구효과가 앞으로는 한국 경제의 최대 리스크 요인이 될 것이라는 우려가 있다. 이에 바이오-ICT 융합 기술(개인 맞춤형으로 최적화된 건강진단 및 질병예방 기술)을 활용하여 웰 빙(well-being) 마인드를 지향한 효율적인 의료 서비스가 필요하다.

이처럼 4차 산업혁명 시대 바이오(의료)-ICT 융합산업의 급속한 확산과 함께 고령사회의 급속한 진행으로 인해 노령 질환 및 만성질환자들이 지속적으로 늘어나고 있는 추세이다. 이에 개인의 유전 및 건강 상태에 따른 맞춤형 건강진단 및 질병예방 기술이 요구된다. 개인 맞춤형으로 최적화된 의료 서비스를 제공하기 위해서는 다양한 바이오-ICT 융합 기술(의료-ICT 및 모바일 헬스케어 기술, 질병 및 환자 관리를 위한 바이오센서 및 생체 인식 기술, 의료 정보화 및 원격의료 시스템 기술 등)이 적용되어야 한다. 이러한 기술들을 구현하여 최적화된 의료서비스를 제공하기 위한 의료-ICT 융합 기술 트리를 [표 1]에 나타낸다[4].

1) 2020년 기준, 인간의 평균 기대 수명은 전 세계 73세, 한국은 이보다 무려 11년이 많은 평균 84세를 기록한 것으로 나타났음
2) UN에서는 노인인구 비중이 7% 이상이면 고령화사회, 14% 이상이면 고령사회, 20% 이상이면 초 고령사회로 구분하고 있음

의료ICT 융합 기술트리

2. 유전자 서열 분석 기술

의과학 기술이 ICT와 융합되면서 반도체와 나노-포어 시퀀싱(nano-pore sequencing) 기술에 기반을 둔 새로운 서열 분석(제3세대 및 제4세대 DNA 서열분석 등) 기술들이 유전체 및 전사체(轉寫體, transcriptomes3)) 분야에 적용되고 있다[4]. 특히 제4세대 염기서열 분석 기법(4th generation sequencing technique)으로 나노 포어 시퀀싱 기술이 매우 유망한 단분자 검출 방법을 이용하여 다양한 분석물질의 식별과 정량화에 이용되고 있다[5].

이들 신기술은 대규모의 유전자 서열 분석을 통해 의료 빅데이터 분석 기법에 대한 새로운 해법을 제시하고 있다. 나아가 이러한 연구를 통해 인간 유전체와 같은 어려운 문제를 해결해 가고 있으며, 바이오 의학에서의 이러한 빅 프로젝트는 신약 개발 및 진단 검사 등의 연구를 가속화시키고 있다. 이에 연구자들은 대량의 개인 의료 빅데이터를 취급하는 데 있어 우선적으로 개인정보보호에 주의할 의무가 있다.

아울러 차세대 DNA 서열 분석 기술을 활용하여 데이터 세대로부터 임상가와 연구자들에 다양한 연구결과(유전체학(Genomics) 및 전사체학(Transcriptomics) 등)를 제공해야 한다. 이에 대한 대표적인 연구사례로는 2016년 단계별 솔루션을 제시하여 Nature지에 게재된 ‘1000 Genome Project Consortium and 1000 Genomes Project data(이하 1000 Genome Project)’가 있다. 아울러 이를 기반으로 2017년 Maher와 ENCODE Project Consortium이 제시한‘ENCODE(Encyclopedia of DNA Elements)’을 들 수 있다. 이들 연구 결과를 간단히 요약하면 [표 2]와 같다[7][8][9].

차세대 DNA 서열분석 기술을 활용한 연구결과

이러한 프로젝트를 통해 도출된 정보들은 유전학계와 생물학계에서 가장 많이 활용하고 있다. 아울러 유전체에 대한 전문지식을 응용하여 질병 표현형들을 이해함으로써 신약개발에 적용하고 있다. 이에 차세대 DNA 서열 분석 기술을 활용한 다양한 –omics 기술 발전에 크게 기여하고 있는 것으로 평가받고 있다[2].

3. 의료 빅데이터 분석 기술

대부분의 의료 빅데이터는 정량화되지 않은 정보들이기 때문에 기존의 DBMS(Data Base Management System)를 통해 분석하기에는 어려움이 있다. 이에 최적의 의료 빅데이터 분석 기법은 연구자가 안전한 방식으로 대량의 개인 의료데이터를 분석하는 데 필요한 데이터 저장 장치, 대용량 서버 및 정보처리 등의 기능을 갖추고 있어야만 한다. 이러한 의료 빅데이터의 예측 기능이 최근 공중보건 및 의과학 분야에서 활용되고 있다.

인터넷을 통해 확보한 방대한 정량화되지 않은 무작위 수집 데이터로부터 얻은 지식을 가공하는 인공지능(AI) 기반의 컴퓨터 도구들이 개발되어 바이오의학 및 생명과학 등 다양한 분야(AI의 전후방 기술인 자연언어처리(NLP : Natural-Langue Processing), 패턴인식 및 기계학습(Machine learning) 등)에 적용되고 있다. 이러한 사례로 공간적인 지도를 이용하여 질병을 추적하는 GT와, 방대한 양의 의료정보를 분석하여 진단을 결정하는 빅데이터 분석 기법인 Google Trends(GT) 질병 추적 알고리즘이 있다. 이중 특히 의료-ICT 기술 융합 시장에서 주목받고 있는 구글의 GT의 특징을 간단히 요약하면 다음과 같다[10].

- 질병 유행지역에서 바이오의학 분야의 빅데이터 분석을 응용하여 질병의 추적과 모니터링을 가능하게 하고 있음
- 특정 지역에서 응급실을 방문하는 환자 수가 증가하기 전에 플루(flu) 증세와 플루 치료와 같은 Google 탐색요구들의 급격한 증가 추세를 빅데이터 분석 기법을 통해 검증하였음

3) 발현된 모든 RNA의 총합으로 주로 마이크로 어레이를 이용하여 유전자들의 기능을 총체적으로 네트워크로 이해할 수 있는 기본 자료와 분석 방법을 제공하고 있음

4. 신약 개발 기술

제약 산업은 다양한 –omics 기업 및 학계와 협력하여 환자의 유전적 코드에 기초한 맞춤형 약품을 개발하는 데 주력하고 있다. 주요 사례로 Vertex Pharmaceuticals가 있다. 이는 낭포성 섬유종(CF : Cystic Fibrosis) 프로젝트에서 200명 이상의 학자와 공동연구를 통해 개발된 것이다. 이 연구에서는 소프트웨어를 이용하여 50만 개 이상의 화합물을 스크리닝 하는 것을 목표로 하였다.

이 프로젝트는 실제로 수천 개의 화합물 조합을 스크리닝 하여 해당 환자의 4%에 영향을 주는 특이한 DNA 돌연변이를 가진 집단의 CF 환자 치료에 도움이 되는 신약을 개발함으로써 의료-ICT 융합 기술 시장을 견인하고 있다. 특히 이러한 표적 치료는 맞춤형 의학 프로그램을 통해 복잡한 질병(희귀질환 및 암 등)에 대한 새로운 치료법을 제시한 것으로 평가받고 있다.

이 경우에도 의료 빅데이터 분석 도구는 매우 중요한 역할을 제공하고 있다. 특히 암 환자를 스크리닝 하는 알고리즘을 이용한 맞춤형 CAD(Computer-Aided Diagnostics : 컴퓨터 지원 진단학)은 환자 진료의 질을 향상시키면서 획기적인 시간 절약 사례로 평가받고 있다[3].

Ⅲ. 의료 빅데이터 활성화와 데이터 3법

1. 의료 빅데이터 활성화를 위한 정책적 이슈

데이터 3법4)이 개정되면서 특정 목적으로(산업적 목적, 과학적 연구와 통계 작성 및 공익적 기록 보존 등) 각 건강관리기관에 분산된 개인의 의료 빅데이터를 연계·통합한 후 비식별화(de-identification)를 통해 민간 연구자에게 제공하는 것이 가능하게 되었다5). 이를 통해 기업과 기관이 안전하게 가명 정보를 활용할 수 있는 방법과 기준 등을 수립할 수 있을 것으로 기대하고 있다.

데이터 3법에서는 ‘정보통신망 이용촉진 및 정보보호 등에 관한 법률’의 우선 적용 규정을 삭제함으로써 ‘개인정보보호법’과의 중복 규제 문제를 해결하였다. 다만, 사람을 대상으로 하는 연구에는 ‘생명윤리 및 안전에 관한 법률 생명윤리 및 안전에 관한 법률6)’이 우선 적용되기 때문에 이 법률에서 정하지 않은 경우에 대해서는 ‘개인정보보호법’을 적용받게 된다[1]. 다만, ‘개인정보보호법’에서 규정하고 있는 가명 정보처리 특례 규정과는 무관하다고 볼 수 있다. 이에 개인의 민감성 의료 정보를 가명 처리하기 위해 당사자의 서면동의가 필수사항인 ‘생명윤리 및 안전에 관한 법률’을 보다 유연하게 개정할 필요성이 대두되고 있다.

2. 의료 빅데이터 구축 이슈

첨단 ICT 기술(AI(인공지능), 클라우드 컴퓨팅 등)을 접목한 의료 데이터 수집은 4차 산업혁명 시대 의료산업 육성에 필수적인 요소로 주목받고 있다. 데이터 3법 개정을 통해 의료 빅데이터를 적극 활용함으로써 특정 개인의 가명 정보를 이용한 의료정보를 공유할 수 있게 되었다. 이로써 기존의 의료 데이터 활용 범위를 확대하여 빅데이터 기반 제품과 서비스의 질 개선 및 신규 비즈니스 모델을 기대하고 있다. 나아가 기업이나 의료기관 등이 보유한 임상데이터를 결합하여 임상 의사결정 지원, 개인 맞춤형 의료서비스(하드웨어/상품/플랫폼/솔루션 등) 등 매우 다양한 서비스를 제공할 수 있을 것으로 전망된다.

이에 따라 해외 주요 국가 규제 기관들은 의료 빅데이터 활용을 증가시켜 가고 있으며, 국내에서도 의료 빅데이터 활용을 강화하여 100만 명 규모의 바이오 빅데이터가 구축되고 있다. 의료 빅데이터 활용 강화 분야로는 개인 맞춤형 의료 서비스, 의료 서비스 질과 안전성 향상, 임상 의사결정 지원 등이 활성화되고 있다[1][2]. 2018~2020년 말까지 국내 주요 의료 빅데이터 구축 사업을 요약하면 다음과 같다[1][6].

- 데이터 경제 활성화 규제 혁신을 목표로 112억 원의 예산을 투자하여 2020.12월까지 39개 의료기관과 7개 기업에 바이오 헬스 빅데이터 구축 사업(전자의무기록제도(EMR)의 표준화 및 네트워크 재구축 등)을 추진하였음
- 의료기관이 보유한 의료 데이터를 공통데이터모델(CDM : Common Discovery Manager7))로 표준화하고 데이터 분석 소프트웨어를 개발하여 플랫폼을 구축하였음
- 건강보험심사평가원은 국제표준 공통데이터모델(CDM) 데이터8)를 개방하여 코로나19 관련 후유증, 이상 반응 등의 연구를 지원하고 있음
- 보건의료 데이터 생태계 활성화를 위해 100만 명 규모의 바이오 빅데이터를 구축하고, 2029년까지 데이터 중심 병원을 5곳을 지정하여 5대 의료 빅데이터 플랫폼(공공기관/AI 신약개발/병원 임상/피부/유전체)을 구축할 계획임

4) 4차 산업혁명 시대 핵심 자원인 데이터의 이용 활성화를 통한 신산업 육성이 국가적 과제로 대두되면서 데이터 이용을 활성화하고자 하는 개인정보 보호법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률(정보통신망법), 신용정보의 이용 및 보호에 관한 법률(신용정보법) 등 3가지 법률을 통칭(대한민국 정책브리핑 https://www.korea.kr/special/policyCurationView.do?newsId=148867915)
5) 데이터 3법 개정 이전 까지는 개인식별정보/유전정보/개인의 포괄적인 건강에 관한 정보 등 매우 민감한 개인의 의료정보를 취급하기 위해서는 명시적/개별적/구체적인 당사자의 사전 동의가 있어야만 했음. 그렇지만 당사자의 사전 동의를 받기에는 여러 제한요인(법/제도, 기관 간 단절, 연계시스템 등)이 있어 기관별로 분산된 보건의료 빅데이터 간 연계는 사실상 불가능한 상황이었음
6) 생명윤리 및 안전에 관한 법률(생명윤리법) : 인간과 인체유래물 등을 연구하거나, 배아나 유전자 등을 취급할 때 생명윤리 및 안전을 확보하고 국민의 건강과 삶의 질 향상에 이바지 함을 목적으로 마련된 법률(2019.04.23 일부개정, 2019.10.24 시행)
7) 자원별 의미, 길이 및 값의 제한사항을 식별하여 고객의 비즈니스 자원과 구성요소 간 데이터 교환을 위해 사용되는 정의 언어로서 DMTF(Distributed Management Task Force) CIM(Common Information Model) 표준, 비즈니스 프로세스 표준, 도메인 특정 표준을 포함하고 있음
8) 제공하는 CDM 데이터는 2021년 한 해 동안 의료서비스를 이용한 전체 환자에서 층별 20%(약 1천만 명) 표본 추출, 대상 환자 2018.1~2022.4월까지의 청구데이터를 CDM으로 변환한 데이터들임

Ⅳ. 주요 의료 빅데이터 활용사례

컴퓨팅 머신과 인터넷망을 통해 질병을 관리하는 도구들이 빠르게 확대되고 있다. 이러한 사례로서 데이터 저장장치는 환자의 질병 유형에 맞는 최적의 약품을 효과적으로 검색하는 맞춤형 의학을 통한 의료 서비스를 지원하고 있다[11]. 의료-ICT 융합 관련 글로벌 기술 시장을 주도하고 있는 메이저 기업들의 주요 의료 빅데이터 활용사례를 간단히 요약하면 [표 3]과 같다.

의료ICT 융합 메이저 기업

Ⅴ. 의료-ICT 융합기술 TRM

의료-ICT 융합 기술을 효과적으로 구현하기 위해서는 [표 1]에 나타낸 바와 같은 3대 핵심기술(웨어러블 플랫폼 설계기술, 웨어러블/스마트 연동기술, 유전체분석 기술)과 이에 따른 세부 기술 분야에 대한 R&BD가 필수적으로 요구된다. 이를 위해 바이오-ICT 융합기술의 전방위 산업군으로 포지셔닝 되어 있는 스마트 헬스케어 기술개발 로드맵(TRM)에 따라 핵심기술을 개발하는 데 주력할 필요가 있다[4][6]. ([표 4] 참조)

스마트 헬스케어

이러한 TRM 추진을 통해 바이오-ICT 융합 기술 개발을 위한 기초전략을 수립하고, 세부 기술 개발 방향에 맞는 기술개발을 통해 글로벌 시장진출을 위한 다음과 같은 전략이 필요하다.
- 맞춤형 건강진단 및 질병 예방을 위한 웨어러블 기기 플랫폼 설계기술 개발
- 웨어러블 기기 플랫폼과 스마트폰 연동 기술 개발
- 정밀 의료 서비스를 위한 ICT를 활용한 유전체 분석 기술 등

Ⅵ. 시사점

데이터 3법의 주요 핵심은 가명 정보 개념의 도입을 통해 개인정보 판단기준을 명확화하는 것으로 요약할 수 있다. 이를 위해 관련 법률 간 유사/중복 규정을 정비하여 추진체계를 일원화하고, 개인정보처리자의 책임을 강화하고 있다. 특히 가명 정보 개념을 도입하여 개인정보가 포함된 민감성 의료 빅데이터를 가공하여 특정인을 알아볼 수 없도록 할 필요가 있다.

아울러 이를 미래 의료 서비스에 활용할 수 있는 법적 근거를 마련할 필요가 있다. 이를 통해 디지털 의료서비스 산업 발전에 크게 기여할 수 있을 것이다. 이는 곧 건강관리기관 및 의료기관 등에서 다양한 목적으로 보다 폭넓게 개인정보를 활용할 수 있게 됨으로써 의료 빅데이터 관련 산업의 동반 성장을 견인할 수 있을 것이다. 이에 관련 산업 현장이나 연구기관 등에서는 민감성 의료 정보 활용에 따른 리스크를 정확하게 판단하고 이를 최소화하는 데 주력할 필요가 있다[12].

정보 주체의 사전 동의 없이 처리가 가능한 가명 정보처리는 의료 빅데이터 플랫폼 사업에 중요한 전환 요소이다. 개별 추가 서면동의 없이 바이오/의료정보 중심으로 연계 및 통합이 가능하기 때문에 단기간 내 대규모 바이오 빅데이터 구축이 가능할 수 있기 때문이다. 이에 데이터3법 개정안의 해석 및 적용을 통해 규제완화정책과 개인정보보호 정책 간에 대립을 방지할 수 있는 방안이 필요하다. 이는 특정 개인의 유전자분석 정보나 임상 정보 등 민감성 정보의 수집/연계/공유 방법에 대한 가이드라인을 마련할 필요가 있음을 시사하고 있다[3].

생물학적 및 의학적 데이터를 취급하는 의료 빅데이터(의료정보)는 다른 데이터 연구에 비해 매우 엄격한 supply chain(생성-획득-저장-이동-확보-이용-폐기)을 요구한다. 특히 데이터의 저장-이동-확보 비용보다 전 단계인 생성-획득 비용이 더 적게 드는 특징이 있다. 이에 미국 국립바이오기술정보 센터(NCBI : National Center for Biotechnology Information)에서는 1988년 이후부터 바이오의학 분야에서 손쉽게 의료 빅데이터를 생성-획득할 수 있는 방법을 개발하는 데 주력해왔다[9][11]. 아직 의료 빅데이터의 저장-이동-확보와 관련된 저렴하고 안전한 해결책을 제시하는 기업은 그리 많지 않은 상황이다. 이는 미래 바이오의학을 포함한 의료-ICT 융합연구가 실험실과 연구소를 벗어나 제품화(상품/솔루션 등) 하기까지 많은 과제가 남아 있다는 점을 시사하고 있다.

또한 의료 빅데이터는 하드디스크를 통해 다른 곳으로 이동시킬 수 있기 때문에 이동 과정에서 데이터가 손실되지 않도록 데이터 압축 소프트웨어 등이 필수적이다. 데이터 저장-이동-확보를 위한 Globus Online은 데이터 과학자들을 위한 Dropbox 유형의 원스톱 서비스로 SaaS(Software as a Service)를 제공하고 있다. 최근에는 의료 빅데이터를 다른 위치로 옮기면서 동시에 데이터처리가 가능한 클라우드 컴퓨팅 기반 해결 방법이 개발되면서 데이터 이전과 잠재(latency) 과정을 실행하는 도구로 주목받고 있다. 이는 저장 공간이 확보되지 않은 곳에서 생성되는 의료 빅데이터를 임의의 장소로 안전하게 이동할 필요가 있음을 시사하고 있다.

각 개인으로부터 확보한 의료데이터의 안전과 보안 문제를 해결하는 것도 매우 중요한 이슈이다. 이를 해결하기 위해서는 금융보안에서 이용하는 암호화 알고리즘(encryption algorithm)을 갖춘 보안 시스템이 필요하다. 아울러 연구 참가자나 환자가 공개적으로 연구자와 함께 환자에 대해 생성한 데이터를 공유할 수 있는 동의 양식을 생성하는 것이 필요하다. 웹 기초 보건 연구에 대한 동의 정보에 대한 콘텍스트는 이러한 역동적인 연구를 용이하게 할 수 있으며, 동시에 공공의 신뢰를 유지할 수 있는 기반을 제공하고 있다. 이는 의료 빅데이터 보안 기술에서 클라우드 컴퓨팅 기술의 적용이 필요함을 시사하고 있다.

Ⅶ. 결언

의료-ICT(의료 정보학/바이오 정보학/바이오 통계 등) 융합산업 분야에서 의료 빅데이터 분석 기법은 차세대 의료 서비스를 크게 향상시켜 맞춤형 의학 프로그램으로 발전하고 있다. 이를 기반으로 임상데이터 및 다양한 –omics 데이터의 관리 및 개인 의료 정보 보안 등에 대한 통합 관리 시스템을 구축하는 데 주력할 필요가 있다. 이를 통해 만성질환 및 난치성 질환자 관리의 질을 향상시키고, 나아가 의료비 절감을 구현할 수 있을 것이다. 아울러 연구자들이 경험하는 의료 빅데이터 분석 기법과 데이터 중심 모델링에 대한 인프라를 제공할 수도 있을 것이다. 이를 위해 의료 빅데이터(임상 및 유전 데이터 등)의 supply chain(생성-획득-저장-이동-확보-이용-폐기)에 개인 의료 정보 보안 등과 같은 문제를 해결할 수 있는 법적/제도적 기반이 필요하다[3].

데이터 3법 개정은 의료 빅데이터 구축 사업을 촉진하는 동시에 더 나아가 데이터 경제 활성화를 위한 정책적 아젠다를 제시하였다. 이를 통해 첨단 기술(AI, 클라우드 컴퓨팅, 빅데이터 분석 등)을 활용한 의료 정보의 생산/유통/수집/분석/이용 서비스를 제공하는 데이터 산업이 의료산업 전반(바이오, 헬스 케어 등 포함)에 확산시켜가고 있다. 이에 따라 의료정보의 특성을 반영한 맞춤형 상품(하드웨어/서비스/플랫폼/솔루션 등)이 개발되고 있다. 아울러 LBS(Location Based System) 기반의 첨단기술과 융합되면서 의료정보의 활용 가치가 더욱 높아지고 있다.

그러나 국내 기업의 의료 빅데이터 활용률은 7.5%에 불과하고, 분석 기술 수준은 전 세계 하위권(63개국 중 56위)에 랭크되어 있다[13]. 이처럼 의료 빅데이터 활용률이 낮은 이유는 매우 강력한 수준의 개인정보보호법을9)를 운영하고 있어 각 개인의 의료 데이터를 공유할 수 있는 기반이 미비하기 때문이다[12].

전 세계적으로 데이터 경제(data economy)로의 전환이 확산되면서 적극적인 데이터 활용을 통한 의료 빅데이터 분석 및 활용에 대한 법적 근거가 필요하게 되었다. 데이터 3법 개정은 이러한 상황을 해소하여 의료 빅데이터 분석 및 활용에 따른 부작용을 최소화할 수 있는 안전장치를 마련하고, 데이터 경제를 활성화할 수 있는 규제 혁신의 계기를 마련한 것으로 볼 수 있다.

9) 개인정보보호법 : 개인정보의 처리 및 보호에 관한 사항을 정함으로써 개인의 자유와 권리를 보호하고, 나아가 개인의 존엄과 가치를 구현함을 목적으로 한 법률(2014.03.24 개정, 2020.02.04 일부개정, 2020.08.05 시행)

컴퓨팅 머신과 인터넷망을 통해 질병을 관리하는 도구들이 빠르게 확대되면서 의료 빅데이터 활용사례가 빠르게 증가하고 있는 추세이다. 이러한 사례들은 DB에서 제공하는 정보량을 의료 전문가와 환자의 사용이 증가하면서 신약개발과 질병 치료를 용이하게 하여 바이오 의학에 크게 기여할 수 있을 것으로 기대된다. 바이오의학 등을 포함한 의료-ICT 융합 기술은 다양한 임상 정보와 결합되어 검증이 이루어지기 때문에 성공 여부는 이러한 기술력으로 생성되는 초대용량 의료 데이터세트를 어떻게 해석하느냐에 달렸다고 할 수 있다. 이에 의료 빅데이터 기술 시장의 선두주자인 글로벌 ICT 메이저 기업들(Microsoft/Amazon/Apple/Google 등)은 유전체학 기술과 보건 정보에 의해 생성된 의료 빅데이터를 효과적으로 분석하고 공유하는 데 기술력을 집중시키고 있다.

이룰 효과적으로 구현하기 위해서는 동일 형태의 측정 가능한 구조를 분석력을 확보할 필요가 있다. 아울러 이러한 바이오 의학을 포함한 의료-ICT 융합 기술을 통해 미래 맞춤형 의학 프로그램으로 주목받고 있는 의료 정보 과학에 적응할 필요가 있다[14]. 나아가 맞춤형 의학과 컴퓨터 지원 진단학을 통해 만성 질환 및 난치성 질환을 치료하는 데 직접적인 효과를 나타낼 수 있다는 것을 증명할 수 있는 심층 연구가 필요하다.

디지털 헬스케어 산업 분야에서는 데이터 3법 개정안에 대해 매우 긍정적이다. 이에 개정안 통과에 따른 개인정보 식별과 유출 등에 대한 우려를 해소하기 위해서는 데이터 3법 개정을 통해 의료산업 전반(국민건강보험의 지속가능한 운영, 바이오 및 스마트/디지털 헬스 케어 확산, 의료전달체계 개선 등)을 개선하여 의료수요자가 실감할 수 있는 구체적인 Action plan이 필요하다. 아울러 바이오 헬스 업계 스스로 자율 규제를 강화하고 다양한 이해관계자들의 의견을 수렴하여 이를 극복할 수 있는 대안 마련을 마련할 필요가 있다[10]. 데이터 3법 개정을 계기로 관련 시행령/시행규칙 등 하위법령 제정을 통해 데이터 기반 ICT 미래 유망 시장으로 주목받고 있는 바이오 헬스 산업 활성화에 주력할 필요가 있다.

[참고문헌]
[1] 이재훈, “데이터 3법 개정에 따른 바이오 의료정보 활용방향과 시사점”, BioIn, Vol.71, 생명공학정책연구센터, 2020.
[2] 의료 빅 데이터, 4차 산업혁명 시대의 핵심 자원으로 주목(BIOTIMES, 2020.05.27).
[3] 박세환, “데이터 3법을 계기로 본 의료 빅데이터와 디지털 의료서비스”, SecuN저널 162호, (주)테크월드, 2022.07.
[4] 박세환, “스마트 헬스 캐어 산업분석 및 정책적 과제”, 중소기업멘토링보고서, 한국과학기술정보연구원, 2020.09.
[5] Rothberg, J.M. et al., "An integrated semiconductor device enabling non-optical genome sequencing." Nature, 475, 2017.
[6] 한형진, “나노포어(Nanopore) 단분자 탐지의 응용과 기술 개발에 대한 연구 동향”, BRIC VIEW 2021-T25, 2021.07.
[7] Maher, B., "ENCODE",: the human encyclopaedia free.", Nature, 489, 2017.
[8] ENCODE Project Consortium, et al., "An integrated encyclopaedia of DNA elements in the human genome.", Nature, 489, 2017.
[9] “1000 Genome Project Consortium and 1000 Genomes Project data", Nature, 491, 2016.
[10] Dugas, A.F, “Influenza forecasting with Google Flu trends”, PLoSONE 8, pe56176.
[11] Costa, F.F., "Big data in biomedicine", Drug Discovery Today, 19(4), 2017.
[12] 한국보건산업진흥원 의료기기산업 종합정보시스템
[13] 스위스 국제경영대학원 자료종합(2021). [14] 보건의료 빅데이터의 정책 현황과 과제(한국보건사회연구원, 2021.08).