함유근 | 전남대학교 해양학과 교수
FOCUS
기후 변화 예측 인공지능,
어디까지 와있나
인공지능 기후 예측 ··· 시간과 공간 해상도에서 비약적인 향상
바야흐로 인공지능의 시대이다. 인공지능(AI) 기법은 기후 연구 분야에 다방면으로 활용되면서 기존의 기후 예측 기법들을 빠르게 대체/보완하고 있다.
기존의 기후 예측 모델들은 다양한 지구 시스템의 물리 법칙에 따라 에너지 및 물질의 흐름 관련시키는 미분 방정식을 대규모 시뮬레이션을 통해 수치적 해를 구하는 방법을 따라왔는데, 이런 모델은 한계점을 가지고 있다. 프로세스 기반에 따라서 기존의 기후 모델들은 일반적으로 슈퍼컴퓨터에서 실행해야만 원활한 구동이 가능하며, 지구상에 존재하는 모든 물리 법칙을 수치적으로 표현할 수 없다는 한계 때문에 필연적으로 실제 지구와의 계통적 오차가 존재하는 문제점이 있다. 다양한 지구 시스템 요소들의 관측을 통해 물리 법칙을 발견하고, 이를 수치적으로 변환하여 기후 예측 모델에 반영하는 식으로 모델의 고도화가 이루어져 왔지만, 이러한 방법으로는 관측 기술의 발전으로 위성, 레이더 및 센서로부터의 풍부한 기후 변수들의 관측을 직접적으로 도입하는 데 한계가 있을 수밖에 없다.
반면, 데이터 기반의 인공지능 기후 예측 모형은 비약적으로 늘어난 관측들을 모델의 학습 데이터로 이용하여 기후 모델을 좀 더 실제의 지구와 같아지도록 만든다. 즉, 인공지능 기후 예측 모형은 기후 요소 관측의 증가로 인해 그 성능이 비약적으로 향상될 수 있다. 또한, 최근의 딥러닝 기법 개발은 주어진 데이터로부터 실제 지구 요소들의 관련성, 동작 원리를 더욱 효율적으로 학습하여 다양한 시간과 공간 해상도에서의 기후 예측 성능을 비약적으로 향상 시키기에 이르렀다.


사례를 통해 살펴보는 인공지능 기후 예측 모델
초기 연구들의 성공적인 인공지능 도입에 고무되어, 최근에는 학계에서 뿐만 아니라 다수의 글로벌 기업에서도 인공지능 기법을 활용한 기후 예측을 시도하고 있다. 이에 대표적인 사례로 마이크로소프트사에서 4주 이내의 예측을 목표로 개발된 인공지능 기반 기후 예측 모델과 수십년 예측을 목표로 개발된 인공지능 기반 기후 변화 예측 기법에 대해 소개하고자 한다.
(1) 인공지능 기반 전지구 기후 예측 모델 ClimaX
마이크로소프트사에서 개발한 ClimaX 모델은 여러 기상 변수를 다양한 시공간 해상도에서 다루는 이질적인 데이터 세트를 사용하여 학습된 AI 기반 기후 모델이다 [그림 1].

[그림 1] 마이크로소프트사에서 개발한 ClimaX의 개요도
해당 모형은 사전 학습 (pre-training) 과 미세 조정 (fine-tuning) 을 거쳐 구성된다. 사전 학습은 여러 그룹에서 제공하는 다양한 기존 기후 예측 모형의 시뮬레이션 결과를 활용한다.
다양한 기존 기후 예측 모형의 시뮬레이션 결과는 실제 지구의 관측과 계통적인 오차를 가지고 있지만, 주요 물리 법칙들에 기반한 시뮬레이션 결과를 제공하기 때문에 어느 정도의 현실성을 담보하고 있다. 시뮬레이션 결과의 장점은 무수히 많은 수의 독립적인 학습 데이터를 얻을 수 있다는 것에 있으며, 다양한 기관에서 제공하는 다수의 기후 예측 모형을 활용하는 경우 모형간의 계통적 오차가 서로 상쇄되는 효과를 얻을 수 있다. 이후, 실제 관측 자료를 활용한 미세 조정을 수행하여 모델을 최종 구축한다. 이를 통해 실제 지구의 특성이 더 정확히 반영되는 인공 지능 기반 기후 예측 모형이 구축된다.
ClimaX 는 Vision Transformers (ViT) 에 기반한 다차원 이미지 대 이미지 번역 아키텍처 모형이다. ViT 기반 아키텍처는 다양한 공간-시간 입력과 유사한 다중 규모 데이터의 공간을 자연스럽게 토큰화할 수 있기 때문에 기후 변수들끼리의 시간 지연 상관성을 모델링하기 적합하다. ViT 기반 모형을 구축하기 위해서는 변수 토큰화 (Variable tokenization) 및 변수 취합 과정 (Variable aggregation) 이 수행 되어야 한다. 변수 토큰화 (Variable tokenization) 는 입력을 동일한 크기의 패치로 분할하고 각 패치를 너비, 높이 및 채널 차원에서 벡터로 평탄화 하는 과정이다. 이 후 어텐션 메커니즘 (attention mechanism)을 활용하여 특정 패치와 강한 연관성을 갖는 패치들을 찾는 과정을 거쳐 해당 패치의 예측에 활용하게 된다.

[그림 2] ClimaX(파란색)과 기존 프로세스 기반 기후 예측 모형(갈색)의 예측 시기에 따른 예측 오차 강도.
왼쪽부터 500hPa 지위고도장, 2m 지표 온도, 850hPa 온도, 10m 동서바람장 예측 오차 강도를 의미함.
이렇게 구축된 ClimaX 의 성능을 실로 놀랍다. 가용한 프로세스 기반 기후 예측 모델과 실관측 데이터를 모두 취합하여 학습 시킨 결과, 단기 (일주일 이내) 예측에 대해서는 기존 프로세스 기반 모형중 가장 우수한 성능을 보이는 현업 프로세스 기반 기후 예측 모형과 비슷한 성능을 보이고, 중기 예측 (약 1주-4주 예측) 에 대해서는 기존 모델에 비해 오히려 더 나은 성능을 보인다 [그림 2].
마이크로소프트사는 해당 모형을 향후 특정 영역의 초고해상도 예측장과 기후 변화 예측에서 적용할 수 있도록 보완하여 개발할 예정이라고 한다.
(2) 인공지능 기반 기후 변화 예측 모델
콜로라도 주립대 (Colorado State University) 의 Elizabeth A. Barnes 연구팀은 기후 변화 예측을 위한 뉴럴 네트웍 기법을 지속적으로 개발해 왔다. 뉴럴 네트웍에 기반한 모형은 전지구 예측 모델에 비해 상대적으로 단순하지만 이해하기 쉽다는 데 그 장점이 있다. 연구팀의 초기 버전 모델은, 주어진 온도 분포에 기반하여 해당 온도 분포가 몇 년도 인지에 대한 예측을 수행하는 것이다 [그림 3].

[그림 3] 콜로라도 주립대 Elizabeth A. Barnes 그룹에서 개발한 기후 변화 예측 뉴럴 네트웍 모델
해당 인공지능 모형은 프로세스 기반 기후 예측 모형 장기 시뮬레이션만을 통해 학습 되었기 때문에 실제 관측 정보는 전혀 모르는 상태로 학습이 됨에도 불구하고, 실제 관측 온도 분포에 기반한 년도 정보를 어느 정도 성공적으로 예측해 낸다. 이는 온도 분포를 통해 기후 변화가 얼마나 진행되었는지를 예측 했다고 볼 수 있다. 연구팀은 해당 연구를 좀 더 발전시켜 산업화 이전 대비 온도 상승폭이 1.5도가 되는 시기를 맞추는 모형을 개발하였다. 인류가 산업화 이전 대비 온도 상승폭을 1.5도 이내로 유지 시킬 수 있는지, 만약 1.5도를 넘어서는 온도

[그림 4] 콜로라도 주립대 Elizabeth A. Barnes 그룹에서 개발한 기후 변화 예측 모델에 기반한 산업화 이전 대비 1.5도 상승이 일어날 때 까지 남은 년수. 2021년(x축)에 17년(y축)의 값은 2021년 기준 17년 이후에는 1.5도 상승이 예측된다는 의미임.
상승이 일어난다면 과연 그것이 언제 일어나는지에 대한 답은 인류가 2015년 파리 협약을 이행할 수 있는지를 판단할 수 있는 핵심 근거가 됨에 따라 최근 기후 변화 연구 커뮤니티에서 주요하게 관심을 갖는 분야 중 하나이다. 연구 결과에 따르면, 조금씩의 차이는 있지만 SSP3-7.0, SSP2-4.5, SSP1-2.6 시나리오 모두에서 1.5도의 상승이 일어나는 해를 2033-2035년 사이로 보고 있다 [그림 4].
즉, 인류가 돌이킬 수 없는 강도의 온난화가 일어나는데 남은 시간은 길어야 15년 정도라는 것이다. 만약 온도 상승폭을 2도로 산정한다면 2021년 기준으로 30년 정도의 시간이 남은 것으로 예측 하였다. 프로세스 기반 모형에서 계산된 기간은 1.5도 기준으로는 2026-2042년, 2도 기준으로는 2034-2052년인 것과 비교해서 비슷한 수준인 것으로 보이나, 프로세스 기반 기후 예측 모형의 결과에 비해 인공지능 모형의 결과가 더 좁은 년도 폭 (인공지능 기법의 경우 1.5도 기준에서 3년, 프로세스 기반 모형의 경우 16년) 을 보이는 것으로 보아 예측의 불확실성은 인공 지능 기법을 활용함으로서 어느 정도 해소된 것으로 판단된다.

[그림 5] 2018년-2021년 평균 온도 분포에 기반한 1.5도 상승 시기 예측의 상대적 중요도. 빨간색 계열은 해당 지역이 1.5도 상승에 주요하게 기여하고 있음을 의미하며, 파란색 계열의 색은 해당 지역이 1.5도 상승과 관련된 시그널이 뚜렷하지 않음을 의미.
구축된 인공지능 기법은 상대적으로 간단한 구조를 가지고 있기 때문에 층별 기여도 전파 기법 (Layerwise Relevance Propagation) 을 통하여 지구 온난화와 관련된 시그널이 어느 지역에 오는지 손쉽게 추적할 수 있다 [그림 5].
예를 들어, 남서 아프리카와 인접한 해양 지역에서의 대조적인 온도 시그널은 이 지역의 육지-해양 온도 차이가 지구 온난화와 밀접하게 관련이 있음을 의미한다. 또한, 적도 동태평양의 온도 변동은 지구 온난화 시그널과 크게 관련이 없는 것으로 나타나는데, 이는 해당 지역이 엘니뇨에 의해 주도되는 큰 내부 변동성을 가진 지역으로 지구 온난화로 대표되는 외부 강제력에 의한 온도 변화의 효과는 크지 않을 것임을 의미한다.
대기, 해양, 지면, 해빙 및 식생 등의 지구 시스템 요소들은 에너지, 탄소, 물을 교환하며 서로 상호 작용하며 복잡성 및 비선형성을 만들어낸다. 기존의 프로세스 기반 기후 예측 모형들은 이를 관측하고, 물리적으로 이해한 후 수치적으로 풀어내야 하기 때문에 그 발전 속도가 더딜 수밖에 없다. 한 편, 최근의 다양한 지구 시스템 요소의 관측과 급격한 컴퓨팅 파워의 증가는 인공 지능 기반 기후 모델의 성능을 향상시키고 있다.

이런 식이라면 머지 않은 미래에 인공지능 기반 기후 모델이 프로세스 기반 기후 모델을 완전히 대체하지 않을까 하는 의문이 든다. 하지만 앞선 예에서 보였듯, 아직까지는 프로세스 기반 모형의 시뮬레이션 결과 없이는 인공 지능 기반 기후 모델을 학습 시키기 위한 충분한 샘플 수를 확보하기 어렵다. 이는 한 쪽이 다른 한 쪽을 넘어서기 보다는 서로 상호 보완하는 방향으로 모델이 개발될 것을 의미한다. 또한, 인류가 지구 시스템을 이해하는 것이야말로 궁극적으로 지구 시스템의 변화로 인한 문제를 해결할 수 있는 단초를 제공할지도 모른다는 점에서, 프로세스 기반의 기후 모델의 개발은 필수적이다.

다만, 인류의 무분별한 개발과 욕망으로 인해 우리에게 주어진 시간이 많지는 않다. 즉, 최근의 급격한 기후 변화는 인류가 지구 시스템을 이해하기 위한 시간을 무한정으로 허용치 않고 있다. 기후 학자들은 인류가 기후 변화와 관련된 당면한 문제를 십수년 안에 해결해야 하며, 해결하지 못할시 적어도 앞으로 어떤 일들이 벌어질 지에 대해서 예측하고 대비책을 수립해야 한다고 경고한다. 데이터 기반의 인공지능 기후 모델은 인류가 당면한 기후 변화 문제를 해결할 수 있는, 아니, 적어도 대비할 수 있는 방향을 제시할 지도 모를 일이다.