김종원 | 데이터 분석가(비프로일레븐)
FOCUS
AI가 불러온 변화
데이터가 지배하는 축구
스포츠 경기에서 데이터는 주관적으로 생각하던 것들을 명확하게 보여주고 숨겨진 진실들을 밝혀내어 감독과 선수들이 경기를 준비하는데 중요한 정보로 사용된다.
데이터를 가장 활발히 사용하고 있는 스포츠 중 하나인 야구의 경우, 투수가 공을 던지기 전 양쪽 팀은 투수와 타자의 과거 모든 데이터를 수치화하고 투수는 경기 상황(이닝, 점수 차, 주자 등)과 상대 타자의 특성을 고려해 가장 성공 확률이 높은 공을 던지고, 타자 역시 다양한 상황을 통계적으로 고려하여 상대 투수의 구질을 예상하여 다음 타격을 준비한다. 육상, 역도, 양궁 등 기록 스포츠의 경우 선수들의 자세, 각도, 궤적 등 역학적인 데이터들이 최고의 경기력(힘, 스피드, 정확도 등)을 발휘하기 위한 중요한 정보로 사용된다.
하지만, 22명의 선수가 동시에 움직이고 다음 행위를 예측하기 어려운 동적 스포츠인 축구 경기에서 데이터는 활용 빈도가 낮았고, 실제 현장에서는 데이터보다 주관적인 분석이 더 중요하게 여겨져 왔다. 하지만 최근 AI(Artificial Intelligence: 인공지능) 기술의 발달과 함께 축구 경기에서도 의미 있는 데이터 수집이 가능해졌고, 현장 적용 가능한 새로운 지표들이 생겨나면서 경기를 준비하는 과정에서 데이터를 활용하는 새로운 시대가 열렸다.
축구 경기에서 활용되는 데이터 수집 기술
축구 경기에서 발생한 모든 행동(사건)들을 데이터로 수집하기 위해서는 우선적으로 경기 영상이 필요하고, 영상을 확보하기 위한 경기 촬영이 진행되어야 한다. 축구 경기 촬영은 그동안 구단 내 전력분석관, 프런트 직원, 촬영 대행업체 등 다양한 경로를 통해 진행되어왔다. 경기 촬영은 긴 촬영 시간과 촬영하는 사람의 상당한 집중력이 필요하고, 이 과정에서 날씨, 카메라 위치, 촬영하는 사람의 컨디션 등 다양한 변수들에 의해 경기를 일정하고 정확하게 촬영하는 것은 쉽지 않다. 하지만, 이제 기술의 발전과 함께 사람이 직접 축구 경기를 촬영하지 않고도 영상을 확보할 수 있는 시대가 열렸다.
AI 기반 스포츠 분석 솔루션 회사인 비프로컴퍼니(Bepro company)는 인공지능 기술을 이용해 경기 촬영을 자동화하는 데 성공했다. 경기장 높은 곳에 고정형 네트워크 카메라 3대(Fixed cam)를 설치하고, 카메라 3대에서 각각 촬영한 경기 영상을 하나의 영상으로 결합시키는 방식을 도입했다. 여러 개의 영상을 하나의 영상으로 결합시키는 기술은 스티칭 기술(Stitching technology)이라고 불리는데, 카메라 파라미터에 눈금을 찍고 3개의 카메라에 찍힌 눈금을 잇는 방식이다.

[그림1] Stitching(스티칭) 기술(사진출처 : 비프로컴퍼니)
스티칭 기술을 통해 하나의 영상을 만든 후에는 경기장 안에 있는 모든 선수들을 인식하고 추적하는 과정을 거친다. 이때 사용되는 기술이 오브젝트 트래킹 기술(Object tracking technology)인데, 멀티 오브젝트 디텍션을 통해 선수, 심판, 공 등을 인식하고 추적하게 된다. 선수 추적을 구현하고 나면 비프로 자체 플랫폼의 3D 비디오 플레이어에 스티칭되고 디텍팅된 영상을 집어넣어 사용자들에게 택티컬뷰, 줌인/줌아웃 등 영상을 컨트롤 할 수 있게 해준다. 선수들의 추적이 가능해짐으로써, 선수들의 신체 활동에 대한 정보가 자동으로 입력되고, 선수들의 뛴거리, 스프린트, 고강도 스프린트, 히트맵 등 다양한 피지컬 데이터들을 추출할 수 있게 된다. 그동안 축구 경기에서 피지컬 정보는 웨어러블 장비(스포츠 브라)를 입고 그 안에 있는 GPS 장비를 통해 선수들의 위치를 추적해왔는데, 인공지능 기술의 발전으로 인해 이제는 선수들이 장비를 착용하는 번거로움과 GPS의 오류 등의 문제점들이 해결됐다.
선수의 위치 추적이 가능해지면서 선수들의 피지컬 데이터 뿐만 아니라 전술적, 기술적 데이터들도 확보할 수 있게 됐다. 주어진 공간 안에서 상대 11명의 선수들을 넘어서 상대 골문에 득점을 해야 하는 특성을 지닌 축구는 선수들이 기술을 가지고 전술적 움직임을 통해 상대 공간을 뚫어내는 것이 핵심이다.
선수 위치 추적 기능과 함께 선수들 간의 간격, 선수 사이의 공간, 압박의 위치 등 X와 Y 좌표 정보들을 통해 다양한 전술적 데이터들을 찾아낼 수 있고, 더불어 공이 나아가는 방향, 거리, 위치 등에 대한 선수들이 한 행위에 대한 기술적 데이터를 추출하는 것 역시 가능해졌다.

[그림2] Object tracking(오브젝트 트래킹) 기술(사진출처 : 비프로컴퍼니)

[그림3] Object tracking(오브젝트 트래킹) 기술을 이용한 전술적 데이터 활용(사진출처 : 비프로컴퍼니)

[그림4] Object tracking(오브젝트 트래킹) 기술을 이용한 기술적 데이터 활용(사진출처 : 쿠팡플레이)
최근에는 휴대용 카메라 Cerberus가 출시되어 경기장에 카메라를 고정 설치하지 않아도 쉽게 휴대하며 경기를 촬영하는 것이 가능해졌다. Cerberus는 카메라가 선수들을 인식해 자동으로 움직이며 촬영하고, 스티칭과 오브젝트 트래킹 기술이 접목되어 다양한 체력적, 전술적, 기술적 데이터들을 추출할 수 있다. 기존 3대의 픽스캠에서 촬영된 영상을 하나의 영상으로 스티칭하던 기술이 하나의 카메라 안에서 가능하게 된 것이다. Cerberus 카메라의 개발로 인해 이제는 원정 경기에서도 카메라를 휴대하며 자동으로 쉽게 경기를 촬영할 수 있게 됐고, 홈 경기장에 고정형 카메라가 없는 유소년 및 아마추어 축구팀들도 휴대를 하면서 경기를 쉽게 촬영할 수 있다는 점에서 활용 가치가 높다.
공격수의 골결정력 지표··· xG
최근 축구계에서 가장 주목받고 있는 지표가 있는데 바로 xG(Expected Goal) 값이다. xG는 기대득점 값으로, 각 슈팅 별로 득점으로 이어질 확률을 산출하여 합산한 값이다. xG값은 슈팅을 하는 순간 골대와의 거리, 각도, 골대와 슈팅하는 선수 사이의 상대 수비수 숫자, 슈팅을 하는 신체 부위, 슈팅을 하는 선수에게 공이 전달되는 과정 등 다양한 상황들을 인공지능이 계산하여 도출된다.
예를 들어, 패널티킥의 경우 슈팅 상황이 고정되어 있기 때문에 가장 간단하게 xG값을 계산할 수 있는데, 지난 시즌 K리그에서 패널티킥이 46번 나왔고 그 중 33번 득점에 성공했다면, 패널티킥의 득점 확률은 71.7%로, xG값은 0.717이 주어진다. xG값은 매 슈팅마다 0부터 1까지의 값이 주어지고, 0에 가까울수록 득점을 하기 어려운 상황에서의 슈팅, 1에 가까울수록 득점을 하기 쉬운 상황에서의 슈팅이다. 이렇게 도출된 xG값은 실제 득점 값과의 비교를 통해 의미있는 해석이 가능한데, xG값이 실제 득점보다 높다면 그 팀(선수)은 골 결정력이 좋지 않았다고 해석할 수 있으며, 반대로 xG값이 실제 득점보다 낮다면 득점 찬스를 잘 살렸다고 해석할 수 있다.
그동안 공격수들의 골 결정력에 대해서 평가할 방법이 슈팅 대비 득점 수 외에는 마땅히 없었는데, 이제 xG값을 통해 조금 더 경기 상황을 고려한 골 결정력에 대한 객관적인 평가가 가능해졌다. 지난 시즌(2022년) 국내 프로축구 K리그에서 득점 1, 2등을 차지한 조규성과 주민규는 나란히 17골 씩을 기록했는데, xG값은 각각 14.517(조규성)과 17.104(주민규)로 조규성이 조금 더 높은 골 결정력을 선보였다고 해석할 수 있다.
미드필더와 수비수의 공격 관여 능력 지표··· xT

[그림5] 휴대용 경기 자동
촬영 카메라 Cerberus
(사진출처:비프로컴퍼니)
지난 시즌 K리그 MVP 이청용은 리그 35경기에 출전하여 3골 2도움을 기록했다. 그의 득점과 도움 수만을 보면 MVP 수상에 의문을 품는 사람이 있을 수 있다. 하지만, 지난 시즌 K리그를 시청한 사람이라면 누구나 이청용이 팀의 공격 전개를 매끄럽게 이끌고 공격과 수비 사이에서 윤활유 역할을 하며 팀의 핵심적인 역할을 했다는 것을 알고 있을 것이다. 이처럼 이청용의 팀 내 기여도와 활약은 단순히 득점과 도움 수로 평가하기는 어렵다. 하지만, 이제는 객관적인 수치로도 이청용 선수의 활약을 확인할 방법이 생겼다. 지난 시즌 이청용 선수는 K리그 전체 선수들 가운데 1등을 기록한 지표가 있는데 바로 xT값이다. xT(Expected Threat) 값은 기대 위협 값으로, 득점 확률이 높은 지역으로 공을 전달하는 능력을 의미한다.
공은 3가지 방법(패스, 드리블, 캐리)을 통해 전달될 수 있으며, 경기장을 구역별(21x18)로 나누어 각 구역에 해당하는 득점 가능성을 부여하고, 공의 전달이 마무리되는 구역에서 공의 전달이 시작되는 구역의 득점 가능성 값을 뺀 값의 합으로 구해진다. 그동안 득점, 어시스트, 슛, 크로스 등 득점에 집중되어 오던 경기 지표에 xT라는 지표가 생기면서 좀 더 경기장 아래 지역(자신의 진영)에서 플레이하는 미드필더와 수비수들의 팀 내 공격 관여 능력을 평가할 수 있는 평가 지표가 생긴 것이다.
골키퍼의 선방 능력 지표··· xGOT
공격수, 미드필더, 수비수 뿐만 아니라 골키퍼의 선방능력 역시 좀 더 객관적인 데이터를 통해 확인하는 것이 가능해졌다. 그동안 골키퍼의 선방능력을 평가할 때는 클린시트(무실점) 횟수 또는 세이브 숫자가 객관적으로 평가할 수 있는 유일한 방법이었는데, 이 지표들은 팀이나 수비진의 수준에 따라 편향된 정보가 될 수 있다. 즉, 강력한 수비진을 갖춘 강팀의 골키퍼는 선방능력과 상관없이 클린시트가 많을 것이고, 상대의 슈팅을 많이 허용하는 약팀의 골키퍼는 세이브 숫자가 많을 가능성이 높다.

[그림6] xG 데이터 활용 예시(사진출처 : 쿠팡플레이)
팀과 수비진의 수준과 상관없이 골키퍼의 절대적인 선방 능력을 객관적으로 확인하는 것이 쉽지 않았는데, 이제는 선방지수(xGOT-실점) 값으로 평가를 할 수 있게 됐다. xGOT(Expected Goals on Target)란 유효슈팅 내 기대 득점 값으로, 유효 슈팅이 득점으로 연결될 확률을 의미한다. xGOT값은 xG값과 슈팅이 골문 안으로 향한 위치(goalmouth location)에 의해 결정되고 계산과정에서 모든 슈팅 중 유효 슈팅만 포함된다. xGOT 값이 0.25라는 것은 25%의 득점 가능성이 있는 슈팅이고, 반대로 골키퍼 입장에서는 75%의 확률로 막을 수 있는 슈팅이다. xGOT값보다 실점이 많다면 막아야 할 슈팅을 막지 못했다는 것을 의미하고, xGOT값보다 실점이 적다면 선방을 통해 실점을 지켜냈다는 것으로 해석된다.
지난 시즌 K리그에서 가장 많은 클린시트를 기록한 선수는 1등팀 울산 현대의 조현우였지만, 선방지수(xGOT-실점) 값이 가장 높았던 선수는 인천 유나이티드의 김동헌이었다. 선방지수 값을 통해 김동헌 선수가 실제 득점 가능성이 높은 상대의 슈팅을 가장 많이 막아낸, 즉 선방 능력이 가장 좋은 선수였다고 해석할 수 있다.

[그림6] xT 데이터 활용 예시(사진출처 : 쿠팡플레이)
앞서 살펴본 xG, xT, xGOT 외에도 xA(기대 어시스트), xGC(빌드업지수), PPDA(압박지수) 등 새로운 지표들이 계속해서 생겨나고 있다. 과거의 1차 데이터(슈팅 수, 패스 수, 태클 수 등)에서 벗어나 축구 경기 상황을 고려한 데이터의 추출이 가능해지면서 축구라는 종목에서는 불가능할 것 같았던 데이터를 이용해 경기를 설명할 수 있는 시대가 점점 다가오고 있다.
인공지능 기술이 불러온 축구분석 패러다임의 변화
축구 경기에서 지도자는 다음 경기를 준비할 때 정량적 분석보다는 상대 팀의 공격 패턴과 수비 패턴, 역습 상황에서의 움직임, 압박의 형태 등 정성적 분석을 통해 상대의 공간을 어떻게 뚫고 상대의 공격을 어떻게 막을 것인가에 대해 고민한다. 득점, 슈팅, 패스 성공률 등 결과 중심적인 정량적 데이터들은 경기를 준비하는 과정에서 활용 가치가 낮았고, 무시를 받아왔다. 하지만, 이제 인공지능 기술의 발달과 함께 전술적인 상황을 고려한 과정 중심적인 정량적 데이터들을 추출하는 것이 가능해지면서 축구 경기에서 데이터의 활용은 이제 선택이 아닌 필수가 되고 있다.
예를 들어, ‘상대 팀이 우리 수비진영으로 전방압박을 해올 때 경기를 잘 못 풀어 나간다’는 상황이 ‘경기장 수비지역 1/3 위치에서 상대 선수가 15m/s 이상의 속도로 접근해서 수비선수 반경 1m 내로 접근해 오는 상황’을 전방압박 상황으로 정의하고, 정의한 상황에 대한 데이터와 영상 정보를 추출하는 것이 가능해진 것이다.
인공지능 기술의 발전과 함께 축구 분석의 패러다임은 변하고 있다. 이제 축구 경기에서 인공지능 기술은 없어서는 안 될 존재로 자리매김했다. 지금 이 순간에도 인공지능 기술은 계속해서 발전 중이고, 새로운 의미 있는 지표들이 개발되고 있다. 앞으로 다가올 변화를 피할 수는 없다. 축구계에는 오지 않을 것 같던 데이터 활용 시대가 이미 시작됐고, 이제부터는 데이터를 얼마나 잘 해석하고 의미 있는 정보를 잘 찾아내는지가 가장 중요한 요소가 될 것으로 보인다.