- ISSUE
- 정태성
- 한국행동경제학연구소 대표 및 스포츠시그널 대표
스포츠통계와
행동경제학
최근 들어 통계에서 그 중요성이 점점 커져가고 있는 분야가 있다. 바로 스포츠 분야이다. 스포츠는 속성상 승자와 패자가 가려지는 분야인데 예전에는 타고난 신체적 특성에 더해 근성과 노력으로 승자가 정해졌다고 하면 오늘날에는 훈련 부터 전략, 전술에 이르기까지 데이터를 분석하고 활용함으로써 승리에 한발 더 가까이 갈 수 있다는 게 통설이다. 특히 오늘날의 스포츠 경기는 산업화되고 있으므로 개인이나 팀의 승리가 곧 부와 직결됨에 따라 스포츠통계 분석은 더욱더 발달할 수 밖에 없다.
스포츠통계의 시작, 야구
일반적으로 스포츠통계란 스포츠에서 발생하는 다양한 데이터를 수집, 분석, 해석하는 학문을 의미한다. 초기에는 주로 선수 개인의 퍼포먼스를 극대화시키기 위해 운동수행 능력과 관련된 데이터를 수집하여 분석하는 생체역학이나 운동역학에서 주로 사용하였으나 이에 더해 기존에 선수나 팀이 보여준 기록을 기반으로 선수나 팀의 능력을 새로운지표로 측정하고 이를 모델화하여 승패를 예측할수 있는 영역까지 확산되었다. 이렇듯 스포츠통계의 외연도 확대되고 수준도 높아짐에 따라 처음에는 야구의 ‘빌 제임스’처럼 좋아서 시작하는 개인부터 시작해서 팀으로 확산되었으며, 스포츠 분야만 전문적으로 분석하는 기업이 생겨났을 뿐만 아니라최근에는 FIFA와 같은 국제스포츠 기구에서도 전문통계 지표를 제공하기 시작했다. 심지어 FIFA가 제공하는 통계 지표는 기존 스포츠통계업체보다 한층 세밀해서 볼 점유율을 넘어 새로운 유형인 경합까지 도입했고, 팀의 공격 방향도 왼쪽과 중앙, 오른쪽 만 따지던 기존과 달리 5가지로 세분화 하였으며, 빌드업, 롱볼, 역습, 압박 등을 인공지능(AI) 알고리즘에 기반한 추적 데이터로 분석해 제공한다. 스포츠통계에 대해 개인보다는 팀, 아마추어보다는 프로구단에서 더 필요로 하는 것은 자명한 사실이다. 왜냐하면 승리가 곧 부와 연결되는 산업의 영역이기 때문이다. 1승을 올릴 때마다 팀의 인기는 늘어나게 되는데 특히 우승권에 있으면 각종 스폰서 십이 높은 가격으로 붙고, 열광적인 팬들은 구단에 돈을 쏟기 시작하며 구단의 가치는 더욱더 높아지게 된다. 구단주들은 구단의 가치가 높아져서 투자 금액 이상의 돈을 벌 수 있으면 구단을 팔기도 한다. 이러한 일들이 벌어지는 곳이 바로 스포츠산업이기 때문에 1승을 올리기 위해, 그리고 우승을 하기 위 해 통계분석에 열을 올릴 수밖에 없다. 이러한 스포츠통계는 어느 영역에서부터 발전했을까? 기본적으로 인기가 있다는 전제 하에 데이터 수집 및 분석이 쉬운 영역부터 발전하기 시작하였는데 그게 바로 메이저리그로 대변되는 야구이다. 1970년대 통계학자 빌 제임스는 타율이나

평균자책점 등 밖에 제공하지 못하는 야구계에 개탄을 하며 다양한 통계지표들로 구성된 ‘세이버메트 릭스’를 제안했다. 이후 ‘야구를 모르는 사람들의 숫자놀음’으로 치부되며 일부 팬들 사이에서만 회자 되었던 세이버메트릭스는 거의 30년이 지난 시점 인 2000년대 초반에 그 가치를 인정받기 시작했다. ‘머니볼’로 잘 알려진 오클랜드의 ‘빌리 빈’ 단장이 팀을 맡으며 세이버메트릭스에 기반한 출루율로 일대 센세이션을 일으킴으로써 메이저리그에 큰 충격을 주었다. 사실, ‘빌리 빈’ 단장이 초석을 깔아 놓았지만 데이터 야구를 더욱 굳건히 한 것은 어린 나이에 보스턴의 단장이 된 ‘테오 엡스타인’이다. 원래 보스턴에서 ‘빌리 빈’ 단장을 영입하려 했으나 실패 한 뒤, 바로 단장으로 임명된 데이터 전문가 ‘테오 엡스타인’은 2004년에 팀 내 유명한 선수들을 전격 트레이드 하며 86년만에 ‘밤비노의 저주’를 깨고 팀을 우승시키는 쾌거를 달성했다.
EPL에서 스포츠통계의 발전과 한계
이에 반해 축구는 유럽에서의 인기에 비해 생각보다 늦게 데이터를 중요시하기 시작했다. 야구는 투수와 타자간 1:1 대결부터 시작하는 반면에 축구는 끊임없이 뛰어다니는 11명의 선수로 구성되어 있다. 지금이야 발달된 기술의 카메라로 촬영하고, 선수들의 웨어러블 조끼를 통해 많은 데이터를 확인할 수 있지만 현재와 같이 기술이 발전하기 전까지는 데이터를 확인하고 수집하는 것 자체가 매우 힘들었다. 축구 분야에서 데이터를 활용한 선구적인 인물은 경제학자 출신인 아스널의 ‘아르헨 벵거’ 감독인데 마땅한 장비가 없던 시절에도 데이터의 중요성을 깨닫고 코치진들과 함께 직접 선수 데이터를 측정하고 다녔다. 최근에 리버풀의 전성시대를 다시 만들고 현역에서 잠시 물러난 ‘클롭’ 감독의 경우에도 리버풀에서의 성과는 구단에서 데이터 분석을 전격적으로 지원해 준 결과라고 말한다. 이렇듯 스포츠통계는 오늘날 기술적인 발전과 더불어 그 영역을 확대해 나가고 있는데, 보다 더 정확한 분석과 예측을 하려는 많은 사람들이 어쩔 수 없어 하는 영역이 있다. 스포츠통계는 선수들의 실력과 성적을 인과관계로 바라보고 분석하는데 성적과 인과관계가 성립하지 않는 단어, 그리고 실력과 반대 되는 단어인 ‘운’이다. 마이클모부신의 ‘The Success Equation’에 따르면 프로 스포츠 성적에 운이 차지하는 비중이 미국 메이저리그는 약 34%, 영국 프리미어리그는 31%, 미국 풋볼리그(NFL)는 38%라고 한다. 만약 데이터 분석을 통해 각 팀들이 비슷한 실력의 선수들로 구성된다면 운에 따르는 비중은 더욱 높아지게 된다. 그런데, 운이라고 하는 것은 그 개념이 모호하기 때문에 측정 되어지는 실력 이외에 측정 되어지지 않지만 경기에 영향을 미치는 많은 변수들을 ‘운’이라고 통칭하는 것이 더 정확할 것이다. 그렇다면 측정 되어지지 않은 많은 변수들, 의사결정 과정에 있어서 영향을 끼칠만한 심리적 요인들이 고려되어야 하는데 과연 어떻게 할 수 있을까? 이에 대한 실마리를 찾을 수 있는 분야가 바로 행동경제학이다. 행동경제학은 인간은 합리적으로 행동하는 것 같지만 사실은 여러 가지 요인에 의해 비합리적인 의사 결정과 행동을 할 수 있다는 전제 하에 그러한 심리와 행동을 과학적으로 풀어내는 분야이므로 스포츠 통계에서 놓치고 있는 부분을 보완할 수 있다.

NBA에서 스포츠통계의 발전
그렇다면 실제로 행동경제학이 스포츠통계가 발전하는데 어떻게 영향을 끼쳤을까? 이에 대해서는 미국 프로농구 NBA팀 필리델피아 세븐티식 서스(Philadelphia 76ers)팀의 ‘대릴모리(Daryl Morey)’ 사장의 사례로 파악해보자. 대릴모리는 노스웨스턴대 컴퓨터공학, MIT 슬론 경 영대학원 MBA 출신으로 농구와는 담을 쌓은 사람이다. 다만, 컨설팅회사에서 일할 때 NBA 명문 구단 중 하나인 ‘보스턴 셀틱스’의 컨설팅을 담당했는 데 탁월한 데이터 분석력으로 2006년 휴스턴 로키츠(Houston Rockets)로 스카우트 된 후, 바로 단 장직을 맡았다. 휴스턴 로키츠에 부임한 초기에는 그를 향한 야유와 조롱이 대부분이었다. ‘농구도 모르는’, ‘머릿속으로 분석만 하는’ 등의 조롱이 넘쳐 났고, ‘Nerd’(너드: 지능이 뛰어나지만 강박관념에 사로잡혀 있거나 사회성이 떨어지는 사람을 일컫는 말)라는 단어는 그를 표현하는 단어가 되었다. 그럼에도 불구하고 그는 신인선수 드래프트에서 가장 적합한 선수를 뽑아야 했기에 휴스턴에 와서 가장 먼저 한 일은 선수의 미래 성적을 예측하는 통계 모델을 만드는 일이었다. 즉, 농구 선수의 특성 중 향후 성공할 수 있는 주요 요인을 찾아내어 각 특성에 가중치를 부여하여 모델을 만드는 일인데, 바로 이 모델을 만드는 데 있어서 가장 중요한 점은 어떤 특성이 중요한지, 그리고 얼만큼의 가중치를 부여하는지이고 이 때 대릴모리에게서 눈여겨봐야 할점은 바로 행동경제학에서 얘기하는 ‘편향’을 제거 하려 애썼다는 점이다. 구체적으로 얘기하자면 그 전까지는 거들떠 보지 않았던 선수에게 양쪽 부모가 다 있는지, 선수 친인 척 중에 NBA 선수가 있는지, 대학 때 다양한 포지션을 맡은 경험이 있는지, 벤치 프레스를 어느 정도까지 할 수 있는지 등 모을 수 있는 많은 데이터를 모았으며, 이를 선수의 성적과 상관관계가 있는지 검증했다. 물론, 대부분 상관관계가 나오지는 않았다. 하지만 결론적으로 그때까지 중요했던 선수들의 득점력, 리바운드, 스틸 등 기존 지표보다는 분당 스틸, 분당 득점 등 효율성 지표에 더 중점을 두었고, 선수들 신장보다는 최대한 팔을 뻗을 수 있는 암 리치 혹은 윙스팬이 더 중요하게 생각되었다. 그런데, 농구 선수 선발에 있어서 또 중요한 단계는 트라이아웃이다. 지금 현재 몸 상태가 어느 정도 수준이고 얼마나 능력 있는지를 눈으로 보고 판단하는 단계인데, 이때는 전문가의 능력이 중요하다. 대릴모리는 선수를 관찰할 때 받는 즉각적인 인상을 중심으로 나머지 데이터를 받아들이는 ‘확증편향’이 발생한다는 점을 알아차렸다. 선수를 두고 즉각적인 견해를 가지면 그 견해를 지지하는 증거만 받아들이는 것이 바로 확증편향으로 대부분 NBA 전문가가 그런 편향을 가지고 있었다. 대표적인 예로 드는 선수는 ‘린새너티’(Lin + Insanity 광기)’라는 신조어의 주인공인 ‘제레미 린’이다.
대릴모리가 본 NBA에서 나타난 편향(Bias)
대릴모리가 고안한 선수평가 시스템에서 제리미 린은 ‘첫 발 스피드’ 등에서 최고 수준으로 그 해에 15 번째 선수로까지 평가를 높게하고 있었는데, 스카우트들 사이에서 그는 운동신경이 발달하지 못한 아시아 청년에 불과해서 여기에 대한 확증편향 증거들만 잔뜩 제시되고 있었다. 결국, 대릴모리는 소심하게 그를 지나치게 되었는데 훗날 매우 후회스러운 장면 중 하나로 회고한다. 대릴모리가 봤던 또 하나의 편향은 소유효과(혹은 부존효과 Endowment Effect)이다. 카일 라우리 (Kyle Lowry)라는 평판이 좋은 가드와 드래프트 1차 지명권을 트레이드 해달라는 요청을 받았을 때, 처음 전문가들끼리는 절대 안된다는 의견이 대다수 였으나 입장을 바꿔놓고 생각했을 때, 꽤 괜찮은 거래라고 생각되어 진행하게 되었다. 내가 보유하고 있는 무언가에 대해서는 객관적인 가치보다 훨씬 더 높은 가치를 부여하는 ‘소유효과’ 때문에 카일 라우리는 트레이드에 부정적이었으나 반대 입장에서 생각했을 때는 1차 지명권이 훨씬 더 괜찮다는 결론을 내려 결국 트레이드를 진행하게 되었고, 그 결과 현재 NBA 최고 선수 중 하나로 꼽히는 ‘제임스 하든’을 획득할 수 있었다. 이렇게 2000년대 중반부터 NBA에 데이터 농구를 대입해서 지금은 모든 구단들이 각자에 맞는 데이터 시스템을 구축하고 활용하도록 만든 선구자는 대릴모리라고 볼 수 있는데, 대릴모리는 데이터예측 시스템을 바꾸고 수정하고 신뢰하게 만든 데에는 그가 들었던 행동경제학 수업이 영향을 끼쳤다고 직접 얘기하고 있다.

스포츠통계 마지막 퍼즐, 행동경제
그럼 앞으로 스포츠통계가 발전하는 지향점에 행동 경제학은 또 어떤 영향을 미칠까? 우선 행동경제학을 사전적 정의에서 바라보자면 인간이 제한된 합리성에 기반하여 생각하고 행동하는 것을 연구하는 학문이다. 그런 관점에서 스포츠에서의 선수, 감독, 심판 등도 역시 인간인지라 제한된 합리성을 가지고 생각하고 행동함으로써 우리가 예측하는 범위 밖에서의 편향(Bias)을 보일 수 있다. 예륻 들어 우리나라는 야구에서 ABS 존을 도입해서 그나마 다행이지만, 투수와 타자와의 대결에서 심판의 편향에 따라 스트라이크와 볼의 선언이 달라질 수 있고, 이 때문에 경기 결과가 달라질 수도 있다. 또한 지금까지의 스포츠통계분석은 기존 기록을 기반으로 다양하게 분석한 결과이기 때문에 실제로 어떠한 상황이나 맥락이 스포츠 경기에 어느 정도의 영향을 끼쳤는지 밝혀내기는 쉽지 않다. 즉, 인과 관계에 있어서 독립변수가 종속변수에 영향을 끼쳤는데, 실제로 독립변수에 영향을 끼치는 맥락과 상황, 동기 등을 간과할 수 있다. 예를 들어 야구라는 종목을 들어보면 선수 대부분 은 일년에 한번 이상 찾아오는 슬럼프가 있다. 그러 면 우리가 그 슬럼프가 언제 어느 정도 오는지 예측 할 수 있을까? 그 슬럼프가 신체적인 주기에 따라 나타나는 현상이라면 당연히 누적된 데이터로 분석 이 가능하겠지만 외적인 상황에 따라 슬럼프가 온 것이라면 그 상황(자극)이 선수의 경기력에 영향을 끼치는지 아닌지는 RCT와 같은 실험에 따라 인과 관계를 유추할 수 있다. 또 다른 예를 들어보자. 온라인 미디어가 발달해 있는 현 상황에서 온라인 상의 개인에 대한 댓글이나 언급의 종류나 정도에 따라 선수의 경기력에 심각한 영향을 끼칠 수도 있다. 이 역시 어떤 선수는 대수롭지 않게 여기는 반면, 어떤 선수는 심적 불안감 때문에 경기에 나서도 제 실력을 발휘할 수 없을 수도 있다. 위의 예처럼 어떠한 자극이나 동기가 선수의 행동을 유발할 수도 있는데 이러한 부분을 찾아낼 수 있는 것이 바로 행동경제학의 이론들이고, RCT라고 하는 무작위 통제실험이라는 기법이다.
앞서 언급하였듯 스포츠 통계학의 발전은 승률을 높이는데 결정적 기여를 해왔다. 그리고 이제는 지금까지 와는 다른, 남들이 보지 못하는 통계에 대한 고민과 분석을 더해야 하는 시점이 되었다. 결국 선수와 감독 모두 인간이기에 인간의 심리와 행동을 과학적으로 접근하는 행동경제학이야말로 새로운 변인들을 찾아내고 이에 따라 새로운 예측 모델을 만들어 내기에 가장 적절하지 않을까 싶다. 대량의 정량적 데이터 뿐만 아니라 비정형데이터 분석을 주요 학문 도구로 삼는 행동경제학이라는 렌즈를 통해서 우리는 예측의 정확도를 몇 %라도 높일 수 있을 것이다.