- FOCUS
- 최용석
- 부산대학교 통계학과 교수
기네스 맥주와 얽힌 이야기
통계와 기네스북
Can I have one pint of Guiness?

필자는 스코틀랜드와 잉글 랜드에서 각각 살면서 선술 집 펍(Pub)에서 어둡고 진하고 고소한 향이 깊은 흑맥주인 기네스 맥주를 주문하곤 했다. 기네스 맥주는 피시엔칩스(Fish and Chips)와는 아주 잘 어울린다. 도수는 4.2%로 1 파인트(Pint, 570ml) 잔의 상단에 거품이 구름처럼 덮여있어 몽환적 분위기를 자아내기도 한다. 실제 기네스(Guinnes)라는 이름으로 통일되어 불리기 전에는 포터(porter), 스타우트(stout), 스타우트포터(stouer porter)로 알려져 있었다 한다. 특히, 기네스 잔이나 광고의 황금색 하프 문양은 중세 시대 스코틀랜드 중심으로 살았던 조상 켈틱(Celtic) 의 것으로 매우 고풍스럽다. 실제로 스코틀랜드 위 쪽 하이랜드(Highland)를 포함하여 특히 스카이섬(Isle of Skye)에 가보면 도로 표지판의 그 당시 조상들이 사용하던(스코틀랜드 켈트어로 불리기도 하 는) 게일어(Gaelic)가 왠지 이질적으로 느껴진다. 그러나 옛 조상들의 언어와 전통을 이렇게 지키려는 모습은 경이롭다.
여기서 영국의 역사와 문화를 논하자는 것은 아니다. 처음 시작한 기네스 맥주와 관련된 두 가지 이야기를 하고자 한다. 첫 번째 이야기는 통계에 대한 것으로 1759년 영국 잉글랜드 후손 아서 기네스 경은 아일랜드 더블린에 양조회사를 설립하였다. 이 회사는 1833년까지 영국에서 가장 큰 규모로 운영되었고 1886년 런던에도 양조장을 설립하였다. 기네스는 영국 양조 무역에서 유일한 위치를 차지 하게 되었다고 한다. 다만 기네스 자사가 직판하기 위한 술집이 없었던 까닭에 항상 맛을 개선하고 판매 촉진을 위한 아이디어를 필요로 하였다. 그러던 중 1899년 더블린에 위치한 기네스 양조장에서 아 일랜드 수학자인 고셋(William Sealey Gosset, 1876-1937)이 근무하게 된다. 그는 옥스포드 대학 뉴 컬리지에서 화학과 수학을 배웠고 취업 후 통계 지식을 양조와 농업(보리 개량) 모두에 적용하면서 실제적인 연구를 거듭했다. 그는 술의 맛과 질을 위한 적정 효모 투입량을 관리하기 위하여 소표본에 적합한 검정을 발견하였다. 더군다나 이를 위한 분포를 발견하였다.
고셋의 Student's t-test
여기서 잠깐 기네스의 어떤 연구 환경과 주제가 그를 통계학자로 만들어 주었는지를 살펴보자. 기네스는 새로운 접근 방식을 지지하면서 양조를 과학적으로 만드는 프로젝트를 착수했다. 즉, 기네스는 맥주의 생명으로 첨가물과 방부제가 없고 저온 살균도 하지 않음에도 불구하고 그 맛을 유지하도록 다양한 관점에서의 연구가 필요했다. 이를 위해 옥스퍼드나 케임브리지 대학교를 처음 졸업한 우수한 화학자를 양조자로 채용하여 브루어로 불렀고 최고 경영진으로서 직책을 맡겼다고 한다.


실제 고셋은 이 당시 기네스에 채용된 우수한 화학자 인재 6명 중 한 명으로 1899년 화학 분야 1급 학위를 받은 화학자였다. 이전까지의 기네스는 양조의 검은 마법(all the black magic of brewing)과 정성적 기준의 전통적 관행을 따랐다. 수확량, 수 분, 보리, 옥수수의 크기, 질감에 대한 오래된 정성적 평가가 중요했다고 한다. 이에 반해 새롭게 구성된 연구진은 건조 조건, 재배 환경, 거름을 고려한 홉과 보리의 양조 품질을 향상 시킨 것에 관심을 두었다. 드디어 1902년 보리의 맥아 품질은 질소 함량에 따라 다르다는 사실에 자료를 축적 했으나 분석, 실험, 측정을 통해 얻어진 다양하면서 제각각인 결과값에 혼란스러워 하였다. 1907년에는 동료들이 토양 및 날 William Sealy Gosset Ronald Aylmer Fisher 씨 문제, 보리 분류 및 식별, 유전학과 보리 사육을 연구하는 동안 토지의 다양함, 강우를 포함한 씨에 주목하였다. 그러나 실제 맥주 맛의 자료에 영향을 미치는 원인 규명과 방법이 필요했고 이와 관련된 수치적 문제에 부딪힌 그들은 이를 고셋에게 가져갔고 이로 인하여 그는 기네스에서 전체 통계 분석을 담당했다고 여겨진다. 고셋은 성품이 온화하고 수학 문제 해결 에 관심이 많았고 더군다나 옥스퍼드에서 수학을 좀 한 그는 동료들의 이야기를 듣고 그들의 우려를 매우 빠르게 파악하고 항상 최선을 다해 아이디어를 도출하곤 했다고 한다.
이들의 문제 중 가장 문제가 되었던 점은 실험 자료를 해석하는데 있어 자료의 수가 매우 작다는 점이었다. 예를 들어, 고셋은 소표본 보리재배 실험에서 4개 표본으로 4곳의 밭에서 수확한 생산 량의 평균과 표준편차의 추정값에서 발생한 오차의 한계 문제를 당대 통계학 분야의 거장인 피어슨(Karl Pearson, 1857-1936)에게 문의했으나 답을 들을 수가 없었다. 여기서 실제 고셋이 기네스 연구소에서 동료들과 고민한 문제를 정리하여 The Probable Error of the Mean(평균의 가능 한 오차)라는 제목으로 1908년 저널 Biometrika 에 기고하였다. 그러나 이때 자사 제품과 관련된 연구 내용의 발표를 금지하는 회사와의 협의로 자신의 이름 대신 Student(학생)를 사용하였다. 그래서 Student’s t-test라는 검정방법을 소개한 것이다. 그가 제시한 것은 크게 두 가지인데 첫 번째로 임의 자료가 특정한 분포를 따르는지를 관찰하는 것으로 이를 위해서 피어슨이 이미 1900년에 개발한 카이 제곱검정을 활용하는 것이었다. 더 구체적으로 t-검정에 적용한 소표본이 t-분포를 따르는지가 더 궁금한 것이었다. 실제 고셋이 보여준 자료를 활용하여 기초 통계학 개념으로 정리 요약하려 한다.

특정한 분포의 확률밀도함수 f(x)를 통해 0에서부 터 1.7까지와 그 이상의 값에 대해 계산된 기대도수 Ej와 관찰도수 Oj의 두 종류(I, II)에 대한 분할표가 다음과 같이 주어져 있다. 여기서 확률밀도함수는 다음과 같다.

관찰도수가 특정한 분포를 만족한다는 귀무가설에 대해 적합성검정(test of goodness of fit)으로 다음과 같은 카이제곱통계량을 활용한다.

여기서 c는 자료의 수이고 근사적으로 자유도 df=c-1인 카이제곱분포를 따른다. 실제 R의 함 수 chisq.test()를 활용하면 관찰도수 I의 경우 X2 = 48.096이고 유의확률 p-값은 0.000으로 유의 수준 5%에서 귀무가설을 기각하게 된다. 즉, 특정한 분포를 만족하지 않음을 보여준다. 관찰도수 II의 경우 X2 = 21.811이고 유의확률 p-값 0.192는 유 의수준 5%에서 귀무가설을 채택하게 되어 자료가 특정한 분포에 잘 적합 되었다고 볼 수 있다.

고셋과 피셔의 만남
두 번째로 고셋이 인용한 소표본 실험인데 종자로 사용되는 밀이나 옥수수 등의 수확량은 씨앗의 강도에 영향을 받는다는 것을 보여주는 사례이다. 사 례에서 부드러운 씨앗이 옥수수와 짚 모두에서 더 높은 수확량을 생산한다는 사실을 보여주기 위해 고셋은 t-검정을 활용하고 있다. 두 집단의 평균 검정을 고려하면 되는데 고셋은 차이에 대한 평균과 표준편차에 대한 개념으로 설명하고 있다. 여기서 는 짚의 생산에 대한 자료를 활용하기로 하고 첫 번째 사례와 같이 R을 활용하여 현대적으로 설명하고자 하며 실제 고셋의 계산에 오류가 있어 이를 수정하여 설명한다.
실제 표에서 부드러운 씨와 단단한 씨의 수확량 차 이의 평균 =1.482과 표준편차 s=1.405로부 터 그의 z계산은 z= /s= 1.482/1.405=1.055 이다. 오늘날 t-검정의 통계량에 따르면 R t= 의 패키지 BSDA의 함수 z.test()에서 제공하는 검 정통계량 값 z=2.583로부터 자료의 수 6을 고려한 2.583/ =1.055로부터 고셋이 정의한 z를 얻을 수 있다.
기네스의 동료 연구자들로부터 통계 문제에 대한 동기부여를 받고 문제 해결에 고민했던 고셋의 노 력은 좋은 평가를 받아 1922년 그는 양조장에서 통 계 컨설턴트가 되었고 1934년까지 통계부서를 운 영하였다. 통계학자로서 어쩌면 요즘 기네스의 풍 부한 맛이 고셋의 Student’s t-검정에 바탕을 둔 연 구 덕분이라고 단정 짓고 싶다.
소표본에서 고셋의 연구에 대한 중요성을 찾아내 고 수리적 근거를 제시한 또 한 사람의 학자로 피 셔(Sir Ronald Aylmer Fisher, 1890-1962)가 있 다. 그는 고셋보다 14살 아래로 영국 런던 출생의 수리통계학자와 우생학자로 현대 통계학의 창시자 로 알려져 있다. 1925년 피셔는 통계방법에서 가 장 영향력 있는 교재를 집필하면서 서문에서 고셋 Student를 기리며 그의 연구가 두 평균값을 비교 하고 회귀계수의 정확한 추정에 활용되는 해결책을 제공한다고 기술하며 이로 인해 고셋은 유명해지기 시작했다고 한다.

이러한 피셔는 대표본 활용과 카이제곱분포의 자유도 문제를 포함하여 여러 문제에 대한 논쟁을 피어슨과 주고 받은 것은 유명하다. 아무튼 이렇게 도움을 준 피셔와는 실험계획법(experimental design) 문제로 논쟁을 벌이곤 했는데 고셋이 먼저 세상 떠난 이유도 있지만 실험에서 임의성 (randomness)이 완성도가 높다고 평가를 받은 피셔의 이론이 더욱더 자리매김했다. 첫 번째 이야기를 고셋의 말년 삶으로 마무리 짓고자 한다. 1934년 고셋은 자동차 사고로 3개월 동안 병간호를 받는 동안 통계학에 전념할 수 있었지만 남은 여생동안 절름발이가 되었다. 1935년 말 그는 런던에 있는 새 기네스 양조장을 운영하기 위해 아일랜드로 떠났다. 고된 양조장 사업의 일에도 불구 하고 그는 계속 통계학 논문을 발표하였다.

여기서 그를 기리는 동판 두 개를 소개한다. 하나는 기네스에서 고셋을 기리며 원형으로 기네스를 숙성시키는 저장통 뚜껑의 모양으로 제작하여 회사 내에 설치하였다. 또 다른 하나는 75주기인 2012 년 10월 16일, 아일랜드 더블린 블랙록 카운티 홀리 파크의 세인트 패트릭 보이즈 내셔널 초등학교에 고셋이 기네스 브루어리에 근무하던 1913년부터 1935년 사이에 홀리빌 공원 에 살았다는 사실을 알리는 명판으로 아일랜드 통계 협회와 지역 당국인 던 라오헤어 래스다운 카운티 의회가 합작 하여 설립한 것이다.

기네스북과 기네스 맥주
두 번째 이야기는 기네스북에 대한 것으로 1952년 이 기네스 양조장 경영 이사인 휴 비비 경은 아일랜드 위스포드에서 사냥파티를 하는 중 골든 플로비가 세상에서 가장 빠른 새 인지에 대한 논쟁에 휘말린다. 그러나 그는 주위 도서관의 어떠한 참고서에서도 그 답을 찾을 수가 없었다고 한다. 또한 영국의 선술집인 펍에서는 이런 종류의 논쟁은 대다수 사람들 사이에 자주 일어나며 이에 대한 해답을 줄 만 한 책의 필요성을 느낀 것이다.

요즘 세상에는 이런 경우 구글이나 우리의 경우 네이버로부터 답을 손쉽게 빠르게 해결한다. 그러나 그 이전에는 사람들 사이의 많은 논쟁의 끝은 늘 내기로 이어졌고 이러한 풍경은 우리에겐 그리 오래 되지 않았다. 마침 기네스 파크 로얄 양조장 부양조자로 기록 경신의 달인인 치리스 체터웨이는 휴경의 아이디어를 듣고 기록 책을 출판하기에 적합한 사람들을 추천하였다. 그들은 그가 스포츠 행사를 통해 만난 노리스와 로스 맥휘터(McWhirter) 쌍둥이 형제였다. 특 히, 옥스포드에서 단거리경주 대표선수이면서 진상 확인업무 대리점을 경영한 그들이 조사하고 수집한 자료에 의해서 1955년 8월 27일 198쪽에 달하는 기네스북이 탄생했다. 어찌보면 기네스북에는 자연과 우주, 건축물, 인간의 업적, 예술과 오락, 스포츠, 정치와 사회, 비즈니스, 인간세계 및 기타 각 분야 걸친 세계 기록을 기록하고 있으니 이 또한 기술(記述)통계의 한 영역이라 여겨진다. 예전 17세기에 영국에서는 존 그란트(1620- 1674)가 런던 시의 사망표를 작성하여 출생하는 「남녀 수는 남자 14에 대하여 여자 13의 비율로서 거의 같으며, 남녀 양성은 수적으로 거의 균형을 이루고 있다는 사실과 사망률은 일정한 비례나 비율로 죽는 것이 아니다. 100명의 출생자 중 6세까지 36명이 사망하며, 이후 10년이 지날 때마다 24, 15, 9, 6, 4, 3, 2, 1로 감소한다. 이 사망률로부터 역으로 생존 자를 계산하면, 6세까지 64명, 16세에는 40명, 이후 10년마다 25, 16, 10, 6, 3, 1명이 되어, 86세까지 생존자는 없다」 라는 사실을 보고서에 정리하였다. 이를 통해 그는 인구통계의 선구자로 정치 산술 (political arithmetic)의 창시가 되었다. 그에게 영향을 받아 비슷한 조사보고서를 펴낸 여러 사람들이 등장했으며 혜성의 이름을 제공한 헬리(Edmond Halley. 1656-1742)도 그들 중 한 사람이었다. 이런 조상들의 통계에 대한 철학이 영국에서 기네스북 탄생의 원천이라고 여겨진다. 난 개인적으로 1996 년 발간한 기네스북 40년사를 소장하고 있다.
이제 기네스 맥주와 얽힌 통계와 기네스북 이야기를 마무리한다. 내가 거처하는 부산의 경우 기네스 생 맥주를 즐기는 곳이 내 경우 세 군데 정도 있다. 피시 엔칩스를 같이 즐길 수 있는 아일리쉬 펍, 먹태를 안주로 하는 동네 맥주집, 기본 안주로 먹어야 하는 호텔인데 조만간에 기네스 맥주와 관련된 이야기를 떠올리며 이것의 깊은 맛을 음미해 보고 싶다.
- (참고자료) 기네스북(1996). 96‘ The Guinness Book of Records, 동아출판사.
- ● 최용석 History of Statistics: https://yschoi.pusan.ac.kr/yschoi/28169/subview.do
- ● Joan Fisher Box, J.F.(1987). Guinness, Gosset, Fisher, and Small Samples, Statistical Science, 2,(1), 45-52.
- ● Pearson, E. S. and Kendall, S. M.(1978). Studies in the History of Statistics and probability, Vol. I and II, Charles Griffin and Co Ltd.
- ● Stigler, S. M.(1986). The History of Statistics, Havard University Press.
- ● Student(1908). The Probable Error of a Mean, Biometrika, 6(1), 1-25
- ● Plaque image: https://openplaques.org/plaques/41123
- ● Plaque image: http://blogs.roosevelt.edu/sziliak/w-s-gosset-aka-student