세이버메트릭스 피칭이론의 새로운 전환점 - DIPS혁명
[Baseball Stats Glossary]
보로스 맥크라켄 Voros McCracken의 DIPS혁명
1990년대 후반, 허다한 세이버메트리션들이 [수비]의 영향을 제거하여 [투수]가 책임져야 할 실점 만으로 측정되는 평가지표를 찾기 위해 골머리를 앓고 있을 때, 이와 전혀 다른 발상을 떠올린 서른살짜리 청년 보로스 맥크라켄Voros McCracken이 등장합니다. 그는 당대 세이버메트리션의 요람이자 살롱 역할을 하던 야구카드게임 커뮤니티인 로티세리리그Rotisserie league 의 멤버이기도 했습니다.
Nolan Ryan's BABIP versus MLB BABIP
그는 먼저 투수의 여러 스탯을 수비의 영향을 받는 것들과 그렇지 않은 것들로 나누었습니다. 1루타, 2루타, 3루나타, 희생타, 땅볼아웃, 뜬공아웃 은 수비의 영향을 받습니다. 반면 홈런, 볼넷, 몸맞공, 삼진은 수비의 영향을 받지 않습니다.
그리고 나서 각각의 year-by-year corr. 을 구합니다. 만약 그 스탯들이 다른 요인이 아니라 투수의 본래 능력에 의해 만들어진 것이라면 올해도 내년에도 얼추 비슷한 스탯을 기록한다고 봐야 맞고 그런 경우 corr.은 높게 아니라면 낮게 나타날 것입니다.
만약 타자가 실책에 의해 출루한 비율에 대해 yby corr. 을 계산하면 꽤 낮은 값이 나올겁니다. 그건 상대수비에 달린 스탯이기 때문입니다. 타자가 타석에 섰을 때 바람이 외야를 향해 부는 빈도에 대해 yby corr.을 측정해도 낮게 나올 것입니다. 혹시 이런 스탯에 대해 강한 상관관계가 통계적으로 발견된다면 그건 능력의 문제가 아니라 법력의 문제겠죠. 대신 타석 당 HR비율에 대해서는 꽤 높게 나옵니다. (0.785) 작년에 실책출루가 많았다고 올해도 그러리란 법은 없지만 작년에 홈런을 많이 친 타자는 통계적으로 올해도 홈런을 많이 칩니다. 이런 경우, 실책에 의한 출루는 타자를 평가하는 지표가 되기 어렵지만 홈런은 그럴 수 있다고 보는 것입니다.
세이버메트릭스에서 선수들의 평가지표가 그 선수 개인의 능력과 얼마나 관련이 있는지 테스트하기 위해 가장 흔하게 사용하는 방법이 yby corr. 테스트입니다. year-by-year corr. 은 자주 등장하게 될겁니다. 전시즌과 이번시즌, 이번시즌과 다음시즌을 비교해서 각 지표들이 얼마나 큰 폭으로 오르락 내리락 들쭉날쭉한지 측정하는 통계량입니다.
값이 크면 상관관계가 높은 것이고 값이 작으면 상관관계가 낮은 것입니다. 피어슨 상관계수를 가장 많이 사용하는데, 통계학 교과서에 의하면 “< 0.3” 이면 낮은 상관관계, “0.3-0.7” 이면 보통의 상관관계, “>0.7” 이면 매우 높은 상관관계로 해석합니다. 이 값은 0-1 사이에 있습니다.
단 상관관계와 인과관계는 다릅니다. 벽에 나란히 걸려있는 괘종시계 A와 B가 있을 경우, 시계A에서 종소리가 나면 곧 시계 B에서도 종소리가 납니다. 하지만 시계A에서 종소리가 원인이 되어 시계B에서 종소리가 난 것은 아닙니다. 인과관계를 밝히기 위해서는 다른 통계적 분석이 더 필요합니다.
21세기 세이버메트릭스의 가장 급진적 도전, How Much Control Hurlers Have?
보로스맥크라켄의 분석결과는 황당할 정도로 의외였습니다.
탈삼진비율$SO 은 r = 0.792 볼넷비율$BB은 비율은 r = 0.792 피홈런비율HR$ = 0.505 입니다. 탈삼진과 볼넷허용은 매우 높은 상관관계, 즉 year by year에서 꾸준히 비슷하기 때문에 다른 요인이 아니라 투수 고유의 능력이나 특성일 가능성이 높고 피홈런비율의 yby corr. 역시 그럭저럭 상관관계가 보통 정도는 됩니다. 이 셋다 수비와 무관한 피칭스탯입니다.
그런데 타자가 방망이에 공을 맞춰서 (파울지역 포함) 그라운드 안으로 들어간 경우 중 안타가 된 비율 $H 의 yby corr. = 0.153 이었습니다. 통계학적으로 본다면 거의 상관관계가 없다는 뜻입니다. 이것이 무엇을 의미하는 것일까요?
일단 타자 방망이에 맞아 그라운드로 날아간 공이 안타가 될지 아웃이 될지는, 투수의 능력과 관련이 없단는 의미입니다. 세상에.
이렇게 yby corr.=0.153 으로 계산된, [타자 방방이에 맞아 그라운드 안으로 날아간 공에 대한 타율]을 이후에 BABIP:Batting Average on Ball In Play 라고 부르게 됩니다. 그래서 보로스맥크라켄의 수비무관피칭스탯 DIPS:Defense Independent Pitching Stats 이론을 BABIP 이론이라고 부르기도 합니다.
보로스맥크라켄은 당대 최고의 투수들인 놀란 라이언, 랜디 존슨, 페드로 마르티네즈의 BABIP을 측정해보고 확신을 가집니다. 그들과 같은 수준의 투수라도 일단 타자가 방방이에 공을 맞춰서 그라운드 안으로 보내면 그 결과는 리그 평균수준의 투수와 다를 바가 없었던 것입니다.
놀란 라이언의 160킬로 짜리 강속구나 그저그런 135킬로짜리 평범한 직구나 안타를 맞을 확율은 똑같다구? 뛰어난 투수가 좋은 성적을 내는 것은 강속구든 변화구든 강력한 구위가 타자로 하여금 빗맞은 약한 타구를 때리도록 강제해서 적은 안타를 맞기 때문이라 믿었던 상식과 정면으로 배치되는 결과였습니다.
예. 바로 그게 맥크라켄의 주장입니다. "일단 타자가 공을 방망이에 맞추고나면 그 다음은 투수가 제어할 수 없다. 어느 곳으로 날아갈지 운에 달렸거나 수비수의 능력에 달렸을 뿐이다" 그가 이와 같은 아이디어를 처음 발표한 것은 1999년 가을 Usenet Group(지금으로 치면 인터넷 야구커뮤니티)을 통해서였고 그것이 2001년 1월 베이스볼프로스펙터스에 “Pitchers and Defense: How Much Control Do Hurlers Have?” 라는 글로 게재되자 게재되자 전국의 세이버메트리션들과 야구팬들 사이에 파란이 일어납니다. 말 그대로 “퐈이야!!!”
그는 이틀동안 무려 1700통의 이메일을 받았습니다. 세이버메트릭스의 거물인 크레이그 라이트Craig R. Wright 와 빌제임스Bill James 는 맥크라켄의 아이디어를 소개한 베이스볼프로스펙터스의 편집자Neyer 에게 연락을 해서 지독하게 급진적이고 황당무계해보이는 새로운 아디이어에 대해 검토와 토론을 거듭했습니다.
빌제임스는 New Bill James Historical Abstract 2001 를 통해 이렇게 말합니다.
1. Like most things, McCracken’s argument can be taken too literally. A pitcher does have some input into the hits/innings ratio behind him, other than that which is reflected in the home run and strikeout column.
2. With that qualification, I am quite certain that McCracken is correct.
3. This knowledge is significant, very useful.
4. I feel stupid for not having realized it 30 years ago
1. 많는 논쟁이 그런것처럼, 맥크라켄에 대한 것도 좀 과장되고 예민하게 받아들여진 면이 있긴 하다. 투수 뒤로 날아간 공에 대한 안타비율에 대해 투수가 어느정도 관여하는건 사실이니까.
2. 그런 것들만 좀 정리된다면, 나는 그가 옳다고 확신한다.
3. 이 새로운 아이디어는 정말 중요하고 유용하다.
4. 이걸 지난 30년동안 깨닫지 못했던 것에 대해 내가 참 멍청했다는 생각이 든다.
DIPS의 계산모델
보로스맥크라켄이 DIPS이론에 입각해서 디자인한 DIPS ERA(dERA) 는 다음과 같이 계산됩니다.
DIPS 이닝당 수비무관 허용실점: dER ver1.0
= ((1B_lg * .50) + (2B_lg * .72) + (3B_lg * 1.04) + (dHR * 1.44) + ((dTBB + dHBP) * .33) – ((dBFP – dH – dTBB – dHBP) * .098)) * 0.9297
1. 위의 식에서 1B 2B 3B 의 자리에는, 해당 선수의 기록이 아니라 리그평균 기록이 들어갑니다. 1B_lg 는 리그평균 1이닝당 1루타 허용갯수. 입니다.
2. dHR dTBB dHBP dBFP dH 는 선수의 기록인데 가중치 적용상의 통계적 오차를 조정하기 위해 아주 작은 숫자이긴 하지만 조정치를 적용해서 보정한 숫자가 들어갑니다.
3. 마지막에 0.098을 곱해주는 것도 통계처리과정에서 생긴 오차를 보정하는 과정입니다.
DIPS 이닝당 수비무관 허용실점: dER ver2.0
= (dH – dHR) * .49674 + dHR * 1.294375 + (dBB – dIBB) * .3325 + dIBB * .0864336 + dSO * (– .084691) + dHP * .3077 + (BFP – dHP – dBB – dSO – dH) * (– .082927)
위의 계산식들은 보로스맥크라켄의 원래 계산식과는 약간 다르게 생겼습니다. 그건 너무 복잡하게 생겨서 도저히 알아보기 힘듭니다. 해서 원래 식과 계산과정을 풀어서 그나마 알아볼 수 있게 재정리한 것입니다.
위의 dER은 9이닝당 ER이 아니라 1이닝당 ER입니다. 따라서 ERA(ER/9) 스케일로 계산할 경우, (투구이닝*dER / 9) 가 됩니다.
원래 article을 보고 싶으시면 http://www.futilityinfielder.com/dips.html 를 참조하십시요.
주의 - 산식이 너무 알아보기 어렵게 적혀있고 또 하나의 아티클이 아니라 여러 아티클을 참조해야 했기 때문에 변수 표기 같은데서 약간 오류가 있을지도 모르겠습니다. 식이 써있지 않고 말로 설명된 계산과정을 식으로 옮긴 셈이라서 그렇습니다. 다만, 개념상 원리상으로는 위와 같을 겁니다.
지난 포스트에서 소개한 ComponentERA:ERC 가 RC를 투수 입장에서 뒤집은 opponent 스탯이라고 한 적이 있습니다. 보로스맥크라켄의 dERA 1.0는 그런 식으로 말한다면 짐퍼타도의 XR을 투수 입장에서 뒤집은 opponent 스탯입니다. RC와 ERC의 관계처럼 dERA는 XR의 가중치와 계산구조를 사용했습니다.
BABIP가정에 입각해서 수비와 관계가 있는 스탯들 1B 2B 3B 는 개별 투수의 능력과 관계가 없기 때문에 그 자리에 [리그평균] 값을 대입하고, 대신 투수의 능력과 관계가 있는 HR BB HBP 에는 해당 투수의 스탯을 대입합니다. 그리고 타자의 XR을 구하는 것과 같은 방식으로 투수의 opponent XR을 구합니다. 그 전에 좀 귀찮은 계산과정을 거치긴 합니다. 수비관련 스탯과 수비무관스탯을 분리해내거나 보정상수를 곱하거나 하는 과정입니다.
논쟁과 결론 - 아이디어는 옳지만 방법은 틀렸다
이후 논쟁을 거쳐 업데이트된 dERA 2.0 버전은 약간 다른 구조를 가집니다. 즉 DIPS1.0 에서 맥크라켄이 보여준 것은, 1) BABIP에 대한 새로운 이론 2)그 이론을 짐퍼타도의 XR에 적용한 계산모델이고, DIPS2.0는 DIPS1.0 에 있던 몇가지 모순과 오류를 수정하여 고유한 계산식을 만든 것입니다.
* 보로스맥크라켄은 빌제임스나 톰탱고 같은 대중적인 세이버메트릭스 저술가가 되기엔 좀 거리가 멀어보입니다. 통계쟁이란 편견과 달리 유명한 세이버메트리션들은 정말 글을 잘 쓰고 구성이 깔끔합니다. 반면 맥크라켄은… 거의 재앙입니다.
자주 하는 오해와 달리 DIPS이론에 입각한 ERA 대체지표 FIP는 보로스맥크라켄이 아니라 톰 탱고가 고안했습니다.
이젠 꽤 유명해진 FIP:Fielding Independent Pitching Stats. 의 계산식은 다음과 같습니다.
톰 탱고의 FIP
FIP = ((13*HR)+(3*(BB+HBP)) - (2*K)) / IP + FIP상수
상수constant는 시즌마다 조금씩 달라지는데
FIP Constant = lgERA – (((13*lgHR)+(3*(lgBB+lgHBP))-(2*lgK))/lgIP) 로 계산합니다.
타고나 투고가 지나치게 나타나는 시즌이 아닐 경우 3.20 정도가 됩니다. Fangrphs 에는 보통 3.10 정도라고 말하는데, KBO의 경우 몇가지 이유로 3.20 정도가 더 일반적인 값이 되는것 같습니다. 대략 리그평균득점 4.5-4.9 사이에 있는 무난한 시즌의 경우라면 FIP상수=3.20 으로 계산해도 오차가 그리 크진 않습니다.
그러나 KBO14 처럼 같은 좀 예외적인 득점환경이 시즌이라면 정확히 계산하는게 필요할겁니다.
물론 이 식도 복잡하다면 복잡하지만, 저 위의 맥크라켄의 산식과 비교하면 하늘과 땅 차이 입니다.
게다가 엄청 긴 가중치를 각각 곱해주는 수고 없이 [ 13*HR + 3*사사구 - 2*삼진 ] 아주 깔끔합니다.
FIP로부터 다시한번 전개된 또다른 투수평가지표들도 많은데, FIP에 대해서는 그때 다시 이야기할까 합니다.
겜덕과 야덕의 콜라보레이션
당시 세이버메트리션의 성과 중 DIPS와 FIP 만큼 흥미로운게 하나 더 있습니다. 클레이 드레스로 Clay Dreslough 가 디자인한 DICE 입니다. DICE 역시 Component ERA 의 일종인데 구조와 배경으로 본다면 DIPS 이전 지표인 빌제임스ERC보다는 DIPS 이후 지표인 FIP계열로 보는게 맞습니다.
계산식은 다음과 같습니다.
Defense-Independent Component ERA
DICE = 3.00 + ((13*HR)+(3*(BB+HBP))-(2*K)) /IP
이상한가요? 예. DICE:Defense-Independent Component ERA 는 FIP와 똑같이 생겼습니다. 그리고 1998년에 디자인되었습니다. 톰탱고가 theBook 에서 FIP를 소개한 2007년보다는 당연히 한참 앞서고 심지어 보로스맥크라켄이 Usenet 뉴스그룹에서 최초의 DIPS 아이디어를 제안한 것보다도 빠릅니다.
게다가 더 재미있는 것은, DICE는 다른 세이버메트릭스 지표들과 달리 연구 커뮤니티나 책을 통해 발표된 것이 아니라 베이스볼모굴Baseball Mogul 이라는 야구게임 시뮬레이션 엔진에 탑재된 알고리즘이었다는 것입니다.
“당신이 베이스볼모굴을 플레이했다면, 당신은 이미 DICE를 경험한 것이다” 라고 시작하는 2000년 7월의 아티클에서 클레이드레스로Clay Dreslough 는 맥크라켄이 DIPS에 대해 했던 것과 거의 비슷한 이야기를 합니다. 그리고 2007년에 톰 탱고가 정리해서 ERA 대체지표로 가장 많이 사용되는 FIP와 거의 완전히 똑같은 계산모형을 거의 10년 앞서 개발했던 것입니다. (아마도) 1998년 버전의 베이스볼모굴에는 이미 이 알고리즘의 탑재되어 있었던거 같습니다.
모굴Mogul은 축구의 CM시리즈나 FM시리즈처럼, 플레이어가 선수를 조작하는 것이 아니라 데이터 시뮬레이션을 통해 야구경기를 하는 게임입니다. 실제 MLB선수들의 데이터를 사용하는데, 가장 유명한 그리고 가장 많이 팔린 시뮬레이션 야구게임 중 하나입니다. 이 게임에서 제공하는 선수들의 스탯은 한때, 하드코어 세이버메트릭스 사이트인 팬그래프나 베이스볼레퍼런스에 필적할 정도 였습니다. (FG나 BA가 제대로 만들어지기 전, MLB의 오래전 선수들 스탯을 알아보기위해 가장 쉬운 방법이 베이스볼모굴의 데이터를 찾아보는 거였습니다.)
그는 DICE를 빌제임스의 ERC와 비교해서 설명하는데, HR, BB, K와 달리 홈런이 아닌 안타는 투수의 능력과 무관한 면이 많기 때문에 빌제임스의 ERC에는 포함된 안타H를 배제하고 오직 HR,BB,HBP,SO 만으로 계산모형을 만들었다고 합니다.
제 생각에, 정통적인 통계학적 방법론으로 접근한 보로스맥크라켄과 달리 게임의 시뮬레이션 로직을 디자인하며 그들은 자연스럽게 DIPS 이론과 같은 도착점에 이르게 된거 같습니다. 세상의 양대오덕인 겜덕과 야덕이 만나면 이런 굉장한 일을 해낼 수 있는가 봅니다.
다만, 보로스맥크라켄의 DIPS는 그 아이디어의 핵심, 즉 “방망이에 맞아나가 그라운드를 향한 공” 즉 BABIP라는 개념을 제외하고는 거의 모든 것이 이후의 논쟁을 통해 수정되거나 기각되었습니다. 그의 통계적 분석은 기껏 98_99 2시즌 동안에 한정된 아주 제한적인 것이었고 좀더 긴 시즌을 분석한 결과 투수는 어느정도 BABIP을 지배하는 것으로 밝혀졌습니다.
보로스맥크라켄이 최고수준의 투수라도 BABIP은 리그평균과 비슷하다 주장하며 예로 들었던 그렉 매덕스, 랜디존슨, 페드로마르티네즈 조차 커리어 전체로 분석을 확대하면 평균보다 낮은 BABIP을 보여줍니다. 사실 페드로 마르티네즈가 리그평균보다 높은 BABIP을 기록한 것은 1999년이 거의 유일했습니다. 맥크라켄은 1998-99 기간만을 분석했는데 하필 마르티네즈의 1999년이 이 2시즌 동안에 포함되었던 것 뿐입니다.
또 팀 웨이크필드 같은 너클볼러는 확연하게 낮은 BABIP을 기록했고 제이미 모이어 같은 흑마구 계열의 투수들(soft-tossing lefties)도 그랬습니다.
마이너리그 수준의 투수들 역시 MLB의 평균적인 투수들 보다 높은 BABIP을 보입니다.
참고 - Can pitchers prevent hits on balls in play? Tom Tippett July 21, 2003
http://207.56.97.150/articles/ipavg2.htm
보로스맥크라켄이 개척한 새로운 길
하지만 그렇다고해서 그가 DIPS이론을 통해 세이버메트릭스에 끼친 혁명적 영향이 평가절하될 필요는 없습니다. 세이버메트리션들이 이전 30년 동안 찾아헤매던, ERA 속에 숨어있던 피칭 이외의 것을 어떻게 구분해내는지 그리고 그것을 구분해낼 경우 무엇이 보이는지 밝혀냈기 때문입니다.
그래서 DIPS이론의 가치는, "방망이에 맞아서 그라운드로 간 공이 안타가 될 확율은 어느 투수가 비슷하다"라는 다소 과장되거나 잘못 도출된 그의 결론이 아니라, 투수의 스탯을 수비 무관 스탯과 그렇지 않은 스탯으로 구분해서 생각한 그 발상에 있습니다.
그 이전의 모든 세이버메트리션들이 ERA 같은 피칭스탯으로부터 어떻게 수비나 기타 제3의 요인이 관여한 영향을 제거할 수 있을지 골몰하며 갖가지 통계적 기술을 적용해보는 동안, 맥크라켄은 수비의 영향을 받는 투수의 스탯과 그렇지 않은 스탯을 따로 떼어놓고 그 각각의 독립적인 elemental 스탯으로부터 본질에 접근해들어간 것입니다. 해서 야구의 복잡성 너머로 득점=출루*진루 라는 법칙을 찾아낸 빌제임스를 뉴튼에 비한하면, 맥크라켄은 화학반응에 의해 더이상 나뉘지 않는 물질의 최소단위 원자 모형을 착안한 돌턴에 어울릴까요?
DIPS혁명 이후 세이버메트릭스의 투수 관련 연구는 빠른 속도로 진척됩니다. 맥크라켄의 기여는 고도로 발달한 [중세적 연금술]을 비록 초보적이고 오류투성이지만 완전히 새롭고 혁신적인 [근대적 화학]으로 대체한 것입니다. 이론이 세워졌으니 잘 훈련되고 열정에 가득찬 세이버메트리션들이 거기 달라붙었고 속속 눈이 띠는 결과물을 만들어지기 시작합니다.
그리고 보로스맥크라켄은 아마도 자신에게 어울리는 길을 찾게 됩니다. (그가 대중적으로 유명한 세이버메트릭스 이론가가 되기엔 그의 글은 좀 난독증을 부릅니다) 그가 DIPS 아이디어를 발표하고 그의 이메일 박스에 (그중 상당수는 너 미친거야? 라는 투의 내용인) 엄청난 양의 메시지들이 쏟아져 들어온 후 얼마의 시간이 지났을 때, 그를 정말 행복하게 했을 메시지도 하나 도착했습니다. “자네 우리와 함께 일해보지 않겠나?”
대표적인 MLB 세이버메트리션GM 이었던 테오 엡스타인이 그를 부른 것입니다. 그는 2005년까지 보스턴을 위해 일했고 이후 미식축구 쪽 일에도 관여한 거 같습니다. 그는 미국의 세이버메트리션 그룹 중 가장 아카데믹한 성향이 강한 baseballthinkfactory:BBTF 와 연결되어 있습니다. (XR을 디자인한 짐퍼타도가 BBTF의 중심인물 중 하나입니다)
Talkback to Baseball-In-Play 토아일당
글에 대한 의견을 기다립니다.
야구통계 또는 세이버메트릭스의 가치는 콤마 단위로 선수를 평가해서 줄세우는데 있지 않습니다. 그것의 엄격함과 정밀함은 편견으로부터 자유롭기 위함입니다. 그리고 야구를 좀더 다양한 방법으로 즐길 수 있게 해줍니다. (이 글의 저작권은 필자 본인에게 있습니다)
Blog baseball-in-play.com/115 facebook www.facebook.com/Baseball.In.Play