승리Winning 그 이하의 승리, ERA 그 이상의 ERA
[Baseball Stats Glossary]
승리Winning 그 이하의 승리, ERA 그 이상의 ERA
타석당 안타비율 따위를 계산하는 [타율] 대신, 야구경기의 진짜 목적 “득점을 만드는 생산력”을 측정하기 위해 RC:Runs Created 라는 타격지표가 만들어진 것이 1985년이었습니다. 반면 투수의 평가지표에 관해서는 1990년대 후반에 이르기까지 확연한 진보를 찾아보기 힘듭니다.
(단타와 홈런의 차이를 무시하는 [타율]이란 지표에 대해 20세기 초반의 한 선각자는 “주머니에 든 동전의 갯수나 지갑에 든 지폐의 장수를 가지고 상대가 얼마나 많은 돈을 가졌는지 논하는 바보” 라는 식으로 일갈한 적이 있습니다)
야구통계 혹은 평가지표에서 가장 중요한 원칙은 두가지입니다. 첫째, 지표는 야구경기의 목적 즉 승리 또는 승리를 만드는 득점생산 및 실점억제 대한 기여도를 설명하고 있어야 한다. 둘째, 그 기여도는 감독이나 동료에 의해서가 아니라 선수 개인의 것으로 평가되어야 한다.
가장 흔한 그러나 가장 불투명한 투수평가지표
투수를 평가하는 대표적이고 오래된 지표는 [승리-패배] 와 [평균자책점ERA] 두가지입니다. 그런데 이 둘 다 야구통계의 첫번째 요건과는 대체로 일치합니다. 승리 그리고 득점(실점)을 측정하고 있기 때문입니다. 그런데 두번째 요건 그러니까 그 지표가 투수 개인의 것이냐 아니면 동료와 감독 혹은 제3자에 의해 좌우되는가 하는 게 관건입니다.
타격지표에 대해서 세이버메트릭션들이 “앞뒤에 서는 동료 타자들의 역할을 제거한” 타자 개인의 득점생산력 측정에 집중했다면, 투수에 대해서는 팀 타자들의 득점지원과 무관한 투수의 승리기여도를 측정할 수 는 방법에 관심을 가졌습니다. 대신 상대적으로 ERA의 경우 혼자 마운드에 서서 비롯된 결과이기 때문에, 9명으로 구성된 타선이 담당하는 공격과 달리 위에서 말한 야구통계의 두번째 요건도 어느정도 충족시킨다고 여겨진 것 같습니다.
투수에 대한 득점지원은 “runs are not created equal problem” 이라고 불립니다. 지금도 좀 그렇지만 당시 투수의 가치를 평가하는 절대적 기준으로 쓰이던 [승리투수]란 개념은 늘 “호투했으나 타선의 지원을 받지 못하고 불운하게 패전을 떠안은” 허다한 투수를 양산합니다. 동료 불펜투수의 영향도 마찬가지입니다. 지켜지지 못하고 날아간 선발투수의 승리는 눈물을 부릅니다.
1)5이닝 이상 마운드를 지켰고 2)투구를 마쳤을 때 팀이 리드하고 있으며 3)이후 동점이나 역전을 허용하지 않고 경기가 승리로 끝날 경우 주어지는 [승리투수]라는 기록에 대해 실제 그 선발투수는 얼만큼의 기여도를 가지고 있을까요? 혹은 9이닝 1실점으로 완투하고 0:1 패전투수가 되는 것은 합당한가요?
새로운 시도 - 득점지원무관 승패SNWL
1992년 스탠포드 컴퓨터공학과 대학원생 미첼 울브턴Michael Wolverton 은 득점지원과 무관한 승패 SNWL, support-neutral won–lost 란는 모델을 고안합니다.
SNWL은 우선 각 이닝별 아웃카운트별 리그 전체의 득점분포와 빈도를 기준 테이블로 만듭니다. 그리고 선발투수의 승패를 실제 팀타선이 아니라 가상의 리그평균타선의 득점지원을 가정하여 판정하는 것입니다. 이것은 확율의 값으로 계산됩니다.
예를들어 7회 무실점 피칭을 한 경우, 리그평균공격력을 가진 팀의 선발투수는 85%의 승리확율을 가집니다. 그 경우 이 투수는 SN_Win 0.85을 받습니다. 물론 바꾸어 말하면 15%의 패배확율을 가지고 있었기 때문에 SN_Lose 0.15 을 함께 받습니다. 이렇게 전체 경기의 SNWL을 계산해서 투수의 가상 승수를 측정합니다.
이럴 경우 전통적 기록방식에 의해서는 [패전]을 기록한 투수라도 SN_Win을 받을 수 있습니다. 만약 팀타선의 득점지원이 리그평균일 때, 8이닝 2실점 투수의 승리확율이 67% 였다면 비록 현실에서는 패전기록을 받았다 해도 그는 SN_Win 0.67 을 받습니다. 그래서 득점지원 무관 승패SNWL 입니다.
SNVA support-neutral Value Added 라는 것도 있는데, 이것은 계산된 SNW로부터 기준점:5할승률에 해당하는 를 0.5를 빼서 구합니다. WAR에서 사용하는 대체레벨ReplacementLevel 개념과 마찬가지입니다. (이 대체레벨ReplacemantLevel이 이라는 개념이 세이버매트릭스에 끼친 영향을 굉장합니다. 그리고 그것이 불러일으키는 오해와 왜곡의 여지 역시 엄청납니다. 이에 대해서는 다른 기회에 더 자세히 이야기하겠습니다)
그래서 7이닝 무실점 피칭을 한 투수의 SNW가 0.85 이기 때문에 SNVA 는 0.35가 됩니다. 한시즌 전체의 SNVA 값을 합하면 그 투수가 팀타선의 도움과 무관하게 자신이 기여한 플러스 승리의 숫자가 계산될 수 있습니다.
[승리투수]라는 지표만큼은 아니지만 ERA 역시 문제가 없는 것은 아닙니다. 투수의 실점에 미치는 팀수비의 영향 때문입니다. 방금 소개한 SNWL모델의 미첼 울브턴은 베이스볼프로스펙터스의 필자이기도 했는데 그는 수비의 영향을 투수지표에서 제거하는 방법을 고민하다 이렇게 말했습니다.
"내가 이 문제를 해결했어. 사람을 하나 사서 기록석에 앉혀놓고 팝콘을 잔뜩 안겨준 다음, 경기를 보게 하는거야. 만약 수비수가 평균적인 수준에서 벗어난 플레이를 보일 경우, 그 이닝의 나머지 상황을 논리적으로 재구성해서 투수의 실점을 더하거나 빼주는거야. 젠장."
통계적으로 관찰했을 때, 투수의 ERA에는 분명히 수상쩍은 부분이 있었습니다. 한 투수의 ERA는 시즌에 따라 좀 들쭉날쭉합니다. 만약, ERA가 투수의 능력에 의해 전적으로 결정되는 측정지표라면 투수가 부상 등의 특별한 변수가 없는 한 비슷비슷한 숫자를 찍어줘야 합니다. 이것을 보통 year-by-year correlation 이라 하는데 RC:RunsCreated 에 의해 극복된 [타율]의 year-by-year corr.= 0.477 인데, ERA의 year-by-year corr.= 0.409 입니다. corr.이 낮을수록 들쭉날쭉하다는 것인데, ERA의 corr.이 타율의 corr.보다 낮다면 뭔가 있기는 있는 겁니다.
아직 수비에 관해 밝히지 못한 시대
가장 먼저 의심해 볼 것은 물론 수비였습니다. [수비]는 세이버메트릭션들에게 초기부터 가장 관심있는 주제이며 동시에 가장 난해한 숙제였습니다. 가장 뛰어난 타자와 평균의 타자가 한시즌 동안 팀에게 몇점의 득점 차이를 가져다 주는가 라는 질문에 대해서는 RC(나중에는 XR과 wOBA)가 답을 해주었지만 수비는 그렇지가 못했습니다.
그런데, [수비]가 이렇게 어둠 속에 파묻혀 있는 동안에 [피칭] 역시 그럴 수 밖에 없습니다. 실점이란 [피칭]과 [수비]의 협력으로 결정되니까요. 하지만 세이버메트리션들은 고단한 도전에도 불구하고 아직 그 실마리를 찾지 못하고 있었습니다. 뭔가 있긴 있는데 그게 뭔지 알 수가 없었던 것입니다.
대신 다른 주목할 만한 진전이 있었습니다. peripheral ERA 인데 대략 기대ERA 라고 부르면 됩니다. 가장 대표적인 것은 빌제임스가 Handbook2000 에서 소개한 Component ERA 인데 CERA 나 ERC 라고도 부릅니다.
계산방법은 다음과 같습니다.
2004 edition of the Bill James Handbook:
ERC = (((H + BB + HBP)×PTB)/(BFP×IP))×9 − 0.56
where H is hits, BB is bases on balls (walks), HBP is hit by pitch, BFP is batters faced by pitcher, IP is innings pitched, and PTB is defined as:
PTB = 0.89×(1.255×(H − HR) + 4×HR) + 0.56×(BB + HBP − IBB)
where HR is home runs, IBB is intentional walks, and others are as above.
IBB를 구할 수 없을 때의 계산식:
PTB = 0.89×(1.255×(H − HR) + 4×HR) + 0.475×(BB + HBP)
If ERC is less than 2.24, the formula is adjusted as follows:
ERC = ((((H + BB + HBP)×PTB)/(BFP×IP))×9)*0.75
투수가 피칭의 결과로 실제 허용한 실점이 아니라 피칭의 내용, 즉 허용한 안타, 볼넷, 홈런 등을 계산해서 가상의 허용자책점을 계산하는 방식입니다. 빌제임스의 ERC는 --- [RC:Runs Created]를 뒤집어 놓은 것입니다.
RC는 타자가 실제로 스코어보드에 기록한 득점이 아니라 H, HR, BB 를 통해서 만들어낼 것으로 추정되는 중립적인 가상의 기여득점입니다. 그렇다면 반대로 투수가 허용한 H, HR, BB 를 이용해서 중립적인 가상의 허용실점을 측정할 수 있을 것입니다. 혹시 RC에 익숙한 분 중에서 산식의 가중치와 생김새가 눈에 익어보인다면 아마 그런 이유 때문입니다.
RC는 [득점 = 출루 * 진루] 라는 원리에 기반하여 디자인된 지표입니다. 그런것처럼 ERC 는 [실점 = 허용출루 * 허용진루] 가 됩니다. 식에서 (H + BB + HBP) 부분은 [허용출루]에 해당하고 PTB = 0.89×(1.255×(H − HR) + 4×HR) + 0.56×(BB + HBP − IBB) 부분은 [허용진루]에 해당됩니다. 볼넷과 몸맞공을 단순히 출루로만 보지 않고 안타H 보다 작은 가중치(0.475)를 부여하긴 하지만 출루 항목에 포함시킨 것도 눈여겨 볼 점입니다.
상황중립적인 투수평가지표 ERC
타자에게 RC가 그런 것처럼 ERC는 투수에 대해 ERA보다 휠씬 상황중립적인 평가지표를 적용할 수 있게 해줍니다. 특히 선발투수와 달리 주자가 이미 출루한 상황에 등판하게 되는 불펜투수의 경우 더욱 그렇습니다. 주자를 남겨두고 내려간 투수들에 대해서도 마찬가지입니다.
그런데 짧은 1루타를 쳤을 때 하필 2루와 3루에 주자가 있었고 애매하게 1아웃이었지만 마침 발빠른 2루주자가 홈까지 뛰어들어 얻게 된 2개의 타점기록으로 타자를 평가하는 것은 당연히 이 부적절할 수 있습니다. 그런데 투수의 경우도 그럴까요? 2루와 3루에서 대기하던 2명이 주자를 다른 누가 아니라 투수 본인이 허용했을 경우에 말입니다.
팀 수비수의 플레이가 실책 없이 정상적으로 이루어진 경우라면 허용한 2점은 역시 투수의 책임이라 해도 무방한게 아닐까요?
ERC와 ERA의 가장 큰 차이는, 소위 빅이닝 즉 연속된 안타,볼넷을 허용하는 경우에 벌어지게 됩니다. 7이닝동안 똑같이 4개의 1루타, 1개의 2루타, 1개의 홈런, 3개의 볼넷을 허용하고도 0실점으로 막는 경기가 있겠지만 저 모든 것을 한 이닝동안 허용했다면 적어도 5점이나 6점을 실점했을 것입니다. 앞의 경우라면 ERA=0 이겠지만 뒤의 경우라면 ERA>5 가 될겁니다. 그러나 ERC에서는 두 경우 모두 같아집니다. 이것이 타당한가요?
그럼에도 불구하고 ERC 같은 peripheral ERA 지표들은 경험적으로 투수를 더 잘 평가하는 지표처럼 보였습니다. 왜냐하면 이번시즌 ERA는 좋았지만 ERC는 나빴던 투수들은 대체로 다음시즌에 ERC와 비슷한 수준으로 ERA가 나빠지곤 했으니까요.
20세기가 다 저물도록 많은 세이버메트리션들은 더 객관적인 투수지표, 즉 팀타선의 영향, 수비수의 영향 혹은 그밖의 투수가 스스로 통제할 수 없는 제3의 요인으로부터 독립되어 투수 개인의 몫으로 돌려도 좋은 것을 찾아 헤매고 있었습니다. 그들은 종종 그들이 찾던 것에 거의 근접하기도 했지만 그게 무엇인지 확실히 알아내지는 못했습니다.
그동안의 투수지표에 대한 모든 것을 바꾸어놓았고 지금의 거의 모든 투수지표에 영향을 미친 DIPS수비무관피칭스탯 이 보라스 맥크라켄이라는 서른살 짜리 대학원생에 의해 밝혀지기까지 말입니다.
Appendix. KBO2013-14 기대자책점ERC 순위와 투수별 ERA-, FIP-, ERC- 비교
아래는 13시즌과 14시즌의 40이닝+ 투수들의 ERC순위입니다. 물론 보통 기대자책점 형태의 순위는 이닝이 많은 선발투수 그룹과 짧게 전력투구하는 불펜투수들을 구분해서 보는 것이 꼭 필요합니다. 다만 여기서는 ERC와 다른 투수평가지표 ERA, FIP 사이의 밸런스를 보기 위한 것이기 때문에 편의상 그냥 묶어서 정리합니다.
표 오른편에 함께 붙인 것은 해당 투수의 ERC-, ERA-, FIP- 입니다. 이 지표는 그 투수의 ERC, ERA, FIP를 해당 시즌 리그평균으로 나눈 값입니다. 조정ERC, 조정ERA, 조정FIP 라고 부릅니다. 예전에는 마이너스가 아니라 ERA+ FIP+ 로 표현하는게 더 흔했는데, ERA나 FIP는 값이 작을수록 좋은 것인데 + 형태의 조정지표는 값이 커질수록 좋은 의미를 가지다보니 직관성 문제로 이렇게 쓰는게 더 많아집니다. 대표적 세이버메트릭스 커뮤니티인 Fangraphs.com 에서 먼저 사용하기 시작한 것 같습니다.
14시즌은 조상우 밴덴헐크, 김승회 순으로 나갑니다. 에? 김승회? 팀성적으로 좀 가려졌던가본데 투구의 질이 굉장히 좋았나봅니다. ERA도 그런 경향이 있지만 짧은 이닝을 던지는 불펜투수들이 비율스탯에서 유리한 점이 있습니다.
선발투수 중에서 본다면 밴덴헐크 밴헤켄 리오단 니퍼트가 올라왔습니다. 리오단도 의외네요. ERA나 FIP가 썩 좋은 편은 아닌데 ERC에서는 아주 높게 평가됩니다.
ERA는 결과적인 허용자책점을 가지고 계산하기 때문에 특기할 만한 것은 없고, FIP가 피안타율이 높아도 홈런억제, 볼넷억제, 탈삼진이 좋으면 높게 평가받는데, ERC는 잘던지다가 한두이닝 몰아서 실점을 하거나 결정적인 장타로 실점을 했던 것 때문에 ERA가 나빠진 투수들이 상대적으로 ERC에서는 순위가 올라갑니다.
RC나 XR이 상황중립적인 스탯으로써 어떤 상황에서 안타나 홈런을 쳤는지와 상관없이 그저 더 많은 홈런, 안타, 볼넷이 더 높은 평가를 받듯이, 투수에게 ERC는 어떤 상황에서 맞았는지 상관없이 종합적으로 더 적은 홈런, 안타, 볼넷을 허용한 투수가 높게 평가받습니다. 상황중립적(neutral) 지표들의 특징입니다.
이런 면에 대해서 ERC의 정확도와 설명력을 의심하거나 평가절하하는 주장도 있겠지만, 결과적으로 한 투수의 지속적이고 장기적인 성적은 ERA보다 ERC가 휠씬 더 잘 설명하는 것이 사실입니다. ERA에 대해서 FIP가 그렇듯이 말입니다.
13시즌의 경우 선발투수만 놓고 볼 때, 리즈, 이재학, 니퍼트 순입니다.
Talkback to Baseball-In-Play 토아일당
글에 대한 의견을 기다립니다.
야구통계 또는 세이버메트릭스의 가치는 콤마 단위로 선수를 평가해서 줄세우는데 있지 않습니다. 그것의 엄격함과 정밀함은 편견으로부터 자유롭기 위함입니다. 그리고 야구를 좀더 다양한 방법으로 즐길 수 있게 해줍니다. (이 글의 저작권은 필자 본인에게 있습니다)
Blog baseball-in-play.com/115 facebook www.facebook.com/Baseball.In.Play