[썩빡꾸의 세이버메트릭스]투수별 구종 예측의 난이도를 측정하는 방법
[썩빡꾸의 세이버메트릭스]투수별 구종 예측의 난이도를 측정하는 방법양현종은 쉽고 린드블럼은 어렵다?
특정 투수가 어떤 구종을 던질지 예측하기 어려운 정도를 정량화할 수 있을까?
가능하다.
바로 미국의 야구기록 분석 사이트 [베이스볼위드알, baseballwithr]을 통해 소개된 '엔트로피 계산법'을 활용하면 된다.
통계역학에서 '엔트로피(Entropie)'란 확률변수의 불확실성을 나타내기 위한 함수이다.
[엔트로피 계산법]에서는 투수가 던진 각 구종의 비율을 엔트로피 함수에 적용하여, 구종 예측이 얼마나 어려운지 정량적으로 평가할 수 있다.
엔트로피 계산 공식은 다음과 같다.
위 공식에서 p1, p2, p3, ..., pn은 각 구종의 발생 비율을 의미한다.
빠른 이해를 위해 속구와 슬라이더를 각각 60%, 40%로 구사하는 투수가 있다고 가정하자. 그러면 p1은 0.6, p2는 0.4가 된다.
구종별 비율에 자연로그(log)를 적용하고, 다시 비율로 가중치를 곱하여 이들을 더하면 된다. 더해진 로그값을 양수로 만들기 위해 앞에 마이너스를 붙인다.
각 구종의 발생 비율이 비슷할수록, 구종이 다양할수록 엔트로피 값은 증가하게 된다. 반대로 발생 비율의 차이가 크고 투수가 구사하는 구종의 수가 적을수록 엔트로피는 낮게 된다.
그렇다면 KBO리그의 사례를 살펴 보자.
기록사이트 [스탯티즈]에 공개된 자료에 따르면 2017시즌 MVP인 KIA 에이스 양현종은 속구, 슬라이더, 커브, 체인지업을 각각 60.2%, 15.2%, 6.1%, 18.5%의 비율로 던졌다.위의 공식에 따르면 엔트로피는 1.102로 계산된다.
반면 두산 장원준은 각각 42.1%, 25.9%, 10.9%, 21%의 비율로던졌다. 엔트로피는 1.311이다. 장원준이 양현종에 비해 구종을 예측하기 더 어려운 투수라는 의미다.
일반적인 투수들의 엔트로피는 1.0 근처에 분포하며, 1.3보다 크면 구종 예측이 어려운 투수로 간주할 수있다.
그럼 지난해 규정이닝을 소화한 투수들의 엔트로피 순위를 확인해보자.
# 2017시즌 엔트로피 지수 순위(규정이닝 투수 대상)
롯데 외국인 에이스 레일리가 규정이닝을 채운 투수 중 가장 높은 1.590의 엔트로피를 기록했다.
그는 속구, 슬라이더, 커브, 체인지업, 싱커를 각각 27%, 13%, 14%, 20%, 26%의 비율로 구사했다. 구종도 다양했지만 속구의 비율이 27%로 낮아 예측이 가장 힘든 투수였다. 그의 뒤를 이어 SK 켈리, 넥센 브리검이 1.5 이상의 엔트로피를 기록했다.
반면 KIA 양현종은 규정이닝을 채운 19명의 투수 중 1.102로 가장 낮은 엔트로피를 기록했다.
속구의 비율이 60.2%로 타 투수에 비해 높았으며, 슬라이더(15.2%)와 체인지업(18.5%)의 비율은 상대적으로 낮았다.
그럼에도 불구하고 20승 6패 ERA 3.44 FIP 3.94 WAR 5.64로 최상위권 성적을 거뒀고 리그 MVP에 올랐다. 그만큼 그의 속구가 상대 타자들에게 효과적이었다고 해석할 수 있는 대목이다.
지난해 양현종의 속구 피OPS는 0.725로 리그 평균(0.791)에 비해 현격히 낮았고 그의 속구 구종가치는 18.3으로 규정이닝을 채운 투수 중 최고였다. (속구 구종가치 최하위는 SK 문승원, -16.3)
* 양현종의 탈삼진쇼 (4/13)
그렇다면 올시즌은 어떨까?
4월 16일까지 규정이닝을 던진 투수들을 대상으로 엔트로피 순위를 확인해보자.
# 2018시즌 엔트로피 지수 순위(4/16 기준 규정이닝 투수 대상)
두산으로 이적한 린드블럼이 현재까지 가장 높은 1.648의 엔트로피를 기록 중이다. 그는 속구, 슬라이더, 커브, 체인지업, 스플리터, 싱커 구종을 모두 다양하게 구사했으며, 각각 17%, 29%, 11%, 6%, 9%, 28%의 비율을 보였다.
패스트볼의 비율이 다른 선발 투수들에 비해 상대적으로 낮았으며, 슬라이더, 커브, 싱커는 많이 던졌다타자의 입장에서는 구종 예측이 매우 힘들었을 것이다.
현재까지 린드블럼은 3승 1패 ERA 2.84 FIP 3.06 WAR 1.06으로 영입 당시 기대에 걸맞는 활약을 펼치고 있다. 그 외에 롯데 레일리, NC 베렛, KIA 헥터, 두산 이용찬도 1.5 이상의 높은 엔트로피를 기록 중이다.
* 올시즌 리그에서 구종예측이 가장 까다로운 두산 린드블럼
반면 지난 시즌 엔트로피 최하위였던 KIA 양현종은 올시즌 역시 1.156 (17시즌 1.102)으로 규정이닝을 채운 30명의 투수 중 23위를 기록했다.
속구의 비율이 54.7%로 전체에서 가장 높았으며, 체인지업은 20.8%, 슬라이더는 18.7%의 비율로 구사했다. 커브는 5.8%에 그쳤다.
지난 시즌에 이어 올시즌에도 엔트로피가 낮은데, 그만큼 속구 의존도가 여전히 높다고 볼 수 있다. 다만 올 시즌 역시 ERA 2.73 FIP 3.50 WAR 1.02로 정상급 활약을 보이고 있으며 속구 피OPS 역시 0.729로 지난해 수준을 유지하고 있다.
지금까지 살펴 본 엔트로피는 구종별 비율의 고른 분포에 따라 각 투수에 대한 구종 예측의 난이도를 알려줄 뿐, 투수별로 최적의 구종 비율을 알려주는 지표는 아니다.
양현종의 속구나 김광현의 슬라이더처럼 확실한 무기를 지닌 투수라면 해당 구종을 자주 구사하는 편이 타자를 제압하는 데 유리할 것이다.
따라서 엔트로피 지표가 높다고 성적이 좋을 것으로 기대할 수는 없다. 위의 표에서도 확인할 수 있듯 엔트로피 지표와 FIP, WAR은 특별한 상관관계를 보이지 않는다.
단지 이 지표는 타자 입장에서 해당 투수의 구종을 예측하기가 얼마나 어려운지만을 알려줄 뿐이다. 투수의 성향을 판단할 때 참고할 수 있는 지표로 활용하는 것이 타당할 것이다.
(관련 칼럼: 감독의 투수 교체 능력을 평가할 수 있는 기록은? )
[기록 출처/참고 : 야구기록실 KBReport.com, 스탯티즈, KBO기록실, suxism.com, baseballwithr ]
세이버메트릭스 칼럼니스트 박지훈 / 정리 및 편집: 김정학 기자
☞ 후원하기! 비영리 야구기록실 케이비리포트 후원 [kbr@kbreport.com]