[썩빡꾸의 세이버메트릭스] 유사도 점수(similarity score)를 활용해 선수 간 유사성을 확인하는 방법
'스토브리그' 임동규는 박병호-샌즈급 타자?
프로야구 프런트를 소재로 다룬 SBS 드라마 ‘스토브리그’가 화제다. 특히 드라마 초반에는 KPB리그 만년 하위권인 드림즈 구단의 중심타자 임동규(조한선 분)가 많은 주목을 받았다.
그는 뛰어난 실력을 갖춘 팀의 간판 4번타자임에도 불구하고, 여러 문제로 타 구단으로 트레이드되고 만다.
임동규의 최근 시즌 성적은 타율/출루율/장타율 각각 .338/.368/.599이다.
그렇다면 2019 KBO리그를 기준으로 임동규와 가장 흡사한 성적을 기록한 선수는 누구일까?
이를 알아보기 위한 방법으로 세이버메트릭스의 대부 빌 제임스(Bill James)가 고안한 유사도 점수(similarity score)를 활용하는 방법이 있다.
여기에 선수 포지션에 따른 추가 조정을 한다. 포수는 240점, 유격수는 168점, 2루수는 132점, 3루수는 84점, 외야수는 48점, 1루수는 12점, 지명타자는 0점을 가정하여, 두 포지션의 점수 차이만큼을 더 감소시킨다.
그러나 이 방법은 너무나 많은 지표를 비교해야 하고 계산도 복잡한 편이다.
이에 필자는 타자의 가장 대표적인 스탯인 타율/출루율/장타율만으로 단순하게 선수의 유사도를 구하는 방법을 새로 고안해봤다.
수식은 다음과 같다.
유사도 = - (타율 차이^2 + 출루율 차이^2 + 장타율 차이^2)^0.5
타율, 출루율, 장타율 차이를 각각 제곱한 후에 더해서, 여기에 루트를 씌우는 것이다. 유클리드 거리(Euclidean distance)를 계산한 것과 동일하다.
즉, 타율, 출루율, 장타율로 이루어진 3차원 공간에서 두 성적의 거리를 계산한 것이다.
거리가 짧을수록 유사도가 높도록 하기 위해 여기에 마이너스 부호를 취했다. 결국, 이 점수가 높을수록 두 선수의 성적은 서로 유사한 것이다.
그럼 이를 기준으로, 드라마 속 KPB리그에서 임동규와 유사한 수준의 선수를 KBO리그에서 찾아보자. 2019년 드림즈 ‘임동규’와 유사도가 가장 높은 타자들은 다음과 같다.
#유사도 점수 1~15위
임동규와 타격성적이 가장 유사했던 타자는 키움의 제리 샌즈였다(-0.071).
그의 슬래시라인은 .305/.396/.543으로 임동규의 성적(.338/.368/.599)과 유사하다. 다만 임동규보다 타율과 장타율은 더 낮고, 출루율은 높다.
그 다음으로는 KT의 멜 로하스 주니어가 유사하다(-0.072). 샌즈와 유사도 점수도 거의 비슷하다. 로하스는 샌즈보다 타율이 조금 더 높은 반면, 출루율과 장타율은 더 낮다.
외야수 포지션까지 감안하면 샌즈와 로하스가 드림즈 '임동규'와 가장 흡사하다고 볼 수 있다.
국내 선수 중에서는 NC 양의지와 키움 박병호가 가장 가까웠다.
양의지는 임동규보다 타율과 출루율이 훨씬 더 높긴 하지만, 전체적으로 성적이 꽤 유사하다. 한편, 박병호는 타율이 .280으로 꽤 낮긴 하지만 출루율과 장타율은 비슷하다. 준수한 외모도 흡사하다.
드림즈 '임동규'와 유사한 타자들이 샌즈, 로하스, 양의지, 박병호와 같은 선수임을 감안하면, 임동규가 드라마 속 가상의 리그인 KPB에서 얼마나 뛰어난 타자인지를 짐작할수 있다.
'야구기록실 케이비리포트' 기록에 따르면, 이 KBO 네 명의 평균적인 승리기여도(WAR)는 무려 6.0에 달한다.
개량한 유사도 점수 계산법은 타자의 타율, 출루율, 장타율 만을 고려한다.
리그 수준 혹은 신체조건이나 포지션 등을 고려하지 않아 한계가 있지만, 매우 간단하게 비슷한 수준의 타자를 찾아낼수 있다는 점에서 유용하다고 볼 수 있다.
[기록 참고 : 야구기록실 KBReport.com, 스탯티즈, KBO기록실, suxism.com]
[관련 칼럼] 한화 시절 류현진은 정말 불운했을까? (클릭)
[관련 칼럼] 2019 KBO 최고 구종, '올라프' 유희관이 던졌다?(클릭)
[관련 칼럼] 린드블럼-양현종, 2019 최고 투수는 누구?(클릭)
글: 세이버메트릭스 칼럼니스트 박지훈(a.k.a 썩빡꾸), 김정학 / 감수 및 편집: 김정학 기자