강정호의 DRS와 UZR 수비 스탯
2015시즌 강정호의 활약은 대단했다.
부상으로 9월 중 시즌아웃을 당했음에도 불구하고 4.0의 bWAR를 기록하였는데, 이는 메이저리그 전체 30위권의 매우 우수한 성적이다. 특히 +4점의 안정적인 수비 런세이브(DRS: Defensive Runs Saved)도 인상적이다.
반면 팬그래프에서 제공하는 그의 UZR(Ultimate Zone Rating)은 -0.2점에 불과하다. 그렇다면 두 수비 스탯은 서로 어떤 차이가 있을까?
(*UZR이란? 구장을 64개의 구역으로 분할하여, 구역마다 수비의 난이도를 달리 설정하여 점수로 환산해 선수의 수비 능력을 평가하는 지표다. 가령 수비 난이도가 쉬운 구역에서 수비에 실패할 경우 마이너스 점수를 받으며, 어려운 구역에서 수비를 성공해 낼 경우 플러스 점수를 받는 식이다. 출처: http://blog.naver.com/zinx220/220638398612)
DRS와 UZR은 모두 해당 포지션에서, 리그 평균적인 수비수보다 얼마나 실점을 더 세이브 하는지를 측정한다. 공통적으로 BIS(Baseball Info Solution)의 데이터를 활용하며, 그라운드를 여러 개의 존(zone)으로 구분하여 계산한다는 점에서 동일하다. 따라서 동일한 수비 이벤트에 대해 두 스탯은 원칙적으로 동일한 결과값을 산출해야 하며, 그럼에도 불구하고 값이 다른 것은 데이터 가공 및 조정 방법의 차이로 인한 오차 때문이다.
그렇다면 두 스탯의 차이점은 구체적으로 무엇일까? UZR 스탯을 고안한 Mitchel Lichtman(MGL)에 의하면, 두 스탯 계산의 큰 차이점은 다음과 같다.
- 데이터 샘플의 차이
- 존 크기의 차이
- 파크팩터 적용 방법의 차이
첫째, DRS는 1년의 샘플 데이터를, UZR은 6년의 샘플 데이터를 활용한다. 따라서 DRS는 해당 시즌의 평균적인 퍼포먼스 기준으로 수비 기여도를 평가하기에 더 적합하다. 하지만 그만큼 구간별로 수집되는 이벤트의 숫자는 적어지므로, 구간별로 산출된 난이도에 대한 신뢰도는 그리 높지 않다.
둘째, UZR은 그라운드를 78개의 존으로 나누는 반면, DRS는 더 작게 많은 구간으로 나눈다. 따라서 동일한 수비 이벤트에 대해서 DRS는 더욱 정밀하게 분류할 수 있지만, 그만큼 구간당 샘플 사이즈는 적어진다.
셋째, UZR은 좌익수, 중견수, 우익수, 내야수로 구분하여 파크팩터를 따로 적용하고 있다. 반면 DRS는 각각의 구간별로 파크팩터를 적용한다. 구장 효과가 강하게 나타나는 좁은 위치에 대해서는 정확한 평가가 가능하지만, 오히려 불필요한 노이즈를 유발할 수도 있다.
이 외에도 사소한 조정에 있어서 다른 차이점이 있다. 그러나 차이를 유발하는 주된 요인은 위의 내용이다. 결론적으로, DRS는 더욱 세부적으로 조정을 가하는 반면, 훨씬 더 적은 샘플을 통해 산출된다. 매년 달라지는 수비의 수준 및 방법을 반영하기에는 DRS가 더 유리하지만, 적은 데이터로 수비 능력을 판단하기에는 조금 더 변동성이 적은 UZR이 유리하다고 할 수 있다.
더욱이, DRS는 매번 평균에 대해 0으로 재조정하지 않는다. 따라서 2014년 리그 전체의 UZR은 거의 0에 가까운 반면, 리그 전체의 DRS는 -39로 나타난다. 심지어, 2004년엔 리그 전체 DRS가 무려 -101이다. 스탯의 불완전성으로 인해, 리그 전체 선수들의 수비 성적이 리그 전체 선수들보다 -101점이 더 낮다는 모순된 결과가 도출된 것이다.
이처럼 DRS는 리그 전체 평균값 자체가 양수 또는 음수로 편향될 수가 있으므로, 리그 평균의 값이 일관성을 유지하고 있는지도 함께 확인하는 것이 좋다.
그러면 2015년 강정호의 DRS와 UZR을 좀 더 세부적으로 살펴보자. 그는 3루수로서 +4 DRS와 +1.6 UZR을, 유격수로서 0 DRS와 -1.8 UZR을 기록하였다. 두 스탯 수치 간의 일관성이 느껴지지는 않는다.
사실 2015년 8월 5일까지100이닝 이상의 수비수 데이터를 기준으로, DRS와 UZR 간의 상관계수는 .753으로 비교적 높게 나타난다. 그러나 포지션별로 보면 3루수는 .820, 유격수는 .654으로, 유격수에 대해서는 특히 두 스탯의 일치성이 떨어진다.
또한, DRS는 UZR에 비해 변동성이 조금 더 크다는 점을 감안해야 한다. 따라서 적은 샘플의 DRS로 실제 수비 실력을 확인하기 위해서는 UZR 이상으로 더욱 값을 회귀해서 해석해야 한다.
그렇다면 이렇게 DRS와 UZR 값이 일치하지 않을 경우 어떻게 해야할까? 더 오랜 시간 관찰하여 샘플 데이터가 누적되면 두 스탯은 어느정도 안정화될 수 있을 것이다. 그렇지만 현재의 상황에서는 다른 수비 지표를 확인하는 방법도 좋다.
PMR(Plays Made Ratio) 이란 스탯을 참고해 보자. PMR은 인사이드 엣지(Inside Edge)에서 제공하는 수비 지표를 바탕으로 리그 평균적인 선수 대비 수비수의 처리 능력을 인덱스로 나타낸 스탯이다. 평균적인 선수는 100의 값을 갖고, 처리 능력이 뛰어날수록 그보다 더 높은 값을 갖는다.
그럼 강정호의 PMR 스탯을 계산해보자. 그는 3루수로서의 성적은 PMR+이 117.5, 유격수로서는 PMR+이 82.4로 계산된다. 즉, 3루수로서 평균보다 17.5% 더 많이 타구를 처리했으며, 유격수로서는 평균보다 18% 덜 처리했다. PMR 결과만으로 봤을 때는 DRS보다 UZR 성적에 조금 더 가깝다고 할 수 있다.
그러나 사실 작년에 그가 처리한 타구 횟수는 312회에 불과하다. Tom Tango에 의하면 최소 400번의 수비 플레이는 관측해야, 타자로서 약 200타석의 출루율 스탯 만큼의 신뢰도를 얻을 수 있다고 한다. 결국, 작년 결과만으로 강정호의 수비 스탯을 판단하기에는 이르며, 다만 PMR 수치를 감안했을 때 DRS보다는 UZR 쪽에 더 가깝다고 할 수 있겠다.
by 썩빡꾸 칼럼니스트 (http://suxism.com)