KBReport STAT Dic
wOBA (weight On Base Average)
개요
세이버메트리션들은 한 타자의 생산성을 보다 정밀하게 예측하기 위해 100년이 넘는 세월에 걸쳐 연구해왔다.
미국 야구 기록의 아버지라고 불리는 레인(Ferdinand Cole Lane)은 1915년 ‘왜 타율 시스템은 바뀌어야 하는가?’ 라는 기사에서 타율은 사람들이 가장 좋아하는 기록인 동시에 불필요할 정도로 부정확하다는 말을 했다.
타율은 계산이 쉽고 이해하기가 간편한 장점이 있는 반면, 모든 안타를 같은 가치를 지닌 것으로 판단을 한다는 문제점을 갖고 있다. 레인의 말처럼 주머니에 10개의 동전이 있다고 했을 때, 그게 정확하게 얼마인가를 맞추는 건 어렵다. 10개가 모두 500원짜리 동전인지, 100원짜리가 얼마나 섞여있는지 알 수 없는 것처럼 타율은 한 타자가 타석에서 어느 정도의 생산력을 가지는 지에 대해서 정확하게 평가할 수 없다. 이러한 문제점은 출루율과 장타율을 비롯한 다른 비율 통계들도 마찬가지로 가지고 있었다.
이러한 문제점을 해결하기 위해선 타자가 타석에 들어섰을 때 일어나는 각각의 사건의 가치를 분리해야 할 필요성이 있다. 그 이후, 한 시즌 동안 그 타자가 타석에 들어섰을 때 일어나는 각각의 사건의 가치를 더한다면 우리는 한 타자의 생산력을 보다 정확하게 평가할 수 있게 된다.
그렇다면 각각의 사건들은 팀의 득점에 어떤 영향을 끼칠까?
득점 가치( Run value )
<그림1. 한국프로야구의 상황 별 기대 득점(2013, KBReport)>
각각의 사건들의 진정한 가치를 계산하기 위해서 선행되어야 할 연구는 상황 별 기대 득점이다. 기대득점은 해당 상황에서 이닝이 종료될 때까지 기대되는 평균적인 득점을 의미한다. 그리고 타자가 타석에 들어섰을 때의 기대 득점은 각각의 사건이 갖는 득점 가치에서 분리되어야 한다.
예를 들어 0Out 주자 없음 상황의 기대득점은 0.54점이라고 했을 때, 이 상황에서 홈런을 친다면 1점을 득점하고 다시 0Out 주자 없음 상황이 되고 기대득점은 여전히 0.54점이 된다. 따라서 0Out 주자 없음 상황에서 홈런의 가치는 1점이 되는 것이다. 하지만 타석에 들어섰을 때의 기대 득점과 사건 이후의 기대 득점이 다르다면 이야기는 달라진다.
우리는 주자들의 상황에 따라 홈런으로 얻는 점수가 달라진다는 것을 경험적으로 이미 알고 있다. 2Out, 주자 만루 상황에서 홈런이 나오면 팀은 4점을 득점하게 된다. 하지만 2Out, 주자 만루 상황에서 홈런의 진정한 득점 가치는 4점이 아니다. 만루홈런을 친다고해서 이닝이 끝나는 것이 아니고, 만루홈런을 친 이후에도 공격의 기회가 남아있기 때문이다. 그리고 2Out, 주자 만루 상황 자체가 갖는 기대 득점은 만루 홈런의 득점 가치에서 분리해야 한다.
자체적인 연구 결과에 따르면 2013시즌 한국프로야구를 기준으로 했을 때 2Out, 주자 만루 상황에서 이닝이 종료될 때까지 각 구단들은 평균적으로 0.92점을 득점했다. 즉, 2Out, 주자 만루 상황의 기대 득점은 0.92점이다. 이런 상황에서 타자가 홈런을 쳤다면 팀은 4점을 득점하게 되고 2Out 주자 없음 상황이 된다.
<그림2. 한국 프로야구의 2Out 만루 상황에서 홈런의 득점가치>
따라서 2Out 만루 상황에서의 홈런의 득점 가치는 만루홈런 자체가 만들어낸 점수인 4득점과 만루홈런 이후 2Out 주자 없음 상황의 기대 득점인 0.11점을 더한 값에서 기존 2Out 만루 상황의 기대 득점을 뺀 3.19점이 된다.
사건 별로 이런 계산과정을 모든 상황에 대입해서 각각의 상황 별로 구한 다음, 가중평균을 얻은 값을 가리켜 Run Value라고 한다. (주자 상황 별로 얻는 득점이 고정된 홈런과 다른 사건들은 구하는 계산식에 있어서 차이가 있다.)
<그림3. 한국 프로야구의 각 사건 별 득점 가치(Run value)(2013, KBReport)>
wOBA의 공식
우리는 앞선 과정을 통해 각각의 사건들은 팀의 득점에 어떤 영향을 끼치는 지에 대해 복잡한 방식을 통해 알아냈다. 하지만 타자의 진정한 생산력을 수치화하기 위해서는 몇 가지 과정을 더 거쳐야 한다.
1) 어떤 타자가 홈런, 안타, 볼넷 등으로 출루하는 것은 동시에 아웃을 당하지 않았다는 것을 의미한다. 따라서 홈런, 안타, 볼넷 등 아웃을 당하지 않고 출루하는 사건에 대해서는 아웃을 당함으로 인해서 생기는 손해를 빼야 한다.
- 식1. rRV = Run Value - Out Run Value
2) wOBA에 쓰이는 uBB, HBP, 1B, 2B, 3B, HR의 wRV을 구한다음 각각의 발생빈도에 곱한 후 더한 다음, 보정 타석(AB+uBB+SF+HBP)으로 나눠준다.
- 식2. {((uBB의 rRV)*uBB)+((HBP의 rRV)*HBP)+((1B의 rRV)*1B)+((2B의 rRV)*2B)+((3B의 rRV)*3B)+((HR의 rRV)*HR)} / (AB+uBB+SF+HBP)
3) 리그 전체의 출루율과 리그 전체의 식2.를 맞추기 위해 임의의 숫자(wOBA Scale)을 곱한다. 많은 SABER Stats들이 그렇듯이 받아들이는 입장에서 익숙하게 받아들일 수 있도록 출루율과 스케일을 맞추는 과정이다.
- 식3. wOBA Scale * 리그 {((uBB의 rRV)*uBB)+((HBP의 rRV)*HBP)+((1B의 rRV)*1B)+((2B의 rRV)*2B)+((3B의 rRV)*3B)+((HR의 rRV)*HR)} / (AB+uBB+SF+HBP) = 리그 출루율
4) 식3을 통해 알 수 있듯이 어떤 사건의 rRV에 wOBA Scale를 곱한 값이 한 사건의 wOBA 계수가 된다. KBReport에서는 한국프로야구의 Run Value를 바탕으로 가공한 wOBA 스케일을 제공하고 있으며, 곧 시즌 단위로 세분화 하여 제공 할 예정이다.
- 식4. wOBA = (wuBB*uBB)+(wHBP *HBP)+(w1B*1B)+(w2B*2B)+(w3B*3B)+(wHR*HR)} / (AB+uBB+SF+HBP)
의미
사건 별 득점 가치를 가공하여 타자의 생산력을 출루율 Scale에 맞춰 나타내주는 비율 통계이다. 상황 별 기대득점과 한 시즌 동안 상황 별로 일어난 실제의 득점을 바탕으로 했기 때문에 득점과의 상관관계가 현존하는 타격통계 중 가장 우수하며 기존 타자통계자료들에서 출루율의 가치가 저평가 받는 문제점을 거의 완벽하게 개선해냈다.
다만 여타 기본 타격통계와 마찬가지로 구장효과(Park factor)는 반영하지 않고 있으며, 주루와 타격을 완전히 분리해내지 못한다는 단점을 가지고 있다. 그리고 각각의 사건의 상황 별 평균 득점 가치를 이용했기 때문에 해당 시즌 타자의 실제 타석 상황을 완전히 반영하지는 못하고 있다.
<그림4. wOBA의 해석 (출처: www.fangraphs.com)>