2014.6.24

잠실

삼성

7 - 6

롯데

잠실

삼성

7 - 6

롯데

잠실

삼성

7 - 6

롯데

잠실

삼성

7 - 6

롯데

STAT BUZZ
 

이전 연도 WAR 성적으로 다음 연도 WAR 성적을 예측할 수 있을까?

2018-12-31 월, 15:54 By 썩빡꾸
타자의 이전 연도의 WAR 성적을 기반으로, 다음 연도의 WAR를 예측할 수 있을까? 그렇다면 그 정확성은 얼만큼일까? 이를 확인해보자. 메이저리그의 1920년부터 2018년까지 몇 년간 연속으로 최소 10타석 이상을 기록한 선수의 시즌 데이터를 기반으로, 이전 몇 년간의 성적과 다음 연도의 성적 간의 관계를 다변량 선형회귀(multivariate linear regression)로 확인했다. 관측한 연도의 수를 1년부터 5년까지 늘려가며 예측한 다음 해의 성적의 결정계수(R^2)는 다음과 같다.

1년: .554
2년: .617
3년: .646
4년: .663
5년: .674

이전 연도를 많이 관찰하면 관찰할수록, 다음 해의 WAR 예측 성능이 더 좋다. 특히 최근 1~2년 성적이 매우 중요한 정보이며, 3년 이전의 성적은 예측력을 더이상 크게 높이지는 못했다. 다음 해의 성적을 예측할 때 이전 3년의 성적이면 대략 충분해 보인다. 이 때 결정계수(R-squared)는 .646, 평균제곱근오차(RMSE)는 1.33이었다. 대략적인 성적의 추정은 가능하나, 오차가 큰 편이어서 정교한 예측은 어렵다고 봐야겠다.

이전 3년의 성적을 기반으로 예측할 때, 각 연도 성적에 대해서는 얼만큼의 가중치를 부여해야 할까? 회귀분석을 통한 연도별 각 가중치는 다음과 같다.

1년 전 WAR: .478
2년 전 WAR: .230
3년 전 WAR: .114

이 세 가중치의 합은 .822이다. 가중치의 합이 1보다 작다는 것은 이전 3년의 성적보다 이후 1년의 성적이 평균적으로 더 떨어진다는 뜻이다. 이는 평균회귀로 현상으로 설명 가능하다. 4년 연속으로 최소 10타석 이상을 기록한 타자는 상대적으로 앞 시즌에 잘했을 가능성이 높으며, 여기엔 행운의 요소가 포함되어 있다. 따라서 최근 연도에는 이전의 82% 수준으로 성적이 감소하는 것이다.

평균회귀 현상을 무시하고, 가중치의 합을 1로 조정하면, 연도별 가중치는 다음과 같이 조정된다.

1년 전 WAR: .582
2년 전 WAR: .280
3년 전 WAR: .138

이는 이전 연도 WAR로부터 다음 해의 WAR를 예측할 때, 평균회귀 현상을 고려하기 전 각 연도에 대한 가중치이다. 이를 정수배로 간단히 나타내면 약 6, 3, 1이다. 즉, 선수의 실력을 WAR만으로 판단한다면, 이전 3년 성적에 대해 약 6:3:1의 가중치로 고려하면 된다는 것이다. 이를 감안하여 아래와 같이 '가중평균 WAR'를 생각할 수 있겠다.

가중평균 WAR = (6 x '1년 전 WAR' + 3 x '2년 전 WAR' + 1 x '3년 전 WAR') / 10

이제 이 가중치를 KBO에 그대로 적용해보자. 물론, 리그수준과 경기 수가 다른 KBO에 이를 그대로 적용하기엔 다소 무리가 있다. 하지만 가중치가 실제로 크게 다르진 않을 것이므로, 메이저리그에서 구해진 가중치를 간단히 그대로 적용해보기로 하자. 2018년, 2017년, 2016년 성적에 대해 각 6:3:1의 비율로 가중평균한 WAR 순위는 다음과 같다. (WAR 수치는 KBReport.com 참조)

순위 이름 2016 2017 2018 가중평균
1 김재환 5.9 7.2 7.0 7.0
2 최형우 8.9 7.2 5.3 6.2
3 손아섭 5.2 5.6 5.6 5.5
4 양의지 4.7 2.8 6.8 5.4
5 최정   6.3 7.3 3.8 5.1
6 러프 - 4.6 6.0 5.0
7 전준우 0.0 3.2 5.9 4.5
8 박병호 - - 7.5 4.5
9 로하스 - 2.4 6.1 4.4
10 나성범 3.7 5.6 3.8 4.3
11 안치홍 - 4.2 5.1 4.3
12 박건우 4.2 7.0 2.9 4.3
13 구자욱 4.3 4.3 3.9 4.1
14 로맥 - 2.0 5.8 4.0
15 버나디나 - 5.0 4.2 4.0
16 이대호 - 3.9 4.7 4.0
17 김하성 3.1 4.8 3.4 3.8
18 한동민 - 3.9 4.1 3.6
19 최주환 - 1.8 4.9 3.5
20 박민우 3.8 4.9 2.3 3.2

2018년 MVP였던 두산 김재환의 가중평균 WAR가 가장 높았다. 그는 2018년뿐 아니라 2017년과 2016년에도 모두 성적이 뛰어났다. 3년의 성적을 모두 고려하는 가중평균 WAR에서 그가 높은 것은 당연하다. 다음으로는 기아의 최형우이다. 2016년과 2017년 워낙 뛰어났으나, 가중치가 가장 높은 2018년의 성적이 약간 감소하면서 순위가 2위로 밀려났다. 그 외에 손아섭, 양의지, 최정 등이 5 이상의 높은 가중평균 WAR를 기록했다.

가중평균 WAR는 최근 3년 WAR에 대해 단순히 가중치를 주어 평균을 계산한 수치이다. 하지만 최근 연도의 성적뿐만 아니라 그 이전 연도에 대해서도 고려를 함으로써, 다음 해 성적과의 상관성을 높인 지표이다. 계산이 간단하면서도 현재 WAR보다 선수의 실제 실력과 가깝다라는 점에서 유용히 사용할만하다.