2014.6.24

잠실

삼성

7 - 6

롯데

잠실

삼성

7 - 6

롯데

잠실

삼성

7 - 6

롯데

잠실

삼성

7 - 6

롯데

STAT BUZZ
 STAT 리포트

삼성 라이온즈의 고효율 머니볼

2015-09-01 화, 01:33 By KBReport

몇년 전까지만 해도 삼성 라이온즈가 타 팀과의 경기에서 큰 점수차로 지고 있거나, 연패에 빠질 때면 이런 반응이 쉽게 나오곤 했다. `돈성은 왜 그렇게 못하냐`, `돈을 그렇게 많이 주는 프런트가 문제다`, `삼성 모기업이 돈이 많으니까 막 퍼주는 것이다. ` 이런 반응을 보이는 이들의입장 중 대체로 많이 언급되는 이유는 1. 모기업의 지원이 많은 삼성의 프런트는 선수들을 과대평가 하며, 2. 세이버메트릭스에 상관없이 돈만을 이용한 비효율적인 선수단을 구성한다. 라는 것이다. 이런 시선이 정말 유효한 것인지 확인해 보도록 하자.

이 표는 한국콘텐츠미디어에서 만든 2014년 한국 1000대 기업 매출 순위이다. 보이는 것과 같이, 1000대 기업 중 가장 많은 매출을 기록한 회사는 삼성이었다. 그 뒤로는 현대(KIA), SK, LG등의 기업이 각각 2위(4위), 14위, 15위에 올랐다. `돈성`이라 부르는 몇몇 사람들의 말처럼 삼성 구단 모기업의 재정은 타 구단과 비교할 바는 아니라는 것을 확인할 수 있다. 그러면 실제로 삼성이 선수를 과대평가 하는지 알아보자.

타율과 같이 실제 득점가치를 알려주지 못하는 지표를 기준으로 하면 구단 연봉과 구단 승률 사이의 상관관계가 낮아지고, 출루율이나 OPS와 처럼 득점가치와 밀접한 지표를 기준으로 하면 구단 연봉과 구단 승률 사이의 상관관계가 높아질 거라 예상할 수 있다. 

이른바 세이버 지표들은 클래식 지표보다 승률과 더욱 밀접한 관계를 보여주고 있기 때문에, 이러한 지표를 수용한 팀, 세이버메트릭스 친화적 팀은 선수를 객관적으로 평가하여 연봉을 효율적으로 지출하고, 연봉 총액과 승률 사이의 상관관계를 더욱 높일 수 있을 거라 추정할 수 있다. 

그러므로 `삼성이 선수를 과대평가 하고 있다` 라는 말을 증명하기 위해서 필자는 연봉의 합계와 승률의 상관관계를 따져보기로 했다. 아래의 표는 2008년부터 2014년까지의 팀 별 승률과 총 연봉의 상관관계를 나타낸 표이다. Pearson 상관계수를 이용했다. (출처: 네이버 스포츠, KBO)

*KT와NC는 표본이 작기 때문에 제외

상관계수가 마이너스가 나왔다는 것은 수치 데이터가 증가하면 다른 수치 데이터는 감소하는 관계, 즉 총 연봉이 커질수록 승률이 떨어진다는 말이다. 넥센, LG, 한화, 삼성을 제외한 5개 구단이 마이너스를 기록했다, 이 뜻은 넥센, LG, 한화, 삼성을 제외한 5개 구단이 구단이 비효율적인 경기운영을 한, 세이버-친화적이지 않은 팀이라는 것이다. 

하지만 이 표를 보면 알듯이, 넥센을 제외하고, 총 연봉과 승률의 상관관계를 따지는 것은 그렇게 의미 있는 숫자를 만들지는 않았다. 그럼 MLB는 어떨까? 아래의 표는 최근 야구계의 성과를 담은 책 `세이버메트릭스 레볼루션` 에서 나온 `머니볼` 출간 이후 MLB팀들의 연봉 총액과 구단 승률 사이의 상관 관계를 나타낸 표이다.


MLB도 9년 동안 상관계수는 모두 의미 있는 숫자를 나타내지 않았다. 벤저민 바우머와 앤드루 짐발리스트는 이렇게 말했다, “이것은 새로운 지표가 쓸모 없다거나, 세이버 메트릭스의 전파가 실제로 이루어지지 않았다는 뜻은 아니다. 더 많은 데이터가 필요하고, 또 아직 결론을 내기 이르다는 뜻일 뿐이다.” 라고 말했다. 필자도 그들의 생각의 동의 한다. 

그리고 KBO는 FA 인플레이션 현상이 상관계수의 값에 영향을 준 것으로 추측된다. FA 인플레이션 현상 때문에 높은 연봉을 받는 선수들이 많아져서 많은 팀들의 상관계수가 마이너스가 나온 것이라 추측된다. 아마 FA 인플레이션만 완화된다면 많은 팀들이 더 높은 상관관계를 기록 할 수 있을 것이다.

앞에서 말한 이유들 때문에 팀 연봉과 승률의 상관관계를 알아보는 것은 의미 있는 숫자를 도출하기 어렵다는 것을 알 수 있다. 그래서 필자는 구단이 얼마나 세이버메트릭스를 사용하고 있는지를 알고 있으면 선수들이 과대 평가 되었는지 알 수 있을 것이라고 생각했다. 

구단이 얼마나 세이버메트릭스를 사용하고 있는지 알아보는 가장 쉬운 방법은 구단 조직도를 보는 것이다. 하지만 구단 조직도는 구하기 어렵고, 조직도에 모든 직원의 업무가 나타나있는 것도 아니다. 또, 세이버메트릭스를 다루는 직원의 직함이 항상 `세이버메트릭스 분석가’라는 호칭을 가지고 있지 않기 때문에 제외하였다. 그리고 스카우트와 세이버메트리션이 하는 일의 경계가 모호해지고 있고, 분석 팀이 하는 일이 현장의 의사결정에 반영되지 않고 있는 점이 있기 때문에 구단이 얼마나 세이버메트릭스를 활용하는지 알기 힘들다. 

그렇기 때문에 다른 방법은 구단이 선수단 구성과 작전에 접근하는 방식을 알아봄으로써 세이버 편향도를 조사하는 것이 있을 수 있다. 득점과 상관관계가 높은 출루율이 선수단 구성에 어떻게 영향을 주었는가를 살펴보는 것이 세이버 편향도를 조사하는 데 유용할 거라 생각할 수 있다. 출루율이 높은 타자를 영입하는 것으로도 높은 출루율의 팀을 만들 수 있지만, 코치진이 선구안의 중요성을 강조 함으로써도 달성할 수 있다. 

하지만 구단간의 출루율을 비교하는 것은 세이버 편향도를 나타내기에 충분하지 않다. 왜냐하면 연봉 총액이 높은 구단일수록 타율과 출루율이 모두 높은 선수를 보유하고 있을 가능성이 높기 때문이다. `세이버메트릭스 레볼루션` 에서는 이런   점들을 고려하여 연봉 총액의 효과를 중립화하기 위하여, 타율 대비 출루율의 비율을 이용하여 세이버 편향도를 조사하였다. 구장의 크기와 재정이 좋은 구단을 분류하여 출루비를 보정하는 것이 더 정확한 값을 얻을 거라 예상되지만, 데이터의 표본이 적기 때문에 제외하였다. 

다음 표는 KBO리그의 `세이버메트릭스` 라는 개념이 알려지기 시작한 2009년부터 2015년 까지의 구단별 타율과 출루율의 비다. 

2009년(출처: 네이버 스포츠, KBO)      

2010년

2011년

2012년

2013년

2014년

2015년(8월 24일 기준)

2009~2015 824

*KTNC는 표본이 작기 때문에 순위에서 제외

이 표는 대체로 팀의 순위와 일치했다. 2009년 기아가 우승을 했을 때의 비율은 1위를 마크 하였다. 2010, 2011삼성, 2013, 2014 넥센, 2015한화까지, 좋은 성적을 낸 팀은 비율 순위도 높았다. 삼성은 최근 4년간 팀 순위는 모두 1위였음에도 불구하고, 최근 4년간 비율에서는 좋지 않았다. 하지만 전체 비율 순위에서는 4위에 오르며 평균 이상의 순위를 기록했다. 이 비율은 변화가 크지 않고 안정되었기 때문에, 비율로 미래를 예측할 수도 있다. 필자는 배영섭이 돌아온다면 높은 팀 순위뿐만 아니라 비율도 좋아질 거라 생각하다.

 배영섭은 투고타저 시즌인 2013년 출루율0.402를 마크했다. (사진: 삼성라이온즈)

2009년 이후의 기록을 살펴볼 때  삼성은 총 연봉과 승률의 상관관계에서 2위에 올랐고, 타율과 출루율의 비에서도 4위를 차지하며, 오히려 세이버-친화적인 팀이라는 결론을 내릴 수 있다. 

`돈성`이라는 별명은 2000년도 초반 우승에 삼성이 우승에 목마르던 때에 붙여진 별명이다. 박진만, 심정수 등의 FA를 영입하고 파격적인 트래이드를 감행하면서 붙여졌다. 하지만 최근에는 STC, B.B아크, 경산 볼파크등에서 내부육성을 하면서 선수를 배출하고 있다. 최근 4년간 외부 FA없이 연속으로 리그와 한국시리즈를 제패한 팀에게는 갤럭시 머니볼 같은 별명이 더 적절하지 않을까?

강윤성 객원필진 

* 객원필진의 칼럼은 프로야구 통계미디어 KBReport.com(케이비리포트)의 공식적인 입장이나 의견과 다를 수 있습니다. 반론을 원하시는 경우 kbr@kbreport.com 으로  메일을 보내주시기 바랍니다. 

프로야구 통계미디어 KBReport (케이비리포트) 다른 기사 보기