Sabermetrics2013.07.19 02:27

스탯은 항상 옳다... 과거에 대해서는.


모든 스탯은 과거의 기록이다. 과거를 있는 그대로 기록한다는 측면에서, 모든 스탯은 사실의 표현이라고 할 수 있다. 어떤 타자가 10타수 3안타를 기록하여 타율이 3할이 되었다면, 이것은 공식기록에 오류가 있지 않은 이상, 의심할 여지가 없는 사실이다.


상반기 동안 3할의 타율을 기록중인 타자 A와 같은 기간 동안 2할 5푼의 타율을 기록중인 타자 B에 대해 "A가 B보다 타율이 높다"거나, "A가 B보다 안타를 잘 쳐 왔다"라는 말 역시, 의심할 여지가 없는 사실이다.



스탯으로 미래를 예측할 수 있는가?


그런데, 여기서 "A가 B보다 우수한 타자이다"라고 말하는 순간, 이 표현은 사실 이상의 추가적인 가치 판단을 포함하게 되어, 항상 옳다고는 할 수 없게 되어 버린다. "A가 B보다 하반기에 더 높은 타율을 기록할 것이다" 라는 표현도 마찬가지이다. A가 B보다 더 높은 타율을 기록할 것이라는 예측은, 사실 A가 B보다 본질적으로(true-talent의 관점에서) 더 안타를 잘 치는 타자일 것이라는 생각에 기인한 것이다. "A는 사실 실력이 별로 없지만 항상 행운이 함께하는 타자이므로 안타를 더 많이 칠 것이다"라는 따위의 주장을 진지하게 하는 사람은 없을 것이므로...


그렇다면 과거에 타율이 높았다고 해서 앞으로도 안타를 많이 칠 것이라는 식으로 예측을 해도 되는 것일까? 대답은 진부하지만 case-by-case 이다. 스탯의 미래 예측 능력, 바꿔 말해서 본질적인 재능(true talent)을 보여주는 능력은 스탯의 구성 자체와 샘플사이즈의 수에 의해 결정된다.



누가 스탯을 만드는가


다음의 투수 스탯들을 비교해 보자.


K/9: 9이닝당 삼진 수

Opponent AVG: 피안타율

Pitching Wins: 투수의 승(다승)


이 세 스탯의 가장 큰 차이는 무엇일까? 그것은 스탯을 만드는 데 기여하는 사람들의 범위가 제각기 다르다는 것이다.


K/9는 탈삼진 비율이다. 투수가 삼진을 잡는 과정에서 개입하는 사람은 투수 본인과 타자 뿐이다. 물론, 사인을 주는 포수와 스트라이크 존을 결정하는 심판의 영향도 있을 것이지만, 가장 큰 변수는 역시 투수 자신과 타자일 것이다. 여기서 타자는 기본적으로 1번부터 9번까지 돌면서 다양한 타자를 만나는 데다가 시즌이 진행될수록 다양한 팀의 다양한 타선을 상대하게 되므로, 결국 투수 자신의 구위가 가장 중요하다고 할 수 있다.


피안타율의 경우는, 여기에 팀 동료들의 수비력과 구장 효과가 추가된다. 게다가 타구가 운좋게 야수정면으로 가거나, 반대로 소위 바가지 안타가 되는 등의, 선수 개개인의 능력과는 그다지 상관이 없는 사건들도 종종 발생하게 된다.


이제 투수의 다승으로 넘어가면, 위의 피안타율에 포함된 것들 뿐 아니라 같은 팀 타자들의 득점 능력과 같은 팀 불펜투수들의 실점 방어 능력, 게다가 감독의 성향(퀵 후크 등)까지 영향을 미치게 될 것이다.


예를 들어, 9이닝당 탈삼진을 9개씩 기록하는 엄청난 구위의 선발투수 P를 생각해 보자. 이 투수가 FA가 되어 새로운 팀과 계약을 했는데, 이 새로운 팀의 홈 구장은 불규칙 바운드가 많은 데다가 설상가상으로 이 팀 내야수들의 실력이 허접하다면, 이 투수의 피안타율은 높아질 가능성이 매우 높다. 하지만, 탈삼진 비율은 그다지 영향을 받지 않을 것이다. 삼진을 잡는 데에는 수비수나 구장이 개입할 여지가 별로 없으니까...


여기에 같은 팀 불펜투수들이 방화를 일삼고, 설상가상으로 타선마저 득점 지원 능력이 저조하다면, 이 투수는 이전보다 훨씬 승수를 쌓기가 힘들 수밖에 없을 것이다. 이러니 다승으로 투수를 평가하는 것이 얼마나 불합리한지 알 수 있다. 선발투수의 승리라는 것은, 1) 투수가 5이닝 이상 던질 때까지 감독이 교체하지 않고, 2) 투수 본인이 실점한 것보다 소속팀이 더 많이 득점할 수 있도록 야수들이 공수 양면에서 활약해 주고, 3) 불펜 투수들이 이 리드를 지켜내야만 가능한 것이다. 이게 어떻게 선발투수 한 사람의 승리라고 할 수 있겠는가?



정리해 보면, 작년에 높은 탈삼진 비율을 기록한 투수가 올해에도 삼진을 많이 잡을 확률은 상당히 높다. 그건 투수 본인의 실력 이외에 다른 변인이 별로 없는 스탯이기 때문이다. 하지만, 작년에 낮은 피안타율을 기록한 투수가 올해에도 안타를 적게 맞을 확률은 상대적으로 낮을 수밖에 없으며, 작년에 다승왕을 차지한 투수가 올해에도 다승왕을 또 차지할 확률은 그보다도 훨씬 낮을 수밖에 없다. 개입하는 사람들이 많아질 수록, 필연적으로 노이즈도 증가할 수밖에 없는 것이다.



샘플사이즈의 위력


스탯을 논할 때 절대 빼놓을 수 없는 것이 바로 샘플사이즈이다. 사실 확률/통계에 대한 특별한 전문지식이 없더라도, 우리는 대개 기본적으로 샘플사이즈에 대한 "감"을 가지고 있다. 예를 들어, 동전을 세 번 던져서 세 번 모두 앞면이 나왔다고 해도, 우리는 이 동전이 앞면이 나올 확률은 여전히 50%일 것이라고 생각한다. 굳이 세번 모두 앞면이 나올 확률이 12.5%나 된다는 것을 계산하지 않아도, 그정도는 "뽀록"으로 가능할 것이라는 것을 누구나 알고 있기 때문이다. 하지만, 근성을 가지고 이 동전을 1000번 던졌는데 앞면이 991번 나왔다면, 이제는 거의 모든 사람들이 이 동전의 정체에 대해 의구심을 가지게 될 것이며, 이 동전이 앞면이 나올 확률은 뒷면이 나올 확률보다 훨씬 크다고 확신하게 될 것이다. 이게 바로 샘플사이즈의 위력이다.


동전의 예는 너무 진부한 감이 있으므로, 다른 예를 들어 보겠다. 지금은 없어진지 오래 되었지만, 예전에 모 걸그룹 멤버들의 스티커 사진이 들어있던 "핑X빵" 이라는 빵이 있었다. 처음에는 멤버 4명의 사진이 같은 비율로 들어 있을 것이라고 추측하고 빵을 사먹는다. 원하는 멤버의 사진이 계속 안나와도, 처음에는 그저 "재수가 없어서"라고 생각하게 마련이다. 하지만, 수십 개를 사먹어도 원하는 멤버의 사진이 잘 안나오고 다른 멤버의 사진이 잔뜩 나온다면, 그때부터는 빵 제조 회사를 의심하게 되는 것이다. "사실은 계속 구매를 유도하기 위해 사진의 비율을 의도적으로 조작해서 제조하는 것이 아닐까?" 라고... 이런 것이 샘플사이즈의 위력이다.


야구에서도 마찬가지이다. 4월 한 달만 놓고 보면 4할타자가 여럿 나타나기도 하고, 0점대 ERA의 선발투수들도 종종 보인다. 하지만, 우리는 아마도 뽀록일 것이라고 생각하는 것이 보통이고, 실제로 시즌이 진행되면서 거의 모든 선수가 자신의 본 실력으로 회귀하는 모습을 보게 된다. 하지만, 시즌이 진행되고 경기수가 늘어나도 계속해서 높은 수준의 퍼포먼스를 유지하는 선수도 있게 마련이어서, 이런 경우는 시간이 지날수록 본 실력으로 인정받게 된다. 처음에는 뽀록인 줄 알았지만, 알고보니 새로운 수퍼스타의 탄생이었던 것이다.


사람은 기계가 아니기 때문에, 그날그날 컨디션이 다를 수밖에 없다. 컨디션이 좋은 날은 본 실력보다 더 좋은 활약을 하기도 하지만, 컨디션이 나쁜 날은 반대로 삽질을 거듭하기도 한다. 하지만 샘플이 증가하면, 좋은 날과 나쁜 날이 교차하다가 0을 향해 수렴해 가는 것이다. "운"도 마찬가지이다. 어떤 날은 타구가 항상 빈 자리만 찾아가기도 하지만, 어떤 날은 타구가 항상 야수 정면으로 날아가기도 한다. 시즌이 계속되며 샘플사이즈가 증가하면, 이런 것도 점점 0을 향해 수렴해 가는 것이다.



글이 한없이 길어지고 있으므로, 구체적으로 어느 정도의 샘플사이즈가 되었을 때 스탯을 "신뢰"할 수 있는지에 대해서는 다음에 다루도록 하겠다. 지금까지를 요약해 보면,


1. 스탯은 과거의 기록으로, 이를 통해 선수들의 본질적인 재능(true talent)을 일정 부분 추측하고 향후의 퍼포먼스를 예측하는 것이 가능하다.


2. 본질적인 재능에 대한 스탯의 설명력은 스탯이 얼마나 노이즈를 적게 포함하도록 설계되었는지와 샘플사이즈에 의해 좌우된다.



너무 당연한 이야기를 길게 늘어놓았을 뿐인지도 모르겠다. 그렇다. 사실 세이버메트릭스는 표면에 숫자가 가득하다 보니 난해하고 현학적으로 느껴질 뿐, 속을 들여다보면 무척 상식적인 내용들을 담고 있다.

저작자 표시 비영리 변경 금지
신고
Creative Commons License
Creative Commons License
Posted by FreeRedbird
Sabermetrics2012.06.21 16:15

최근 지속되고 있는 투고타저 현상에 대하여 다양한 해석이 나오고 있는데, 이와 관련하여 주목할 만한 현상 중 하나가 바로 구속의 증가이다.


이것은 2002년부터 올해까지 메이저리그의 선발투수 평균 구속을 나타내는 표이다. 자료는 Fangraphs에서 얻었다.

(클릭하시면 선명하게 보입니다)


FBv가 패스트볼의 평균 구속이다. 2002년에는 89.5마일이던 것이 지속적으로 증가하여 2012년에는 91.1마일로 무려 1.6마일이 증가하였음을 알 수 있다. km/h로 환산하면 평균 143.2km에서 145.8km로 2.6km 증가한 것이다.


똑같은 표를 구원투수를 대상으로 작성해 보더라도, 비슷한 구속 향상이 이루어졌음을 알 수 있다.



2002년의 릴리버들은 평균 90.6마일의 패스트볼을 던졌지만, 2012년에는 평균 92.3마일로 1.7마일의 구속 향상이 이루어졌음을 알 수 있다.


이런 경향은 앞으로도 한동안 지속되리라고 생각되는데, 요즘 어느 구단을 보더라도 팜 시스템에 95마일을 뿌리는 투수 유망주들이 꽤 많기 때문이다.



구속이 빨라지면 어떤 일이 일어나는가? 투수의 제구력이 유지되는 한은, 구속이 빠른 쪽이 당연히 유리하다. 사람은 기계가 아니므로, 타자가 날아오는 공을 인식하고 여기에 반응하는 시간에는 물리적인 한계가 있을 수밖에 없다. 같은 조건이라면, 당연히 빠른 공이 치기 힘들다. 이에 대해서는 이미 많은 연구가 이루어져 왔는데, Mike Fast의 2010년 연구에 의하면, 선발 투수는 구속이 1마일 증가하면 RA9가 약 0.26 감소하며, 구원 투수는 구속이 1마일 증가하면 RA9가 0.41~0.43 감소한다고 한다. 메이저리그에서 지난 10년간 선발/구원 간의 이닝 배분 비율은 대략 66:34 였으므로, 선발이 1.6마일, 구원이 1.7마일 각각 구속을 증가시킨 효과는 대충 RA9 0.5점 감소에 해당하는 엄청난 것이다. 실제 MLB의 경기당 득점을 보면, 2002년부터 2006년까지는 경기당 4.62점에서 4.86점 사이를 오르내리다가, 이후에는 지속적으로 감소하여 2012년 시즌은 경기당 4.3점까지 하락한 상태이다. 구속이 꾸준히 증가한 데 반해 경기당 득점은 2000년대 초중반에 다소 등락을 거듭하다 2006년 이후부터 꾸준히 하락하였는데, 이러한 흐름으로 볼 때 구속 증가가 경기당 득점의 변화를 좌우하는 유일한 factor는 물론 아니지만, 상당히 중요한 영향을 미치고 있는 것으로 생각된다.



개인적으로는 이러한 구속 증가가 최근에 MLB에서 급격히 증가하고 있는 팔꿈치 및 어깨 수술과도 관련이 있지 않을까 하는 의심을 가지고 있다. 특히 올 시즌 들어 팔꿈치의 UCL 파열(Tommy John 수술)나 어깨의 Labrum 및 Rotator Cuff 파열 부상이 엄청나게 많이 발생하고 있는데, 이런 부상으로 인해 수술을 받게 되면 최소 1년 이상을 쉬게 되며, 특히 어깨 수술의 경우 이전 기량을 회복할 가능성이 상당히 낮은 편이다. 인류의 유전자가 투수에게 유리한 쪽으로 갑자기 개량되지 않은 이상, 이러한 구속 증가가 자연스럽게 이루어졌을 확률은 거의 없다. 2002년에도 영양 상태는 충분히 좋았으므로, 특별히 더 잘 먹어서도 아닐 것이다. 오히려 2002년 무렵이 지금보다 금지약물의 사용이 빈번한 시대였음을 감안하면, 이렇게 지속적으로 구속이 증가하는 현상은 상당히 놀라운 것이다. 결국 공을 던지는 방법, 즉 ptching mechanics의 변화가 이러한 구속 증가를 가져오지 않았을까 라는 추측을 하게 되는데... Inverted W와 같이 무리한 방법으로 구속을 끌어올리는 투구 동작이 유행하면서 구속은 올라가는 대신 팔꿈치와 어깨에 탈이 날 확률이 증가한 것이 아닐까 싶다. 이것은 검증된 가설은 아니고 추측 단계인데... 매우 흥미로운 연구 주제가 될 것 같다.


만약 이러한 추측이 사실로 확인되더라도, 투수 유망주가 어떤 선택을 하게 될 지는 여전히 어려운 문제이다. 예를 들어서, Inverted W 로 공을 던지면 구속이 3마일 증가하는 대신 팔꿈치나 어깨가 망가질 확률이 30% 증가한다고 치자. 당신이 드래프트를 앞두고 있는 고교 야구의 투수 유망주라면, 어떤 선택을 할 것인가? 아마도 많은 선수들이 위험을 감수하고 구속을 끌어올려서 성적을 올리는 쪽을 택할 것 같다.

저작자 표시 비영리 변경 금지
신고
Creative Commons License
Creative Commons License
Posted by FreeRedbird
Sabermetrics2012.04.25 17:47

70년대 말부터 80년대 말까지 발간된 Bill James의 <Baseball Abstract> 시리즈로부터 어떻게 갑자기 2000년대 초반에 "머니볼"이 나오게 되었고, 어떻게 지금의 세이버메트릭스 커뮤니티들이 형성되었는지 궁금해하시는 분들이 있을 듯하다.


현대 세이버메트릭스 커뮤니티의 시작은, 90년대의 유즈넷이었다. 모뎀과 트럼펫 윈삭으로 인터넷에 접속하던, 우리에게는 "PC통신"이라는 표현이 더 익숙하던 시절의 이야기이다. 아래 Dan Szymborski의 증언(?)을 들어 보면...


Well, the internet sabermetrics kinda started off that way. You of course always had some guys working in the field, but there were few and weren’t very organized.

Modern sabermetrics essentially had its birth in usenet from 1994-2000. Usenet was essentially a place for us to swap analysis, flame Joe Carter and Rey Ordonez fans, torment WebTV/AOL users, and rag on media figures. During that time, Keith Law, Keith Woolner, Chris Kahrl, Sean Forman, Sean Lahman, Voros McCracken, John Sickels, Don Malcolm, Greg Spira, Dave Pease, Gary Huckabay, myself, and a whole bunch of others were all there on a daily basis. You even had appearances from people like Craig Wright and Mike Gimbel.

When Rob Neyer became popular, it kinda helped all our profiles considerably. A group of RSBBers started Baseball Prospectus and over time, we all started getting the attention of some media guys, like Dave Schoenfield. So when Moneyball came out and blogs enabled us to reach larger audiences, it helped us out quite a bit professionally. None of us started out as professional baseball analysts, after all.

As underground communities go, baseball usenet turned out to be pretty successful. Turned out you can get a job as a result of making fun of the guy who thinks Mookie Wilson’s a Hall of Famer (that actually happened).


원문 링크


위의 인용문에 등장하는 RSBB는 rec.sport.baseball(링크) 이다. 링크를 눌러 보면, 활동이 거의 없긴 하지만, 지금도 구글 그룹으로 살아 있음을 알 수 있다.


또한, 위에서 언급되지 않은 중요한 초창기 사이트로는 Jim Furtado와 Sean Forman이 2001년에 설립한 Baseball Primer(링크)가 있었다. 이 사이트는 RSBB를 대체하여 새로운 세이버메트릭스 커뮤니티의 중심으로 떠올랐는데, 2004년에 이르러 Sean Forman은 Baseball-Reference 사이트를 독립시켜 데이터에 목마른 야구팬들에게 현재까지도 방대한 스탯을 제공해 주고 있고, Jim Furtado와 Dan Szymborski는 Primer를 Baseball Think Factory(BBTF)로 개편하여 역시 현재까지 사이트를 이어 오고 있다. BBTF에서는 Szymborski의 퍼포먼스 예측 시스템인 ZiPS 데이터를 다운받을 수 있기도 하다. (조금 더 자세한 내용은 여기의 위키 페이지를 참조.)


한편, 현재 세이버메트릭스 대중화의 양대 산맥이라고 할 수 있는 The Hardball Times는 2004년에, Fangraphs는 2005년에 각각 설립되었다. 물론 나도 이 두 사이트들의 영향을 매우 크게 받았지만... 이제 네이버 스포츠 기사에서까지 Fangraphs를 인용하는 것을 심심치않게 볼 수 있다는 것은 참 놀라운 일인 것 같다. 세이버메트릭스를 좋아하거나 싫어하거나와 관계없이, 세이버메트릭스는 이미 야구 문화의 한 분야로 확고하게 자리를 잡은 듯하다.



저작자 표시 비영리 변경 금지
신고
Creative Commons License
Creative Commons License
Posted by FreeRedbird

티스토리 툴바