장비를 들고 불펜으로 가는 투수들
기타가방이나 골프백을 들고 가듯이 투수가 투구추적장비를 들고 불펜으로 가는 모습을 앞으로 자주 보게 될 것이고, 이로 인해 흥미로운 일들이 많이 일어날 거라는 MLB 칼럼니스트 피터 개먼스의 커멘트가 눈길을 끕니다. 야구는 놀라운 속도로 변하고 있습니다. 여기에 소개된 랩소도라는 장비를 구입해서 테스트중입니다. 프로야구 1군 선수를 포함해 지금까지 세 차례 정도 테스트를 마쳤습니다. 아직 선수들이 공을 제대로 뿌릴 수 있는 시기가 아니고 많은 팀들이 전지훈련을 가있어서 테스트가 여의치 않네요. 경기력 향상에 실질적으로 도움이 되고, 보다 쉽게 이해할 수 있는 프로세스를 어느 정도 갖춘 후에 보다 많은 분들께 소개하려고 합니다.
(관련글)
데이터에 기반한 훈련
데이터야구가 품고 있는 숨은 가치
https://www.youtube.com/watch?v=gJQCh39HNog&app=desktop
삼성라이온즈가 kbo리그 구단 중에서는 첫번째로 트랙맨 데이터를 사용하는 팀이 되었습니다. 트랙맨은 2015년부터 mlb 데이터 및 미디어 플랫폼으로 채택된 스탯캐스트의 투구/타구추적장치입니다.
트랙맨레이더는 17시즌 현재 리그 9개 구장 중 8개 구장에 설치되어 데이터를 수집해왔습니다. 그동안도 가끔 몇몇 구단 측에서 트랙맨 데이터를 언급했던 경우가 있었지만 그건 추적데이터 기반으로 얻은 인사이트를 참고한 것이고 — 수집된 raw데이터를 구단이 직접 제공받아서 사용하는 것으로는 삼성라이언즈가 첫번째 팀입니다. (트랙맨레이더 말고, 이전 단계 기술인 피치fx 데이터를 사용하는 구단은 이미 있습니다)
의미있는 일입니다. mlb구단에서는 이미 몇해전부터 육성과 전력분석의 많은 부분에서 새로운 투구/타구추적 데이터를 활용해왔고, 피치프레이밍, 뜬공혁명, 수비시프트 같은 새로운 분석모델과 전략이 개발될 수 있었습니다.
물론 데이터가 마법이 아니고 기술이 만능이 아닙니다. 이걸 어떻게 사용하는지가 이제부터 숙제일겁니다.
트래킹데이터를 다루는 것은 전형적인 세이버메트릭스와 좀 다릅니다.(물론 객관적 데이터기반 분석이라는 점에서는 같겠지만) 세이버메트릭스는 대체로 평가하는 도구이지만 트랙킹데이터는 [관찰]하는 도구입니다.
이런 상황을 가정해보죠. 야구경기가 벌어지는데 관중은 물론이고 감독과 코치, 스카우트 모두 오직 [문자중계]를 통해서만 경기를 볼 수 있습니다. 어떤 타자가 105타석에서 33개의 안타를 쳤고 볼넷이 5개 삼진20개 홈런은 2개입니다. 문자중계를 통해서 이 사실을 알 수 있습니다. 묻습니다. 그는 컨택이 좋은 타자인가? 그는 파워가 있는 타자인가? 타율이 높으니까 컨택이 좋을거 같습니다. 홈런이 적으니까 파워는 없는거 같습니다. 볼삼비가 나쁘니까 선구안이 안좋은거 같습니다.
이 판단은 얼마나 정확할까요?
물론, 실제 야구에서는 선수, 코칭스탭, 스카우트들이 밝은 눈으로 경기를 살핍니다. 그러니 [문자중계] 데이터만 가지고 하는 판단보다 휠씬 많은 정보를 가지고 더 정확한 판단을 할 거 같습니다. 하지만 아이러니가 있습니다. 수십년 현장밥 먹은 전문가들의 눈과 판단이 별로 정확하지 못했다는거죠. 세이버메트릭스가 그 증거입니다.
세이버메트릭스가 사용하는 데이터는 [문자중계] 데이터와 거의 완전히 같습니다. 심지어 2000년대 중반 즈음에 활용할 수 있던 데이터는 [문자중계]만도 못했습니다. 하지만 그 분석에 기반한 판단은 여러 지점에서, 수십년 경력의 현장전문가의 그것보다 더 유용했습니다. (정확했다기보다 유용했다고 쓰고 싶습니다. 통계가 찾아내는 것 중 현장의 지식과 일치하는 것도 굉장히 많습니다. 대신 통계는, 현장이 잘못이해했거나 미처 몰랐던 [새로운 영역]을 찾아냅니다)
즉, 세이버메트릭스가 지난 30년동안 해낸 것을 보면, “mlb 프로팀을 운영하고 전력을 구성하는데 있어서” 라면, 실제 경기를 밝은 눈으로 보는 현장전문가가 얻을 수 있는 정보보다, 깜깜한 상태에서 문자중계 데이터만 가지고 얻을 수 있는 정보가 더 객관적이고 유용했다— 라고 말할 수 있게 됩니다.
[문자중계]는 거기에 통계분석이 결합되는 순간 — 프로팀 운영에 필요한 정보를 얻는 [최고수준 해상도를 가진 분석수단]인게 됩니다. 아이러니하죠? 이게 또 야구의 매력이기도 하구요.
그런데 추적데이터는 그 다음단계로 우리를 이끌어줄 수 있습니다. 105타석 33개의 안타 중 2개만 홈런이었지만 나머지 31개의 안타가 전부 공을 뽀개지게 때린 땅볼타구였다면? 타율이 높았던 것은 “일단 공이 배트에 맞기만 하면 그라운드를 뚫어버릴 것처럼” 날아가서였지만, 스트라이크존 가장자리에 걸치는 공에는 아예 손을 못대는 타자였다면? 이 타자는 타율은 높고 순장타율은 아주 낮지만 — 실은 이 타자의 툴은 컨택이 아니라 파워일겁니다. 이 타자에게 필요한 것은 파워가 아니고 컨택도 아닙니다. 더 많은 뜬공을 쳐야 하는 타자입니다. 공을 더 잘 고르기 위해 노력하거나 공을 더 정확히 맞추기 위해 노력하거나 공을 더 강하게 때리기 위해 노력하는 것은 성적향상이 도움이 못될 가능성이 큽니다. 하지만 공을 좀더 띄울 수 있게 되면 생산성은 말도 못하게 높아질겁니다.
이건 눈으로도 어느정도 관찰할 수 있겠지만, 워낙 케이스바이케이스인지라 눈으로 보고 내린 판단은 자주 틀립니다. 따라서 어떤 판단을 쉽사리 신뢰하기 어렵고, 그렇다면 위험부담이 있는 선택을 할 때 그런 판단에 근거하긴 어렵습니다. 10만달러짜리 계약을 하기엔 충분할지 몰라도 500만달러짜리 계약을, 그런 불확실한 판단으로 실행하긴 어렵습니다. 투구/타구추적데이터는 이 불확실성의 계곡을 뛰어넘을 수 있게 해줍니다.
2군에서 2년동안 180이닝 ERA2.80를 찍었고 SO9 8.1 BB9 2.3 을 찍은 투수가 있다고 치죠. 이 투수를 1군에 올렸는데 첫 3경기 동안 세번 다 5이닝을 못버텼고 합계 10이닝 9실점했습니다. 그에게 더 많은 기회를 줘야할까요? 만약 그가 150kmh를 던지는 파이어볼러라면 기회를 더 줄겁니다. 하지만 130kmh짜리 똥볼투수라도 그럴까요? 어려울겁니다. 그리고 말할겁니다. “그녀석은 2군용이야”
그런데 그가 사실은 유희관이었다면??? 실은 그가 1군에서 맞았던 것은 그의 공이 1군에서 통하지 않기 때문이 아니라 2군에서 던지던 그 공을 1군 적응문제 때문에 아직 못던지고 있었던 것이라면? 그저 운나쁘게 어설프게 맞은 타구가 전부 안타가 되서 실점했던거라면? 그를 2군용으로 판단하고 리스트에서 지우는 순간, 팀은 2-3선발급 투수 하나를 잃어버린거죠. 이런 투수 FA로 살려면 최소 60-70억부터 시작할겁니다.
선발로 키우고 싶은, 전 시즌 40이닝 ERA4.1을 찍은 24살짜리 평속147kmh짜리 2피치 투수가 있다고 치죠. 세번째 구종 체인지업을 겨울 동안 준비했습니다. 정규시즌이 시작되고 10% 비중으로 던졌는데 첫 두경기에 홈런을 1개씩 맞았습니다. 전부 체인지업이었습니다. 그는 새로운 구종을 앞으로 계속 던질 수 있을까요? 던져도 될까요? 던지다가 또 맞으면 어쩌나 하는 걱정이 그의 손끝을 흔들리게 만들지 않을까요?
추적데이터를 한번 보자구요. 홈런을 맞았을때 그 신구종이 어떤 궤적으로 어떻게 회전하고 어떻게 움직이며 어느 코스로 날아갔는지 봤는데 — 리그최고의 체인지업을 던지는 OOO의 것과 거의 같았습니다. 사실은, 타자가 그 공을 담장너머로 달려보낼 확률은 100분지 1밖에 안되는 것일 수도 있습니다. 하필 드럽게 운이 없어서 2번 연속으로 얻어걸린거일수 있죠. 야구라는 그런 경기니까요. 투구의 결과가 아니라 투구 자체를 들여다볼 수 있다면 우리는 선수에 대해, 플레이에 대해 좀더 나은 판단을 할 수 있게 됩니다.
데이터는 마법이 아니고 기술이 만능은 아니겠지만, 데이터와 기술은 야구에 대해 몰랐던 휠씬 많은 정보를 줍니다. 그 정보는 더 많이 이기는데 도움이 되고, 선수들이 자신의 기술을 향상시키는데 도움이 되고, 팬들이 야구를 더 깊이 즐기는데 도움이 됩니다. 투구/타구추적데이터가 kbo리그에서도 얼른 그런 일을 하게 되길 기대합니다.