ㅍㅍㅅㅅ아카데미

4.3 (총 27개 강좌, 100명 평가)

현업 초고수의 실무 교육 아카데미

펼쳐보기

송민구

NC다이노스 데이터 애널리스트

펼쳐보기
언제 어디서나 수강할 수 있습니다.
PC, 모바일, 태블릿으로 언제 어디서나 수강이 가능합니다.
PC, 모바일, 태블릿으로 언제 어디서나 수강 가능
강좌 소개

한줄목표

야구 데이터 분석관의 세계를 A부터 Z까지 파헤쳐본다.











강의요약

1. 대중적인 글쓰기를 위한 노력


2. 데이터를 위해 그림을 배우다


3. 데이터 분석가로서 한 일


4. 좋은 리포트를 위한 팁


5. 데이터 분석가의 역할





PPSS's PICK

“머니볼의 혜택을 입은 첫 세대 GM 몇몇은 스카우트 팀을 죄다 해고하거나 인력을 대폭 축소했죠.
지금은? 스카우터가 70명이 넘는 구단도 있습니다.”

“많은 팬이 ‘전력분석은 항상 새로운 걸 찾아내야 한다’고 착각하세요.
하지만 실제로는 기존의 아이디어나 통념의 근거를 마련하는 쪽의 일이 더 많습니다.”

“검색능력이 중요합니다. 끊임없이 공부하고, 연구해야 합니다. 단순 업무를 최대한 자동화하고,
나머지 시간을 자기계발과 연구에 투자하지 않으면 절대 살아남을 수 없어요.”





강연 대상

  1. 다양한 데이터 분석을 해보고 싶은 분
  2. 실제 야구 데이터 분석의 세계가 궁금한 분





커리큘럼

야구덕후 블로거, NC다이노스 데이터분석관이 되다

-대중적인 글쓰기를 위한 노력

-데이터를 위해 그림을 배우다

-데이터 분석가로서 한 일

-좋은 리포트를 위한 팁

-데이터 분석가의 역할





강의 특징

아무도 알려주지 않았던 야구 데이터 분석!
데이터 분석관은 영업 사원이다?
실제 사례로 배우는 흥미진진한 야구 데이터 분석의 세계





강사소개

송민구 지식네트워커

NC다이노스 데이터 애널리스트





강사인터뷰

덕업일치의 표본, NC다이노스의 데이터 애널리스트 송민구 인터뷰


송민구: NC다이노스의 데이터 애널리스트(무서운 아저씨 포스)


리(이승환 ㅍㅍㅅㅅ 대표): 어쩌다 이런 업계로 뛰어들게 되었나요?

송(송민구 NC다이노스 데이터 애널리스트): 한국야구학회를 통해 현 팀장님과 인연을 맺었습니다. 사실 채용 자체도 정말 우연한 기회였지요. 학회 쉬는 시간에 팀장님께서 “데이터 분석과 관련된 조직을 신설하려는데 추천할 만한 사람 있어요?”라고 하셔서… “그냥 제가 하면 어떨까요”라고 한 게 지금…이 되었습니다.


그리고 한배를 타게 되었다


리: 지금 한국에 님 같은 일 하는 분이 얼마나 되나요?

송: 각 구단에 1~2명 사이의 인력이 있거나, 아예 없거나 그렇습니다. 일단 공개된 데이터셋 자체가 없기 때문에 글 하나만 써도 이름은 알려지게 되어있어요. 거기서 누가 구단으로 오거나 하는 식이라… 대부분 서로서로 압니다. NC 다이노스의 경우 데이터팀 내에 저와 팀장님이 데이터를 활용한 분석을 전담하고, 외국인 전담 스카우트님, 그리고 외국인 선수들의 적응을 돕는 코디네이터가 있습니다.


리: 팀장님과 역할 분담은 어떻게 되나요?

송: 팀장님은 클래식 세이버메트릭스(라는 말이 이상하지만 이제 그렇게 되었습니다) 쪽에 치중하시고, 저는 투구추적 시스템에서 나오는 데이터 분석에 더 많은 시간을 투자합니다. 현재 많은 사이트에 나와 있고 여러분이 많이 쓰시는 ‘스탯’이라 불리는 부분의 분석·해석을 팀장님이 하시고, 저는 그 외의 일에 주로 집중합니다. 팀장님의 작업을 숲에서 좋은 나무를 찾아내는 일에 비유한다면, 제가 하는 작업은 이 좋은 나무의 솔잎을 보고 얼마나 잘 자랄지 예측하는 일에 가깝습니다.


리: WAR 같은 지표가 한국에 잘 맞나요?

송: 상당히 까다로운 질문인데요, 일단 WAR의 공식 전체가 공개된 적은 없습니다만, 값의 계산 과정은 분명히 널리 알려져 있습니다. 말하자면 ‘제네릭 의약품’과 비슷합니다. 누군가가 처음 고안해 낸 대로 계산을 하기는 하나(결과물이 대체선수 대비 승리기여도로 나타난다는 점), 그 제조 과정에서는 업체마다 다른 첨가물(공식)을 넣기 때문에 ‘약효는 동일’하나 ‘결과물은 약간씩 다릅’니다. 그리고 KBO는 MLB만큼 정교한 수비지표들이 생산되고 있지 않기 때문에, 수비를 포함한 정확한 WAR을 만들어 내는 것은 허구에 가깝다고 생각합니다. 물론 이것은 100% 개인적 의견입니다.


그냥 잊어버리자…


리: 왜 안 맞나요? 수비지표가 그렇게 대단한가요?

송: 수비 포지션에 대한 보정과 파크팩터(구장에 따른 효과) 보정 같은 건 할 수 있습니다. 하지만 수비 기회와 그에 따른 수비율 등에 대한 정보가 없죠. 말하자면 KBO에서는 UZR 같은 메트릭이 생산되지 않는다는 겁니다. ‘수비력’이라는 것은 상당히 중요한 지표입니다. 하지만 없으니까 WAR을 만들기보다는 야수 공격력과 투수 정도로 나누어서 가치를 환산하는 게 의사결정에 있어서는 좀 더 합리적이라고 생각하는 거죠.

 


영화 〈머니볼〉과 실제 야구 데이터 분석의 세계


리: 영화 〈머니볼〉과 비교하면 실제는 어떤가요?

송: 〈머니볼〉에 나온 그 뚱보(주; 폴 드포데스타의 극 중 역할. 영화 제작 시 ‘극적인 효과’를 위해 폴 드포데스타를 뚱뚱한 덕후’ 이미지로 그렸는데, 사실 훈남인 폴 드포데스타는 이 각본에 동의하지 않아 풀 네임을 쓸 수 없었다)가 하는 게 클래식 세이버메트릭스에 가깝죠. 우리가 타 팀에 비해 지닐 수 있는 ‘경쟁적 우위’를 찾아내는 일이지요. 근데 KBO 현실상 트레이드가 활발하지 않기 때문에, 스탯 간의 우위를 따지는 건 크게 생산적이지 않다고 생각하고요, 결국 경쟁적 우위를 통해 확보한 자료를 육성에 어떻게 녹여낼 수 있는가가 중요하겠죠. 그리고 제가 지금 구단에서 하는 일은 〈머니볼〉에는 없는 역할입니다. 〈머니볼〉은 1990년대 후에서 2000년대 초반의 이야기고, 제가 다루는 투구궤적 시스템은 2007년에 나온 것이기 때문이죠.


머니볼의 그 뚱보는 사실 이런 엘리트 냄새 넘치는 남자다


리: 2007년에 갑자기 왜 그런 게 나타난 거죠?

송: 그걸 내가 어떻게 알아요 이 양반아. 굳이 말하자면 기술이 발전하면서 제반 비용이 점점 저렴해졌고, 대용량 데이터를 처리할 수 있는 기술이 그만큼 스포츠에 접목하기 쉬워졌다고 할 수 있겠죠. 그리고 MLB가 돈맛을 알기 시작했다 정도? 예전에 심판 판정 정확도를 측정하기 위해 퀘스텍(QuesTec)이란 게 있었는데요, 투구추적 시스템은 이걸 좀 더 개량해서 심판만이 아니라 투구, 타구까지 아우를 수 있는 데이터로 만들어 냈죠.


리: 말 나온 김에 심판 판정은 얼마나 정확한가요?

송: KBO 데이터는 저도 열람할 권한이 없어서 모르겠습니다만, MLB의 경우 적어도 90% 이상은 될 겁니다. 이게 이렇게 말하면 굉장히 정확해보이는데, 사실 90%의 정확도라면 한 게임당 투구 수로 생각할 때 공격기회당 1~2개(이닝으로 환산 시 2.5~3.4개 내외) 사이의 오심을 낸다는 이야기에요. 보통 내가 응원하는 팀의 공격 또는 수비마다 심판 판정에 대한 불만이 한두 개씩 나오죠? 그래서 심판에 대한 불만이 많으신 걸로 압니다. 하지만 그 정도만 되어도 정확도는 90%에 육박합니다.


리: 그러면 심판이 잘 틀리는 판정은 어떤 게 있을까요?

송: 심판도 사람이니까, 보는 각도에 따라 공의 궤적이 왜곡될 수 있을 거라고 생각은 합니다. 그래서 바깥쪽을 후하게 봐주는 심판이 있는 반면, 안쪽을 잘 봐주는 심판이 있고요. 대체로 위아래는 큰 차이가 없는 거 같아요. 중요한 건 매 이닝 일어나는 저 2~3개의 판정 미스가 어떤 상황에 일어났느냐 하는 거겠죠. 2사만루 풀카운트에서 볼넷이 루킹삼진으로 바뀌는 건 굉장히 크거든요.


결정적인 순간에 빡칠 때야 있지만, 생각보다 정확하다


리: 그러면 선수들은 심판의 존을 다 알고 들어가나요?

송: 다시 한번… 심판도 사람이니까. ‘경향성’이란 건 있겠지만 항상 기계같이 1cm의 오차도 없는 존을 유지하는 건 어려워요. 그리고 ‘경향성’ 이란 건 솔직히 메이저리그 올라갈 정도 실력이면 공 몇 개 보면서 다 파악할 수 있을 거로 생각해요.


리: 갑자기 왜 이런 무책임한 이야기를…?

송: 많은 팬이 ‘전력분석’이라는 것에 관해 착각하시는 부분이, ‘전력분석’은 항상 새로운 걸 찾아내야 한다고 생각하신다는 거예요. 하지만 실제로는 기존의 아이디어, 통념에 대한 근거를 마련하는 쪽의 일이 더 많습니다. 기존의 생각에 대한 근거 자료를 마련하다 보면 ‘어 이건 우리 생각과는 다른 것이었네!’ 하는 것들이 생기게 마련이죠. 그리고 생각만큼 새로운 게 매일매일 나오진 않아요. 그럴 시간도 없고요.


리: 새로운 거 많을 것 같은데요…

송: 투구추적 시스템도 나온 지 벌써 10년이에요. 트랙맨으로 한정하더라도 이제 5년쯤 되어가고요. 물론 각 구단이 낼 수 있는 자료들은 현재 공개되는 것들보다 더욱 퀄리티가 높을 수 있죠. 하지만 그게 전부예요. 어차피 그런 건 밖으로 안 나와요.


 

데이터보다 더 중요한 것, 어떻게 데이터로 현실을 변화시킬 것인가


리: 한국에 투구추적시스템이 들어온 지는 얼마나 됐나요?

송 :처음 들어온 것은 2009년~2010년 정도인 걸로 알아요. 하지만 전 구장에 깔린 건 4년 정도? 트랙맨 시스템은 올 시즌 시작 전에 전 구장(제2구장 제외) 설치를 완료한 걸로 압니다.


리: 구단에서 허락 안 해도 막 설치할 수 있나요?

송: 이건 구단마다 사정이 달라요. 구단에서 향후 몇 년의 운영권을 획득한 쪽과, 그렇지 않은 쪽으로 나뉩니다. 대부분 구단이 필요하다면 시설을 설치하는 데 큰 어려움은 없습니다.


트랙맨은 골프에서 이미 대중적으로 이름을 날렸다


리: 그래서 데이터 기반 분석은 야구단에 순조롭게 보급되나요?

송: 쉽지 않아요. 선수단, 코칭스태프와 친숙해지는 기간이 필요하죠. 데이터가 팀에 자리 잡으려면 기록과 분석보다 문화에 있어서 안정화가 필요해요. 제가 들어온 지 이제 4년이에요. SK 계시는 분이 5~6년 정도 됐을 거고, 우리 팀장님이 8년 차죠. 당장 현장에서는 OPS다 뭐다가 중요한 게 아니라, 그날그날 안타 칠 수 있는가가 중요해요. 제가 현장 가서 WAR이 어쩌고 해봐야 안 먹혀요. FA나 선수 연봉 협상에나 쓰이지… 결국 중요한 건 스토리텔링이고, 선수단의 필요에 맞는 것을 선수단의 언어로 풀어내는 것이겠죠.


리: 그래도 맞는 말이면 선수들이 좀 받아들이지 않나요?

송: 우리가 알아야 하는 게, 1군 선수면 그 자체만으로 어마어마한 거예요. 해당 직군의 0.1%에요. 연봉 생각해 보세요. 20대 중후반에 대기업 부장, 잘 나가는 애들은 임원 이상인 게 1군 주전이고, FA 대박 한방이면 한 명 한 명이 중소기업이에요. 실력만큼이나 자존심도 강해요. 여기에 대고 분석을 해보니까 니 타격이 어떻고 공이 어떻다고 하면 먹히겠어요?


리: 코치나 고참이 이야기하면 되잖아요….

송: 코치든 누구든 말로 시킬 수야 있죠. 그런데 그걸 선수들에게 와닿게 설득해야 선수들이 몸으로 실천하죠. 님도 엄마가 공부하라 그러면 듣는 시늉만 하지, 엄마가 시킨다고 공부를 열심히 한 건 아니잖아요.


그렇다…


리: ……

송: 똑같아요. 왜 공부를 해야 하는지, 어떻게 해야 하는지, 기반자료를 마련해야 말이 먹히죠. 엄마가 애한테 하는 식으로 해서, 아무리 유명한 코치가 말을 해준들 그건 그냥 ‘말’일 뿐이에요. 중요한 건 ‘변해야 하는 필요성’을 느끼게 해 주는 것이지, ‘변화를 강요’하는 게 아니에요.


리: 그러는 님은 선수들하고도 이야기하나요?

송: 할 경우도 있습니다만, 웬만하면 코치님이나 전력분석 파트를 통해 전달하려고 합니다. 여기도 엄연히 조직이기 때문에, 위계질서를 헤집고 다니는 행위는 그렇게 환영받을 수 없어요. 코치님, 선수들이 원하는 정보가 있고 그중 제가 담당해야 할 파트가 있을 경우 작업해서 넘겨줍니다. 종종 새로운 훈련 시스템 같은 걸 도입했을 때 선수단의 피드백이 필요할 수 있습니다. 이 경우 직접 면담을 하기도 합니다.


리: 월드컵 보니까 축구도 데이터 분석이 많이 들어온 듯하던데, 어떨 것 같아요?

송: 힘들겠죠. 야구는 아무래도 결과 데이터셋이 상당히 표준화된 편이에요. 하지만 축구는 가장 중요한 ‘골’이 경기당 몇 개 되지 않고 이걸 만들기 위한 과정이란 게 중요하잖아요? 근데 소위 말하는 ‘빌드업’의 시점을 어디로 잡을지, 또는 공수전환의 시점을 어디로 잡아야 할지 등 대부분 데이터가 연속적인 가운데 패스성공, 크로스, 인터셉트처럼 불연속적 정보를 뿜어내는 방식이라 어려운 거 같아요. 야구는 모든 플레이에서 딱딱 끊김이 있어요. 그래서 축구보다는 분석을 위한 전처리 절차가 훨씬 용이합니다.


리: 연속적, 불연속적?

송: 그러니까… 축구는 45+45, 90분 동안 모든 것을 쏟아부으며 끊임없이 움직이는 스포츠 종목입니다. 그에 비해 야구는 분명히 선수가 집중해야만 하는 타이밍이 정해져 있어요. 투수는 투구시와 수비 가담 시, 타자는 타격과 주루. 주자라면 루상에 나가 있을 경우. 뭐, 이런 식이죠. 그리고 공수교대 후에 벤치에 앉아 쉬죠. 하지만 축구는 우리 팀이 공격하는 와중에도 상대 팀 공격수의 움직임과 공의 움직임 등등을 끊임없이 파악해야 해요. 그것도 계속 움직이면서…


축구는 죽어라 뛰어야 하는 스포츠다


리: 야구가 원체 특이한 스포츠이긴 하군요…

송: 뭐, 그렇다면 그렇다고 볼 수도 있죠. 그리고 야구는 공격 시 장애 요소가 딱히 없어요. 축구는 돌파를 위해서는 상대 수비수와 몸싸움을 해서 치고 들어가야 하지만, 야구에서 수비수가 주자와 부딪히면 주루방해가 되요(물론 수비방해인 경우도 있다). 어떻게 보면, ‘나만 잘 치고, 나만 잘 뛰면 되는’ 거예요. 내가 나가 있는 동안은 말이죠.


리: 훈련이나 몸관리에도 데이터가 활용되나요?

송: 그건 축구 쪽이 좀 더 잘될 거 같은데요… 제가 알기론 트레이너 외에 스포츠 사이언티스트(Sports scientist)라고도 불리는 바이오메카닉 엔지니어(Biomechanic engineer)같은 직군도 있어요. 이분들이 선수의 몸 관리를 위해 애쓰고 계십니다. 사람 몸에 관련된 데이터는 해당 분야를 전공한 전문가가 반드시 필요합니다. 이건 야구와는 별개의 문제겠죠.


리: 님이 있는 직군, 데이터 애널리스트 대우는 어떤가요?

송: 솔직히 직군을 떠나 스포츠계에 몸담은 것 자체가 ‘좋아하는 일’을 위해 어느 정도의 경제적 요소를 포기한 거라고 봐야 할 거예요. 아마 요즘 미국 빅마켓 팀이 채용하는 석·박사급 인력 연봉이 초봉 7만 불 내외일 텐데, 그분들 전부 MIT 같은 명문대 출신이에요. 가려면 10-15만 불 받고 구글, 애플, 아마존 이런데 갈 사람들인 거죠. 고급 인력은 필요한데 줄 수 있는 연봉은 한정되어 있으니 거기서 문제가 발생하죠. 이건 어딜 가나 똑같아요.

 


NC다이노스만의 용병 보는 눈 키우기


리: 화제를 바꿔서, NC 하면 외국인 선수 잘 뽑기로 유명한데, 이번엔 망했습니다. 어떻게 보세요.

송: 망했다는 생각 한 번도 한 적 없습니다. 업 앤 다운이 있었다는 것은 인정합니다. 좀 더 잘해주면 좋겠다 싶은 선수가 있을지언정, 완전 망했다고 판단할 정도로 부진한 선수가 있다는 생각은 안 해요.


리: 올해 빼면 외국인 선수 농사가 대박이라 망했다고 보일 수 있을 거 같아요. 그동안 대박을 친 원인이 있다면?

송: 이건 팀장님께서 다른 매체에서도 꾸준히 말씀하신 건데, 우리의 기조는 ‘실패의 리스크를 줄이는’ 것입니다. ‘대박을 치자’가 아니고요. 우리가 처한 상황에서 영입할 수 있는 베스트 카드를 골라내는 데에 집중했습니다. 커쇼, 하퍼, 트라웃, 데려올 수 있으면 제일 좋죠. 근데 돈이 없잖아요? 겟 리얼. 현실을 직시하는 게 중요합니다.


성공한 남자의 포스가 넘치는 임선남 팀장


리: 테임즈는…?

송: 본인의 노력이 있기도 했고, 일단 제가 입사하기 전 영입된 선수라 뭐라 말할 게 많지 않습니다. 하지만 시즌 중에는 굉장히 엄격하게 자기관리를 했어요. 그 부분은 정말 존경합니다. 나중에 들은 이야기지만, 30홈런 정도의 예상치는 있었다고 해요. 하지만 40-40을 할 줄은 몰랐죠. 그걸 어떻게 알아요…


리: 실패를 줄이기 위해 뭘 했나요?

송: 결국 역대 외국인 선수 영입과 성공/실패 사례들을 나누다 보면, 결론은 하나에요. 기본에 집중하자. 우리 후보군의 선수들이 한국에 왔을 때 어느 정도 퍼포먼스를 낼 수 있을지 예상은 하죠. 예를 들면 A와 B가 최종후보라고 쳐요. A는 2할3푼~2할5푼 사이를 칠 거 같고, B는 2할8푼~3할2푼 사이 정돈 쳐줄 거 같아요. 리스크 제거 입장에선 예상범위가 작은 A가 좋지만, 그렇다고 억 단위 돈을 써가면서 2할 초중반 치는 선수를 데려올 수는 없죠. 제가 오기 전부터 팀장님과 박찬훈 스카우터께서 많은 시행착오를 겪으셨고, 경험도 많이 쌓으신 상태였어요.


리: 그러면 님은 뭘 했나요?

송: 사실 제가 여기 와서 외국인 스카우팅에 획기적 변화를 드린 것은 없어요. 생크림 케이크에 과일 데코 얹는 정도죠. 중요한 것은 우리 팀 내부적으로는 말을 안 해도 누가 뭘 해야 할지 이미 알기 때문에, 일 처리가 빠르고 유기적으로 돌아간다는 겁니다. 서로의 일을 믿고, 동료의 결과물을 존중해 줍니다. 물론 반대의견이 나온다고 해서 감정이 상하거나 하는 일도 없습니다. 우리는 ‘좋은 선수를 데려온다’는 공통의 목표를 위해 움직인다는 믿음이 있기 때문이지요. 이런 팀워크는 그 무엇과도 바꿀 수 없어요.


리: 정말 직장인 같은 답변이네요…

송: ……


맨 우측 덩치가 크신 분이 박찬훈 스카우터입니다…


리: 외국인 투수, 타자 중 어느 쪽이 판단하기 어렵나요?

송: 그건 구단마다 다를 거 같아요. 하지만 둘 다 어렵습니다. 그리고 MLB가 불펜을 더 많이 갈아 넣는-_- 쪽으로 변해서, 시장에서 좋은 선수 구하기가 점점 어려워졌어요.


리: AAA에 있는 선수들 한국 오라고 하면 얼씨구나 개꿀 아닌가요? 한국이 돈 많이 주니까.

송: 그럴 거 같죠? 구글이 님을 불러서 미국으로 스카우트되고, 돈을 많이 받는 케이스라면 그래요. 하지만 저기 이름 모를 나라의 무슨 회사가 당신을 임원으로 스카우트한다고 해봐요. 고민이 많이 되겠죠. 우리는 우리나라 치안이 좋다고 생각해요. 하지만 미국 선수들에게 한국은 그런 존재에요. 여전히 휴전 국가고, 항상 전쟁의 위협이 도사리죠. 사실 한국이 어디 있는지 모르는 선수들도 많아요. 그리고 가족이 있는 선수들은 와이프의 의견에 따라 모든 게 결정돼요. 집에서 반대하면 안 옵니다. 우리가 좋은 집을 제공한다 해도, 타국 생활이란 게 쉽지 않거든요.


리: 외국인 선수 뽑을 때 인성도 봅니까?

송: 네, 당연합니다. 탤런트만 따지면 정말 리그 씹어먹을 선수들이 많죠. 하지만 인성 체크를 안 하고 데려오면……. 리그도 씹어먹고, 심판도 씹어먹고, 상대 투수도 씹어먹고 다 씹어먹겠죠.


 

스포츠 구단에서 일하기 위해 필요한 것들


리: 한국 야구팀에서 일하고 싶어 하는 사람이 많은데, 조언해주자면?

송: 미국 다녀오세요. 메이저리그 구단 있다가 돌아오세요.


리: ……

송: 농담 반 진담 반이에요, 저 말은. 그만큼 채용이란 게 쉽지 않아요. 하지만 이게 꿈이고 꼭 준비를 해보고 싶으시다면, 우리가 찾을 수 있게 본인 활동의 흔적을 꾸준히 남겨 주세요. 분석 글을 쓰시건 칼럼을 쓰시건, 여러분이 일할 수 있을 만큼 준비가 되었음을 많은 이에게 알리세요.

저는 재미로 블로그를 시작했지만, 덕분에 칼럼을 쓸 수 있었고, 책 번역을 했고, 어쩌다 보니 구단에 와서 일합니다. 제 자랑이 아니고, 이 모든 것은 돌이켜보면 전부 블로그에 제 생각을 남기고 그걸 다른 분들이 봐주셨기 때문에 가능한 일이었어요. 모든 기업이 그렇겠지만 ‘시켜주면 잘할 수 있는 사람’은 원하지 않습니다. 냉정하게 들리겠지만 기업은 ‘와서 바로 잘할 사람’을 뽑고 싶습니다. 이 한마디로 절 욕하실지 몰라도 현실이 그렇습니다.


송민구 과장님의 역서!


리: 야구 분석을 위해서 어떤 것들이 도움이 될까요? 책이라거나, 글이라거나…

송: 저는 처음에 『베이스볼 핵스(Baseball Hacks)』라는 책을 보고 문자중계 파싱을 배웠어요. 정확히는 코드를 내려받아서 실행만 했죠. 그래도 그 책에서 데이터베이스라든가 뭐 많은 내용을 배웠죠. 2007년 그때만 해도 투구추적 시스템이란 게 처음 나온 거였고, 다들 신기해했기 때문에 누가 짱이다 이런 건 없었죠.

BTF(Baseball Think Factory, 지금도 사이트가 살아 있긴 한데 필진들이 팬그래프나 다른 사이트로 이동), BP(Baseball Prospectus) 같은 포럼에서 배우기도 했고요. 정말 필요하면 기사 쓴 사람, 포럼에서 글 쓴 사람한테 메일을 보내서 물어보기도 했습니다.


리: ㄷㄷㄷㄷㄷㄷ

송: 지금은 온라인 교육과정 사이트에서 세이버메트릭스 과정을 만들어놓기도 했고(edX, Sabermetrics 101), 다른 온라인 강의 사이트들도 야 구관련 강좌들을 오픈해놓은 상태입니다. 배우기는 정말 좋은 시대지요. 그리고 『애널라이즈 베이스볼 위드 R(Analyze baseball with R)』이란 책도 나와 있고요. 개발자분들께는 그냥 동네 껌 수준의 코드들일 거예요.

부끄럽긴 하지만 저는 “I work at Google”이 아니라 “I google at work” 부류기 때문에, 검색능력이 중요합니다. 끊임없이 공부하고, 연구해야 합니다. 단순 업무를 최대한 자동화하고, 나머지 시간을 자기계발과 연구에 투자하지 않으면 절대 살아남을 수 없어요.


참 쉽죠?


리: 불쌍한 어린양들을 위해 몇 권 추천해줄 만한 책이 있다면?

송:

  • 『Analyze Baseball with R』(번역본 없음)
  • 『세이버메트릭스 레볼루션』: 저한테 돈이 들어오진 않지만 제가 번역했으니 하나 끼워 넣고…
  • 『The Shift』(번역본 없음)
  • 『Ahead of the Curve』(번역본 없음)
  • 『The Performance Cortex』(번역본 없음)
  • 『Practicing with Sabermetrics』(번역본 없음. Understanding, Reasoning 시리즈물)
  • 『Downright Filthy Pithing book』(번역본 없음)
  • 『야구의 물리학(The physics of baseball)』(번역서)

그 외에 매년 『하드볼 타임스 베이스볼 애뉴얼(Hardball times baseball annual)』이란 책이 나왔는데 이제 안 나오는 듯하네요. 죄송하지만 번역서는 거의 없습니다. 돈이 안 되기 때문에… ㅠㅠ


리: 『스카우터스 아널(Scouts’ Honor)』(주; 오클랜드 성공 당시 더 긴 시간 성공한 애틀랜타를 분석한 글이다. 스카우터의 질적 분석을 강조하는 부분이 있다)이란 책을 번역하려다 그만둔 걸로 아는데, 양적인 데이터만큼이나 질적인 데이터도 중요하다고 보나요? 그 비중은 어떻다 생각하는지?

송: 하고 싶다고 다 할 수 있는 건 아니잖아요? 실력이 안 돼서 번역을 못 한 흑역사입니다(…) 각설하고 본론으로 돌아오죠. 저~기~ 위에 나왔던 폴, 그러니까 실제 폴(머니볼의 뚱땡이 드포데스타)이 했던 말을 인용하고 싶네요.


진짜 문제는 스카우트나 스카우팅이 아닙니다. 진짜 문제는 평가의 기준이 주관적이며, 데이터 기반이 아니라는 것입니다.


전 저 말이 너무 와닿습니다. 질적인 데이터를 질적인 것이라고 해서 계량화하지 않은 채로 놔두는 것은 직무 유기입니다.


리: 그렇다면 무엇을 해야 할까요?

송: 어떻게든 만들어 갈 방법을 찾고, 이걸 데이터로 녹여내고 시스템화하는 게 중요합니다. 그래야 나중에 문제가 생겨도 책임의 소지를 명확히 하고 해결의 실마리를 찾을 수 있습니다. 머니볼의 혜택을 입은 첫 세대 GM들 몇몇은 스카우트 팀을 죄다 해고한다거나, 인력을 대폭 축소시키는 등의 액션을 취했죠. 하지만 지금은? 스카우터가 70명이 넘는 구단도 있습니다. 저 사람들이 틀렸다는 게 아니라, 제대로 된 기반 하에서 시스템을 운용할 수 있으면 그만큼 질적인 데이터에 대한 수요가 있을 수밖에 없다는 말입니다.

공개 및 수정일
2019년 7월 22일 공개
수강평
아직 작성된 수강평이 없습니다.
강좌에 대한 의견을 기다리는 중입니다.
커리큘럼
야구덕후 블로거, NC다이노스 데이터분석관이 되다 맛보기 맛보기
1:54
야구덕후 블로거, NC다이노스 데이터분석관이 되다
17:26

야구덕후 블로거, NC다이노스 데이터분석관이 되다

₩5,500
19분 분량
30일 동안 무제한 수강 가능