머신러닝 교육 포기하고 외주업체를 써야하는 이유

가끔 출장 교육(?)이 가능하냐는 연락을 받는다. 거의 대부분은 일언지하에 거절한다. 그런 보따리 강사하려고 이 강의를 시작한게 아니라, 실력없는 사람들의 3류 강의, 직접 데이터 다뤄본 적이 없는 교수들의 책 속에만 파묻힌 강의에 분노해서, 시장이 좀 교육이 되었으면 하는 기대를 갖고 남는 시간을 활용해서 하는 강의인데, 폰돈 몇 푼 쥐어주면서 “이 강의를 듣고 나면 우리 회사 사람들이 다들 머신러닝의 전문가가 되는거겠죠?”라는 어이없는 질문을 하는 대기업의 HR 교육 담당자의 “갑”질에 굳이 필자가 “을”질을 해야할 이유가 있나?

필자가 학부생이던 2000년대 초중반에 한국의 기업 사회에서 제일 추앙(?)받는 직장은 외국계 IB의 몇몇 부서들과 전략 컨설팅 회사들이었다. 그 회사들에서 일하며 배우는 내용에 대한 맹신(?)이 얼마나 컸는지 잘 보여주는 예시로, 일본의 3대 초대형 은행 중 하나인 미쯔비시가 2008년에 Morgan Stanley에 21%의 지분 투자를 결정하면서 미쯔비시 핵심 인력을 보낼테니 Morgan Stanley의 몇몇 부서에서 “훈련”을 시켜달라는 조건을 걸었다는 뒷 이야기가 있다. 참고로 2008년은 Bear Sterns, Lehman Brothers 등의 대형 IB들이 무너지면서 전세계 금융시장이 미증유의 대혼란을 겪던 해였고, 살아남은 대형 IB들 중 상당수가 미국과 유럽에서 급전(!)을 못 구해 아시아까지 손을 벌리러 찾아왔던 해였다. Morgan Stanley는 그렇게 일본 자금을 받아서 위기를 넘겼고, Bear Sterns는 자금 사정이 쬐끔 나았던 JP Morgan-Chase에 (사실상 0원에) 인수되었고, Lehman Brothers는 한국의 산업은행에까지 돈을 구하러 왔다가 딜이 틀어지면서 다음날 파산을 신청했다.

(Source: The Guardian)

기업의 운명이 경각에 달린 그 순간에도 인력을 “훈련”시켜달라는 요청에 코웃음을 쳤다는 후문이 있는데, 이걸 쉽게 배울 수 있는 내용이 아니고, 결국엔 그 회사 내부에 들어가서 같이 일을 해야 겨우 알아먹을 수 있다고 생각했기 때문에 일본의 콧대 높은 대형은행들이 90억달러나 되는 큰 돈을 썼을 것이다. 그런 대형 IB들이 당장 내일 모레 망할지도 모르는 판국이었지만, 그렇게 위험 부담을 해서라도 배워야겠다는 생각을 했기 때문에 그런 과감한 투자를 했을 것이라고 생각한다. 그 시절 필자가 만났던 한국의 대형 은행 고위직 관계자들 중 하나는 “뭐, 기계 같은게 있어서 거기에 재무제표를 넣으면 뿅~ 하고 기업 가치를 계산해주는거야?”라고 물었었는데, 이 분은 심지어 필자의 학부 대선배고, 박사 유학을 다녀오신 분이었다. 대선배님께 불경스러운 표현인건 알지만, 그 정도 인력이 아무리 많이 외국계 증권사에 들어갔어도 기업 가치 평가 모델을 제대로 익히고 나올 수 없었을 것이다. 말을 바꾸면, 누군가는 특정 비지니스를 배우려고 대규모 투자를 하고, 회사 인력을 투입하는데, 또 다른 누군가는 “좋은 학교 나왔으니까”, “유학 갔다왔다니까” 잘하겠지라는 “믿음”만 갖고 인력과 회사 운영을 했다는 뜻이다.

근데, 요즘 비슷한 경우를 데이터 사이언스 교육에서 접하고 있다.

 

1. 대기업 머신러닝 강의 by 학원들

수십차례의 포스팅을 통해서 허접한 수준의 학원 교육은 별 도움이 안 된다는 “팩트 폭격”을 했었다. 그래도 꾸준히 그런 교육에 대한 수요는 있다. 안 그러면 강남역 일대에 있는 IT학원들 중에 “머신러닝” 가르친다고 주장하는 학원들이 벌써 교육 자체를 접었겠지. 필자에게도 잊을만하면 한번씩 연락이 온다. 자기네 회사 인력 중에서 제일 알짜 인력들만 배치하겠단다. 가끔 물어본다. 어떤 기준으로 “알짜”를 선발하겠냐고. 돌아오는 대답 중 몇 가지를 소개하면, “1-2년차가 아니라 5년차 이상의 숙련된 인력”, “학벌 기준, 학점 기준, 사내 업무 평가 기준으로 선발된 인력”, “각 팀에서 추천받은 인력” 등등이 있었다. 만약에 필자가 같은 상황에 처해서 수강생을 선발해야하면, 그냥 선형대수, 미분방정식, 회귀분석으로 시험을 치겠다. 시험 과목만 듣고 쫄아서 자체 필터링이 어느정도 될 것이고, 그걸 모르면 어차피 교육을 받아도 시간낭비일테니까. 수업시간에 벙찐 표정이 되거나, 아니면 졸고 있겠지.

그렇게 납득 안 되는 기준으로 인력을 뽑아서, 또 시킨다는 교육이 대부분 코딩 부트캠프다. 왜 그런거 교육시키냐고, 그거 가르쳐봐야 저 사람들 일하는데 별 도움 안 된다고 가르쳐줘도, “실무”를 가르쳐야지 “이론”을 가르칠 수는 없다면서 머신러닝이 뭔지, 어떻게 써야하는지도 모르는 소리를 읊어댄다. (저 분들 진짜 토하는 “이론” 수업 안 들어봤나…) “수학” 쓰면 안 된다고 신신당부를 하고, 직원들이 졸업한지 좀 오래되었으니 이해해달라고 계속 강조를 한다. 아마 HR 교육 담당자는 교육을 진행했고, 수강생들 이수 수준이 몇 %라는 걸로 인사 평가가 결정이 되니 필자의 냉정한 충고에는 별로 관심이 없을 것이다. 그 교육을 받은 수강생들도 교육을 무사히 수료했다는 걸로 인사 고과에서 높은 점수를 받을 수 있으니 그에 맞춰서 기계적으로 코드나 칠 것이다. 그래놓고 사내에 대형 “인공지능” 프로젝트 만든 다음에, 윗 사람들은 “돈을 얼마나 썼는데, 왜 이렇게 성과가 안 나오는거야?”라며 들들 볶는 소리만 하겠지. 정작 본인도 수학 들어간 모델 보여주면 넋이 나간 표정이 될꺼면서.

몇번 마지못해 대기업 강의를 갔다가, 학부 1-2학년 때 배운 수학 & 통계학마저 싹 다 잊어버린 대리급-과장급 실무진을 대상으로 강의해서는 별로 답이 없겠다는 결론을 내리고 있는 중이다. 둘 중 하나를 해야한다.

아마 어지간한 회사들은 너무 큰 돈 들어가는거 아니냐고 화들짝 놀라고, 어떻게든 지금 보유한 인력들을 쥐어짜서 이걸 “어떻게든” 만들어보라는 식으로 몰아세울 것이다. 여태까지는 그렇게 버틸 수 있는 수준의 지식들 이었으니까, 앞으로도 그렇게 버틸 수 있겠지라고 생각하는거겠지. 어쩌나, 이번엔 진짜로 수학이랑 통계학 못하면 안 되는걸, 근데 학부 3학년 때 시험지에 써낸 이후로 한 번도 본 적이 없는걸.

 

2. 대기업 머신러닝 강의 by 교육기관들

(Source: 유머게시판) – 강의노트 만들기가 귀찮(?)았는지 나무위키로 강의하시는 교수님… (대학명 삭제)

필자의 수업에 왔다간 분들 몇몇분은 자신의 한계를 느낀다면서 데이터 사이언스 가르친다는 대학원을 가셨다. 학교에 똑똑한 교수님들 많을테니, 많이 배워서 저도 좀 가르쳐주시라고 응원해드렸는데….

받는 피드백을 보면, 정말 충격적이다 예상했던 대로 “배우는건 1도 없습니다”라는 내용이 대부분이다. 필자의 선배들, 동기들 중 박사 학위 갔던 사람들 일부가 한국에 교수로 재직 중이기 때문에, 학부시절부터 봤던 그들이 환골탈태하지 않았다는 전제아래, 뭘 가르치고 있을지 내용이 대충 눈에 보인다. 어디 괜찮은 교과서와 Problem set 구해보고, 그게 없으면 인맥을 통해서 여기저기서 “자료”를 구했을 것이다. “김* 교수, 전에 XXX 대학에 이* 교수랑 같이 박사했다고 그러지 않았어? YYY에 최* 박사도 그거 했다고 하던데. 그 과목 강의노트 같은 거 좀 부탁해도 될려나?” 이런 대화들 하고 있겠지. 그 중 빅데이터의 정의가 뭔지도 모르는 사람이 수두룩할텐데

(*김, 이, 최는 임의로 잡은 성씨입니다. 실제 인물과는 무관합니다.)

아닌 교수님들, 정말 존경하고 싶은 분들이 많은 것도 아는데, 그들도 정년 심사를 받기 전까지는 논문 내기에 바쁘고, 논문 실적 쌓아서 테뉴어를 받고나면 프로젝트 따서 가족들 먹여살리기 바쁘다. 교수도 생활인이니까. 강의 평가가 자신의 연봉에 미치는 영향이 너무 미미하기 때문에, 어지간한 책임감으로는 수업 잘 짜기 힘들 것이다. 하물며 수학 & 통계학 다 까먹은게 뻔한 직장인 대상의 대학원 수업에 자신의 내공을 깊게 담은 수업을 진행하기란 더더욱 쉽지 않을 것이다.

수업 듣고 가신 어느 초특급 실력자분 중 하나는 자기가 보기에는 너무 심각하게 엉망인, 아무것도 없는 모델을 대학원 선배 하나가 발표하는걸 보고 충격 x 1을 받았는데, 교수진 중 한 분이 “너무 좋은 모델”이라며 언론에 알려야겠다고 나오는 걸 보고 충격 x 2를 받았다고 하소연을 담은 연락도 주시더라. 뭐, 교수 사회라는게, 꼭 논문이 좋아야 그런 칭찬을 받는게 아니다. 대형 프로젝트를 줄 수 있는 회사 사람이면 교수들도 “을”질 하는 수 밖에 없지 뭐. 아니면 학생들이 더 열심히 이런 시도를 하라는 격려차원에서 그랬을 수도 있다. 너무 그렇게 실망하진 않으셨으면 좋겠다ㅋ

출장 교육(?) 연락을 주신 기업들 상당수가 필자의 냉랭한 태도에 다른 대안으로 대학 교수들에게 연락했을 것 같은데, 바쁜 와중에도 심혈을 기울여서 강의 자료 만드시는 교수님들께 돈 좀 아끼지 말았으면 좋겠다. 그저 싸게 해 준다는, 알맹이 없는 수업 진행하는 사람들한테 돈 쓰지 말고. 정부기관이나 기업들에서 “교수님들 강의도 요청해봤는데요…”라면서 불평하시지만 말고, 실력 있는 교수님들에게 수업듣고나면

  • 1. 벙찐 표정이 되고,
  • 2. 이걸 도대체 어떻게 사내 프로젝트에 적용할 수 있을까는 의문을 던지게 되고,
  • 3. 마침내는 자신들의 역량이 안 된다는 사실을 깨달으실 듯

역량 부족하시면 대안없고, 교수님들과 프로젝트 해야 된다고 충고하면 “너무 비싸서” 안 되고, 어떻게 “교육으로, 자체 인력으로 해결”해보려고 하겠지. Residual regression을 덧셈, 뺄셈으로 “그럴듯하게 보이도록” 해결했던 친구들처럼. 괜히 엉뚱하게 심혈을 기울여 잘 가르쳐준 교수님들 욕만하는지도 모르겠다. 자기네들 인력 수준 탓은 안 하고.

 

나가며

(Source: 영화 Armageddon, 영어 자막 및 한국어 번역 자체 추가)
– 지구-혜성 충돌 위험으로 회의 중, 다른 팀에서 나온 “단순무식”한 조언에 어이상실한 NASA 수석 연구원-

몇 년전부터 빅데이터, 머신러닝 같은 용어들이 일반에까지 널리 퍼지며 저변은 넓어졌지만, 반대급부로 여러가지 부작용들이 발생하고 있다. 잘 모르고 빅데이터가 무조건 용량 많은 데이터라고 하는 사람들 중에는 전세계인이 제일 많이 들은 머신러닝 온라인 강의를 한 이름 높은 학교 교수도 있는 판국이다. 언어, 인문, 경영학, 사회과학을 제외한 거의 대부분의 학부 과정에서 저학년 수업 때 배우는 미분방정식, 선형대수학과 고학년 때 보게되는 회귀분석을 모르면 머신러닝은 수박 겉핡기로 밖에 못 배운다는 냉정한 현실을 인지하지 못하고, 과거처럼 주먹구구식으로 어떻게 돈과 시간을 쏟아부으면 해결되겠지라고 안이하고 접근하는 사람들이 많은 것 같다.

당장의 그런 수박 겉핡기식 교육으로 해결이 될까? 다음 세대 기술이라는 블록체인을 가만히 들여다보면, 필자가 은행 네트워크가 붕괴하는 걸 모델링할 때 봤던 네트워크 이론(Network Theory)이 기술의 핵심이다. 중심이 하나인 네트워크가 항상 가장 효율적인데, 모든 객체가 중심이 되도록 모델의 구조를 변경하기 위해서 게임이론을 기발하게 갖다 쓰는 걸 보고나니, 블록체인 교육은 또 어떻게 시장 공급이 생길지, 어떻게 요구할지 궁금해진다. 네트워크 구성과 문제 해결을 위한 게임이론을 설명하면서 스팸 메일을 걸러내고, 대형쇼핑몰 대체재를 만들어내는 이야기를 하면, “이론”말고 “실무”를 하자면서, 무슨 라이브러리에서 어떤 코드를 쓰면 블록체인으로 쇼핑몰 만들어지는지 그 코드 좀 달라고 그럴 것 같은데? 코드 Copy & Paste하는게 “실무”라고 생각하는 그들에게 뭘 기대하랴? 개발자들과의 미팅은 항상 “무슨 라이브러리 많이 쓰세요?”로 시작하니까. 아니, 그것보다 “그 대박났다는 코인이라는게 블록체인으로 만든거라면서요? 복잡한 건 패스하구요, 돈 어떻게 버는지만 좀 가르쳐주시면 안 되나요?” 같은 더 저급한 질문하지나 않을런지 모르겠다.

문득 학부 때 게임이론 숙제 조모임을 같이 했던 공대 형님들 3명이 기억난다. 학기초엔 이론은 이해 못하더라도 숫자라도 꿰어 맞춰서 풀어오더니, 점점 수업의 깊이가 깊어지면서 못 푼 문제의 비중이 증가했고, 결국 마지막 숙제 10문제는 아예 손을 놨더라. 학기 내내 열심히 토렌트 시드 역할을 해줬다. 공학 수업에서 계산에(만) 집중하다 갑자기 만난 수학의 깊이에 놀랐었겠지. 그런데, 웃긴 사실은 그 수학의 깊이라고 예를 드는 수업이라는게, 수학과도 아니고, 문과 수업이고, 학부 수업이었다. 저 위 짤방 속의 학점을 받(았다고 들)은 이해도로 블록체인을 회사 사업 모델에 얹으려는 공학도들은 도대체 어떻게 접근할까…copy & paste?

아마 머신러닝, 블록체인 같은 주제로 IT관련 대기업 강의가면 그 형님들이 핵심 인재로 뽑혀나와 있으실 것이다. 탑스쿨 공대를 우수한 성적으로 졸업한 회사 최고의 인재이실테니까.

X