데이터 사이언스를 위한 수학&통계학 수업 후기

지난 9월로 기억한다. 모비 아카데미에서 데이터 사이언스 강의 한 사이클을 끝내던 무렵이었는데, 필자의 강의가 수학&통계학 요구 조건이 무겁고(?), 학생들 중에 준비가 안 된 경우가 많으니, 그 다음 사이클에는 번외 강의로 수학&통계학 수업을 짧게 개설하자고 요청이 왔다. 이런 사소한 걸로 돈을 받는다니… 라는 생각에 망설임이 있었지만, 필자도 영혼이 이탈한 표정인 수강생들을 대상으로 강의하고 싶질 않아, “이런거 모르면 오지마세요”라는 뉘앙스로 짧은 수학&통계학 강의를 개설했다.

한 두번만 하고 접을 생각이었는데, 그 수업을 듣고 본 강의를 찾아오신 어느 경영학과 출신 분이, 데이터 사이언스라는게 뭔지, 왜 통계학이 필요한지, 수학은 어떻게 쓰이는지에 대해서 완전히 새롭게 눈이 뜨였다고 하고, 짧은 수학&통계학 수업을 들으면서 어느 정도 자신감이 붙어서 데이터 사이언스 본 강의도 들을 결심을 하셨다고 하더라. 원래부터 데이터 사이언스 강의를 하는 목적이 “개발자가 하는거 아닌가요?”, “우리 회사 DB 서버도 크고, 데이터도 많아요. 빅데이터 적용하는데 문제 없습니다.”라는 앞 뒤 꽉~~~ 막힌 소리하는 사람들을 좀 교육시키겠다는 목적이었으니, 그냥 두 개의 셋트 강의를 계속 유지해야겠다고 나름대로 결론을 내렸다.

지난 1월 강의가 수학&통계학을 먼저하고, 그 다음주부터 데이터 사이언스 본 강의를 진행하는 첫번째 케이스였는데, 지난 주말에 종강하고 뒷풀이에서 들은 이야기를 종합하면, 아래의 몇 가지 측면에서 꽤나 적절한 조합이 아니었나 싶다.

 

1. 데이터 사이언스에 대한 두려움 극복 or 자신의 한계 확인

수학&통계학 수업이 끝나고, 4명의 수강생이 데이터 사이언스 본 강의에 수강신청을 취소했고, 7명이 추가로 신청했다. 솔직히 말하면 수강 취소하신 4명이 수업에서 못 살아남을 것 같아서 미리 포기하시라고 말씀드리고 싶었었는데, 그래도 스펙만 보고 사람을 판단하면 안 된다는 생각에 그 분들이 의사결정을 하실 때까지 가만히 기다렸다. 다행스럽게도 짧았던 수학&통계학 수업이 적절한 가늠자가 되었는지 그 다음주에 바로 수강 취소 연락을 주시더라. 공부라는건, 특히 수학이 들어가는 공부라는건 정말 힘든 공부다. 본인의 한계가 명확하게 느껴지는 강의를 제공할 수 있어서 다행이라고 생각했고, 그 분들이 적절한 판단을 하셔서 되려 뿌듯한 감정도 있었다.

수학&통계학이 끝나고 새롭게 신청하신 7명에게 들은 뒷 이야기를 보면, 대체로 저 위에 언급했던 그 경영학과 출신 분의 생각과 비슷비슷하다. 데이터 사이언스라는게 개발자들의 코딩이 아니라, 통계학의 패턴 인식이라는걸 어느정도 인지할 수 있었고, 코드만치는 수업, 수학 몰라도 된다는 수업을 찾아갈게 아니라, 이런 수업을 들어야 제대로 배우겠구나는 판단이 섰다고 하시더라. 다룬 내용이 자연계열 1-2학년에 배우는 선형대수, 미분방정식, 회귀분석 정도였던 덕분에 자연대, 공대, 경제학과 고학년 정도면 충분히 따라올 수 있다는 자신감도 가지게 되었다는 말씀도 있었다.

 

2. 수업 구성 변화

지난 9월 강의에 어느 수강생 분이 SVM 설명하는 부분에서 구체적인 증명이 없으니 제대로 이해하고 넘어간 건지 잘 모르겠다는 말씀을 하셨다. 일반인을 대상으로한 강의에 수학적인 증명을 넣기는 너무 힘든 부분이 있어서 개념만 짚고 넘어가던 시절 이었는데, SVM이 그렇게 간단하게 개념 위주로 볼만한 내용이 아님을 더 잘 아는 입장에서 너무 강의를 가볍게 만들고 있는 건 아닌가하는 자책감을 느낀 순간이었다.

사실 학부 2학년 때 경제수학에서 배웠던 Constrained optimization만 이해하면 좀 더 깊게 설명할 수 있는 내용인데, Constrained optimization을 SVM 중간에 설명하기도 좀 그랬고, 그렇다고 Lagrangian을 푸는 내용 전체를 다 언급하려니 수업의 밀도가 흩어질 것 같아서 이래저래 깝깝했던게 사실이다.

수학&통계학 수업에 그런 내용들을 따로 빼낸 구성을 해 놓고 나니, 본 수업이 훨씬 더 유기적으로 구성되었다는 느낌이 들었다. 실제로 수업 시간에 부가적으로 전달한 내용도 많았고, 작년 12월 강좌와 올 1월 강좌를 두번 수강한 분들도 같은 의견을 주시더라.

 

3. 수강생 필터링

“이런거 모르면 오지마세요.”라는 뉘앙스는 사실 돈 벌려는 사람이 절대로 하지 말아야되는 어투다. 그러니까 데이터 사이언스 수업들을 인터넷에 뒤져보면 “수학을 몰라도 상관없다” 라는 말이 꼭 들어가는 광고 문구가 곳곳에 배치되어 있는 거겠지.

필자의 강의는 그런 수업들과 꽤나 상반된 목적을 갖고 운영된다. 당장 큰 돈을 벌려고 하는 강의도 아니고, 어느 정도 준비된 분들이 강의 하나를 듣고 좀 혼자 소화하는 과정을 거쳐서 “진짜” 데이터 사이언티스트가 되기를 원해서 꾸려나가는 강의다. 당연히 수학&통계학 모르는 사람이 오면 무슨 말인지 하나도 모르는 상태에서 시간만 날리게 된다.

수학&통계학이 추가로 개설되어 있으니 도대체 왜 수학이 필요한지에 대해서 어느 정도는 이해하고 오신 분들이 많고, 최소한 마음가짐이라도 수학적인 도전이 있는 수업을 감당하실 수 있는 분들 위주로 수업이 구성되었던 것 같다.

 

4. 수업 집중도 향상

박사 졸업생들이 가장 꿈꾸는 직장은 좋은 학교 교수로 임용되고, 열심히 연구해서 좋은 논문을 내는 것이다. 물론 그런 자리는 한정되어 있기 때문에 좀 덜 좋은 학교로 가더라도 연구 환경만 잘 갖춰주기를 요구하는 걸 많이 보는데, 필자는 가르치는 학생이 필자의 기대 수준을 못 맞춰주는 학교는 연구 환경이나 생활 기반 시설과 관계없이 무조건 안 좋은 학교라고 생각했다.

이번 사이클에 필터링된 수강생 분들이 오신 덕분인지, 필자의 수업에 임하는 태도가 매우 적극적으로 바뀌더라. 영혼이 이탈한 표정을 짓는 분들 앞에서 하는 강의는 서 있는 것만으로도 고역인데, 반대로 “어디서 배우기 힘든 귀한 지식임을 알기에 더 노력해서 허투루 사용하지 않겠습니다”는 눈빛을 가진 분들 앞에서는 오래전에 까먹었던 내용도 다시 생각이 나더라.

인간은 참 환경에 많은 영향을 받는 동물이다 ㅋㅋ

 

나가며

산업공학과 대학원 진학을 고민하던 수강생 한 분이 아래의 메일을 보내주셨다.

안녕하세요. 1월 수강생 XXX입니다.

패스트캠퍼스 강의를 수강하려다 마지막으로 한 번 더 데이터사이언스 강의를 찾아보자 하여 우연히 파비 블로그를 찾게 되었고 수강하게 되었습니다.

그 때 그 짧은 순간이 정말 운이 좋았다고 생각합니다…

저 나름대로 대학원 진학을 결정하는 것이 쉽지 않았는데 수업을 들으며 ‘모델들이 어떤 아이디어로 만들어졌는가’,  ‘어떤 것을 공부해나가야 하는가’와 같은 것들에 대해 잘 전달해주셔서 의사결정을 하는데 도움이 많이 되었습니다. 

당장 산업의 일꾼이 되셔야할 분을 괜히 대학원으로 이끈게 아닌가는 핀잔을 들을지도 모르겠지만, 최소한 필자의 의도, 더 근본적으로는 데이터 사이언스란 무엇인가에 대한 정확한 관점을 갖고 나가는 수강생이 있는 것 같아서 은근히 뿌듯했다.

메일에 언급하신 다른 교육 기관에 대한 직접적인 불만은 없지만, 그들의 가격 정책과 데이터 사이언스 과정 홍보 내용에 대한 반감으로 시작한 강의이니만큼, 한 분이라도 더 제대로 된 데이터 사이언스를 배워나가셨으면 좋겠다. 그 동안 홍보 한 번 제대로 안 했는데, 윗 메일을 보내주신 분들 같은 분을 위해서라도 어쩌면 홍보를 하는게 더 맞지 않을까는 생각도 든다.

(퀄리티로 승부하는 시장에서는 광고가 필수적이라는 모델까지 증명해놓고, 정작 퀄리티로 승부하고 있으면서 홍보는 하나도 안 하고 있으니….)

X