머신러닝에 왜 통계학이 필수일까?

작년 (2017년) 이맘때로 기억한다. 어느 벤처 투자사 (Venture Capital)와 미팅을 하는데, 왜 머신러닝에 통계학이 필수적인지 잘 이해가 안 된다는 질문과, 머신러닝은 알아서 변수를 다 찾아주는 거라고 들었는데, 도대체 무슨 변수를 어떻게 찾아서 최적화를 한다는 건지 잘 이해를 못하겠다고 하더라. 그 중 한 명은 통계학을 꽤나 쓰는 학문으로 석사 유학을 다녀오신 분이고, 다른 한 분은 국내 소개 더보기 머신러닝에 왜 통계학이 필수일까?[…]

머신러닝 교육 포기하고 외주업체를 써야하는 이유

가끔 출장 교육(?)이 가능하냐는 연락을 받는다. 거의 대부분은 일언지하에 거절한다. 그런 보따리 강사하려고 이 강의를 시작한게 아니라, 실력없는 사람들의 3류 강의, 직접 데이터 다뤄본 적이 없는 교수들의 책 속에만 파묻힌 강의에 분노해서, 시장이 좀 교육이 되었으면 하는 기대를 갖고 남는 시간을 활용해서 하는 강의인데, 폰돈 몇 푼 쥐어주면서 “이 강의를 듣고 나면 우리 회사 사람들이 소개 더보기 머신러닝 교육 포기하고 외주업체를 써야하는 이유[…]

머신러닝 다루는 컴퓨터공학과, 통계학과 수업들

수업에 찾아오는 공대생들이 매번 넋나간 표정으로 앉아있는 것 같아서, 도대체 우리나라 공대들은 어떤걸 가르치길래 문과인 경제학과 출신도 따라오는 수학&통계학도 이해 못해서 쩔쩔매고, 학부 수업에 머신러닝 관련된 전공 수업이 얼마나 없길래 외부에 저렇게 학원들이 많이 생기는지 궁금해졌다. 우리학교 컴공과 웹페이지에 교과목 정보 리스트를 쭈욱~ 훑어봤는데, 필요한 수업들 다 있는데? (Source: 인스티즈) 학부 아니고 대학원이라구요? 음… 대학원 말고, 소개 더보기 머신러닝 다루는 컴퓨터공학과, 통계학과 수업들[…]

작정하고 쓰는 머신러닝 강의 비판 (2)

필자는 학부 때부터 경영학과를 무시했다. 왜? 수학 안 하니까. 실험도 안 하고. 그래놓고 영어 약자만 읊어대니까. 필자의 학부시절, 총장으로 계시던 정운찬 교수님이 학부 교육 과정에서 깊이를 찾을 수 없는 경영학과를 없애고, 행정학과처럼 대학원 과정만 남기려고 하셨다. 실제로 미국의 거의 대부분의 학교들에도 학부에 경영학과 과정이 없기도 하다. 당시 컨펌되지 않은 소문에 따르면 경영학과 모 교수님이 바닥에 소개 더보기 작정하고 쓰는 머신러닝 강의 비판 (2)[…]

작정하고 쓰는 머신러닝 강의 수강생 비판 (feat. 꼰대)

필자의 수업 타이틀인 “데이터 사이언스”라는 이름을 처음 듣게 되는 경로는 아마도 알파고, 인공지능 같은 Buzzword 였을 것이고, 그 다음으로 좀 관심이 있어서 검색을 하면, 딥러닝이라는 단어, 같이 검색되는 머신러닝이라는 단어를 만나고, 그리고나서야 데이터 사이언스라는 단어를 만날 것이라고 생각한다. 정작 데이터 사이언스가 가장 포괄적인 개념이고, 머신러닝은 특정한 데이터의 패턴을 찾아주는 응용통계학이고, 딥러닝은 그 중에서 좀 계산비용이 소개 더보기 작정하고 쓰는 머신러닝 강의 수강생 비판 (feat. 꼰대)[…]

R과 Python을 같이 써 보자 – RPy2(1)

이전글 – 왜 Python 이 아니라 R로 강의하는거야?   귀국하고 지난 1년 반 남짓한 기간 동안 데이터 사이언티스트로 살면서 필자가 싸워(?)야했던 오해 중 가장 큰 두 개를 꼽자면,  빅데이터 = 용량만 많은 데이터 데이터 사이언티스트 = 공대 출신 개발자 라는 잘못된 이해들이었다. 수 십개의 블로그 포스팅도 빅데이터란 유저들의 행동데이터를 말하고, 데이터 사이언티스트는 그 행동데이터에서 패턴을 소개 더보기 R과 Python을 같이 써 보자 – RPy2(1)[…]

데이터 사이언스와 게임이론

데이터 사이언스라는 업무가 결국은 빅데이터가 있는 곳에서만 유의미한 탓에, IT업계 정도만 진짜 빅데이터를 갖고 뭔가 여러가지 시도를 하고 있는 것을 본다. 얼마 전까지만해도 한국의 IT회사들 대부분이 이미지 인식이나 음성 인식같은 기초적인 데이터 사이언스 업무에만 관심을 갖고, Noise가 더 많은 데이터를 처리 or 가공하려는 시도는 안 하는 통에 많은 경우에 공대 출신 개발자들에 대한 수요만 많은 소개 더보기 데이터 사이언스와 게임이론[…]

머신러닝과 블록체인

이전 글: 데이터 사이언스와 비트코인 필자의 박사 논문은 은행 네트워크에 외부 충격이 와서 1 or 2개 은행이 그 직격탄을 맞고 (예시. 2008년 Bear Sterns와 Lehman Brothers), 그 때 파산하는 은행과 직접 금융거래로 묶여 있던 다른 은행들이 그 충격을 어떻게 흡수하고, 은행 네트워크 속에서 간접적인 영향을 받는 다른 제3, 제4의 은행들이 그 충격을 어떻게 피할까, 그런 소개 더보기 머신러닝과 블록체인[…]

인과관계 vs. 상관관계 – Granger causality

데이터 사이언스 강의를 하다보면, 통계학이 뭐가 중요하냐고, 그냥 “빅”데이터 전부를 “딥”러닝 모델에 다 집어넣으면 알아서 답 가르쳐주는거 아니냐고, 왜 자꾸 고등학교 이후로 보지도 않은 수학 이야기하면서 수업을 진행하냐고 불편한 기색을 못 감추는 분들이 있다. 아무 변수나 막 집어넣는 걸 피하려고 여러가지 작업을 해 놓은 현업 머신러닝 적용 논문 (“합리적으로 변수 추출하기” 참조)을 소개시켜줘도 그런 말씀을 하시는 소개 더보기 인과관계 vs. 상관관계 – Granger causality[…]

비전문가들도 데이터 사이언스를 공부해야하는 이유?

학부시절, 아니 대학원 재학 시절에도 마찬가지였는데, 필자의 전공 교수님들이 대체로 보면 굉장히 까칠하다. 어릴 땐 나름대로 상처가 된 적도 있었는데, 대학원 들어가는 준비하면서 좀 이해가 되는 느낌을 받았고, 박사 재학 중에는 필자도 그런 “괴물”이 되어가는 걸 느꼈다. (사실 원래도 좀 까칠하다 ㅋㅋ) 요즘와서는 학창시절 불편하게 생각했던 교수님들의 모습을 그대로 닮아버린게 아닐까 싶어서 가끔 뜨끔할 때가 소개 더보기 비전문가들도 데이터 사이언스를 공부해야하는 이유?[…]

딥러닝 최적화된 그래픽 카드

이전 글 몇 달전의 일이다. 2016년에 구매했던 ThinkPad T460p 을 중고로 팔았다. 참고로 필자는 “빨콩 매니악”이기 때문에 “빨콩”이 달린 ThinkPad 노트북만 쓰고, 직업적인 이유로 퍼포먼스가 강조된 매우 고사양 노트북 위주로 구매한다. 필자가 쓰던 ThinkPad T460p는 말 그대로 “끝판왕” 모델이었는데, i7-6820HQ에 DDR4램 32GB, 그리고 그래픽 카드가 ThinkPad 14인치 이하 모델 중 제일 좋은 GeForce 940MX + 소개 더보기 딥러닝 최적화된 그래픽 카드[…]

딥러닝 돌리기 위한 최적 노트북

강의 시작 1주일 정도를 남기고 흔히 받는 질문들이 있다. 제 랩탑이 오래됐는데, 수업 듣는데 문제 없을까요? 어느 정도 랩탑을 갖고가야 수업 듣는데 문제가 없을까요? 머신러닝을 구현하는데 제일 좋은 랩탑은 어떤 랩탑일까요? 아래의 설명을 다 읽기 힘든 사람들을 위해서 짧게 요약한 대답을 드리면, 64비트 운영체제가 돌아가는 시스템이면 필자가 수업에 쓰는 패키지는 모두 돌릴 수 있다. 그리고 소개 더보기 딥러닝 돌리기 위한 최적 노트북[…]

데이터 사이언티스트가 되는 길

데이터 사이언스에 대한 견해를 묻는다는 메일을 하나 받았다. 엉? 견해? 무슨 견해? (중략) 최근에 데이터 사이언스에 대한 관심이 많아진 공대 학부생입니다. 제가 어떤 데이터를 추출하고 분석하여 새로운 유용한 가치를 주고 싶은데, 데이터 사이언스, 맞는 길이겠죠? 다만 한 사람이 그 과정을 전부 하기는 불가능하다고 합니다. 그래서 데이터 엔지니어, 분석가 (도메인 지식), 그리고 수학, 통계의 박사과정을 밟은 소개 더보기 데이터 사이언티스트가 되는 길[…]

데이터 사이언스를 위한 수학&통계학 수업 후기

지난 9월로 기억한다. 모비 아카데미에서 데이터 사이언스 강의 한 사이클을 끝내던 무렵이었는데, 필자의 강의가 수학&통계학 요구 조건이 무겁고(?), 학생들 중에 준비가 안 된 경우가 많으니, 그 다음 사이클에는 번외 강의로 수학&통계학 수업을 짧게 개설하자고 요청이 왔다. 이런 사소한 걸로 돈을 받는다니… 라는 생각에 망설임이 있었지만, 필자도 영혼이 이탈한 표정인 수강생들을 대상으로 강의하고 싶질 않아, “이런거 소개 더보기 데이터 사이언스를 위한 수학&통계학 수업 후기[…]

타겟 광고에 대한 반감 vs. 공감

타겟 광고에 대한 엄청난 과장이 담긴 글을 하나 봤다. 사용자들이 어떤 페이지를 거쳐갔는지에 대한 정보를 바탕으로 어떤 상품에 관심이 있을 것이라고 추정하고, 맞춤형 타겟 광고를 하는 서비스에 이용자들이 굉장한 불쾌감을 느끼는 경우가 많단다. 저자의 의도인지는 모르겠지만 그런 광고에 대한 강한 거부감이 느껴지는 글이었다. 딱 저 알고리즘을 만들어서 Re-target 해주는 광고회사의 Senior Data Scientist 였고, 또 소개 더보기 타겟 광고에 대한 반감 vs. 공감[…]

X