머신러닝에 왜 통계학이 필수일까?

작년 (2017년) 이맘때로 기억한다. 어느 벤처 투자사 (Venture Capital)와 미팅을 하는데, 왜 머신러닝에 통계학이 필수적인지 잘 이해가 안 된다는 질문과, 머신러닝은 알아서 변수를 다 찾아주는 거라고 들었는데, 도대체 무슨 변수를 어떻게 찾아서 최적화를 한다는 건지 잘 이해를 못하겠다고 하더라. 그 중 한 명은 통계학을 꽤나 쓰는 학문으로 석사 유학을 다녀오신 분이고, 다른 한 분은 국내 소개 더보기 머신러닝에 왜 통계학이 필수일까?[…]

머신러닝 교육 포기하고 외주업체를 써야하는 이유

가끔 출장 교육(?)이 가능하냐는 연락을 받는다. 거의 대부분은 일언지하에 거절한다. 그런 보따리 강사하려고 이 강의를 시작한게 아니라, 실력없는 사람들의 3류 강의, 직접 데이터 다뤄본 적이 없는 교수들의 책 속에만 파묻힌 강의에 분노해서, 시장이 좀 교육이 되었으면 하는 기대를 갖고 남는 시간을 활용해서 하는 강의인데, 폰돈 몇 푼 쥐어주면서 “이 강의를 듣고 나면 우리 회사 사람들이 소개 더보기 머신러닝 교육 포기하고 외주업체를 써야하는 이유[…]

머신러닝 다루는 컴퓨터공학과, 통계학과 수업들

수업에 찾아오는 공대생들이 매번 넋나간 표정으로 앉아있는 것 같아서, 도대체 우리나라 공대들은 어떤걸 가르치길래 문과인 경제학과 출신도 따라오는 수학&통계학도 이해 못해서 쩔쩔매고, 학부 수업에 머신러닝 관련된 전공 수업이 얼마나 없길래 외부에 저렇게 학원들이 많이 생기는지 궁금해졌다. 우리학교 컴공과 웹페이지에 교과목 정보 리스트를 쭈욱~ 훑어봤는데, 필요한 수업들 다 있는데? (Source: 인스티즈) 학부 아니고 대학원이라구요? 음… 대학원 말고, 소개 더보기 머신러닝 다루는 컴퓨터공학과, 통계학과 수업들[…]

작정하고 쓰는 머신러닝 강의 비판 (2)

필자는 학부 때부터 경영학과를 무시했다. 왜? 수학 안 하니까. 실험도 안 하고. 그래놓고 영어 약자만 읊어대니까. 필자의 학부시절, 총장으로 계시던 정운찬 교수님이 학부 교육 과정에서 깊이를 찾을 수 없는 경영학과를 없애고, 행정학과처럼 대학원 과정만 남기려고 하셨다. 실제로 미국의 거의 대부분의 학교들에도 학부에 경영학과 과정이 없기도 하다. 당시 컨펌되지 않은 소문에 따르면 경영학과 모 교수님이 바닥에 소개 더보기 작정하고 쓰는 머신러닝 강의 비판 (2)[…]

머신러닝과 블록체인

이전 글: 데이터 사이언스와 비트코인 필자의 박사 논문은 은행 네트워크에 외부 충격이 와서 1 or 2개 은행이 그 직격탄을 맞고 (예시. 2008년 Bear Sterns와 Lehman Brothers), 그 때 파산하는 은행과 직접 금융거래로 묶여 있던 다른 은행들이 그 충격을 어떻게 흡수하고, 은행 네트워크 속에서 간접적인 영향을 받는 다른 제3, 제4의 은행들이 그 충격을 어떻게 피할까, 그런 소개 더보기 머신러닝과 블록체인[…]

딥러닝 최적화된 그래픽 카드

이전 글 몇 달전의 일이다. 2016년에 구매했던 ThinkPad T460p 을 중고로 팔았다. 참고로 필자는 “빨콩 매니악”이기 때문에 “빨콩”이 달린 ThinkPad 노트북만 쓰고, 직업적인 이유로 퍼포먼스가 강조된 매우 고사양 노트북 위주로 구매한다. 필자가 쓰던 ThinkPad T460p는 말 그대로 “끝판왕” 모델이었는데, i7-6820HQ에 DDR4램 32GB, 그리고 그래픽 카드가 ThinkPad 14인치 이하 모델 중 제일 좋은 GeForce 940MX + 소개 더보기 딥러닝 최적화된 그래픽 카드[…]

딥러닝 돌리기 위한 최적 노트북

강의 시작 1주일 정도를 남기고 흔히 받는 질문들이 있다. 제 랩탑이 오래됐는데, 수업 듣는데 문제 없을까요? 어느 정도 랩탑을 갖고가야 수업 듣는데 문제가 없을까요? 머신러닝을 구현하는데 제일 좋은 랩탑은 어떤 랩탑일까요? 아래의 설명을 다 읽기 힘든 사람들을 위해서 짧게 요약한 대답을 드리면, 64비트 운영체제가 돌아가는 시스템이면 필자가 수업에 쓰는 패키지는 모두 돌릴 수 있다. 그리고 소개 더보기 딥러닝 돌리기 위한 최적 노트북[…]

타겟 광고에 대한 반감 vs. 공감

타겟 광고에 대한 엄청난 과장이 담긴 글을 하나 봤다. 사용자들이 어떤 페이지를 거쳐갔는지에 대한 정보를 바탕으로 어떤 상품에 관심이 있을 것이라고 추정하고, 맞춤형 타겟 광고를 하는 서비스에 이용자들이 굉장한 불쾌감을 느끼는 경우가 많단다. 저자의 의도인지는 모르겠지만 그런 광고에 대한 강한 거부감이 느껴지는 글이었다. 딱 저 알고리즘을 만들어서 Re-target 해주는 광고회사의 Senior Data Scientist 였고, 또 소개 더보기 타겟 광고에 대한 반감 vs. 공감[…]

광고? 타게팅? Waste of money?

경제학에는 “매몰비용 (Sunk Cost)”라는 개념이 있다. 고가의 영화 티켓을 끊고 들어갔는데, 정작 영화가 너무 재미없다면? 돈이 아까워서 영화관에 죽치고 앉아 있는 것보다, 맘을 비우고 나와서 다른 재밌는 활동을 찾는편이 더 나음에도 불구하고, 사람들이 “본전”생각이 나서 꾹 참고 있는 상황을 설명하는데 가장 적합한 개념이 아닐까 싶다. 광고 비용은 경제학에서 말하는 대표적인 매몰비용이다. 중간에 중단하고 원금 회수가 소개 더보기 광고? 타게팅? Waste of money?[…]

배경 지식 vs. 배움의 열정

지난주에 모비아카데미를 통해서 진행했던 10주짜리 데이터 사이언스 풀 코스 강의를 끝냈다. 강의 초반에는 학생 분들이 수식이 많이 나온다고 불평하셨는데, 정작 10주 강의 종료 후 강의 평가에는 “왜 수식을 넣었는지 이해가 된다, 그 수식들을 직관적으로 가르쳐 주려고 노력해서 고맙다, 열정적으로 가르쳐줘서 많이 배웠다” 등등의 평가들이 실려있더라. 모비아카데미 측 매니저도 풀코스 강좌 기준으로 강의 평가 점수가 굉장히 소개 더보기 배경 지식 vs. 배움의 열정[…]

데이터 사이언스 책 추천 (feat. 내 수업 평가)

데이터 사이언스 강의를 열고 한 달이 지났다. 시작전에 야심차게 만들어놨던 강의노트는 대부분 잉여 폴더에 들어가있고, 매주 새로 만드는 슬라이드가 엄청나게 늘었다. 내 사업하느라 바쁜데, 강의 노트 만드느라 이렇게 시간 쓰는게 도대체 무슨 욕심인가 싶기도 하지만, 필자만큼이나 공격적인 지인들의 애정 가득한 조언을 무조건 무시할 수는 없었다. 가까운 솔직한 지인들에 따르면, 이렇게 수학이 많이 들어가면 아무도 이해 소개 더보기 데이터 사이언스 책 추천 (feat. 내 수업 평가)[…]

딥러닝(Deep learning)을 R로 구현하기 – Prediction Model

일반에 딥러닝으로 알려져 있는 머신러닝 모델의 가장 기본이 바로 신경망(Neural Network) 모델이다. 다른 글에서 신경망 모델로 Sin(X) 그래프를 추적하는 예제를 하나 풀어봤었는데, 기본적으로 아래처럼 네트워크가 100% 꽉 들어차 있는 Fully Connected Neural Network 모델이 기본형이다. (Deep Neural Network, 일반에는 딥러닝으로 알려져 있다.) 여기서 몇 개의 노드(node)가 사라지는 경우, 또 넣었다 뺐다 하는 경우(Dropout 이라고 한다) 소개 더보기 딥러닝(Deep learning)을 R로 구현하기 – Prediction Model[…]

구글 애널리틱스 (Google Analytics)를 쓰다가

밥 먹고 사는 타이틀을 데이터 사이언티스트로 달고 난 이래 줄곧 온라인 유저 데이터를 보고 살아온 탓에 “중독”증상이 좀 있는 것 같다. 처음 이 웹페이지를 만들고 난 다음에 제일 먼저 했던 일이 예쁘게 꾸미는 테마 구하는게 아니라, 데이터 추적하는 구글 애널리틱스 (Google Analytics)를 설치하고, 필자의 IP 주소를 블랙리스트 시켜서 숫자 합산에 포함되지 않도록 하는 일이었다. (필자는 소개 더보기 구글 애널리틱스 (Google Analytics)를 쓰다가[…]

데이터 과학자가 갖춰야 할 5가지 스킬셋

데이터 사이언스, 데이터 과학, 데이터 과학자, 머신러닝, 딥러닝, R 주변에서 데이터 사이언티스트가 될려면 어떤 공부를 해야되는지 묻는 경우가 참 많다. 전에 다녔던 크리테오라는 프랑스 리타게팅 광고 회사의 세일즈 팀 사람들은 Data Analyst 와 Data Scientist가 무슨 차이가 있는지 잘 모르고 날 더러 그냥 데이터 팀 사람이라고 불렀고, 그 중 누구는 자기가 데이터 쪽으로 커리어를 전환하고 소개 더보기 데이터 과학자가 갖춰야 할 5가지 스킬셋[…]

머신러닝 초보자에게 바치는 5가지 “하지 마라” 시리즈

데이터 사이언스, 머신러닝, 빅데이터, 교재 데이터 사이언스 강의를 시작했다, 그 강의 중에 머신러닝도 많이 들어가있다고 소개를 했더니, 어떤 책을 사서 공부해야되냐고 묻는 사람, 그거할려면 개발 지식 필요하냐고 묻는 사람, 통계학 지식이 필요하냐고 묻는 사람 등등 다양한 종류의 질문을 받았다. 필자는 이렇게 대답하고 싶다. “일단 예제 하나 돌려보세요.” 언젠가 어느 개발자가 “친구가 R 공부하려고 하는데, 어떻게 소개 더보기 머신러닝 초보자에게 바치는 5가지 “하지 마라” 시리즈[…]

X