머신러닝에 왜 통계학이 필수일까?

작년 (2017년) 이맘때로 기억한다. 어느 벤처 투자사 (Venture Capital)와 미팅을 하는데, 왜 머신러닝에 통계학이 필수적인지 잘 이해가 안 된다는 질문과, 머신러닝은 알아서 변수를 다 찾아주는 거라고 들었는데, 도대체 무슨 변수를 어떻게 찾아서 최적화를 한다는 건지 잘 이해를 못하겠다고 하더라. 그 중 한 명은 통계학을 꽤나 쓰는 학문으로 석사 유학을 다녀오신 분이고, 다른 한 분은 국내 소개 더보기 머신러닝에 왜 통계학이 필수일까?[…]

데이터 사이언스를 위한 수학&통계학 수업 후기

지난 9월로 기억한다. 모비 아카데미에서 데이터 사이언스 강의 한 사이클을 끝내던 무렵이었는데, 필자의 강의가 수학&통계학 요구 조건이 무겁고(?), 학생들 중에 준비가 안 된 경우가 많으니, 그 다음 사이클에는 번외 강의로 수학&통계학 수업을 짧게 개설하자고 요청이 왔다. 이런 사소한 걸로 돈을 받는다니… 라는 생각에 망설임이 있었지만, 필자도 영혼이 이탈한 표정인 수강생들을 대상으로 강의하고 싶질 않아, “이런거 소개 더보기 데이터 사이언스를 위한 수학&통계학 수업 후기[…]

통계학 모르는데 데이터 사이언스 독학할 수 있나요?

우연히 구글링 중에 재미있는 글을 하나 봤다. 문득, 필자가 뱅킹을 “때려”치우고 나와서 박사 유학 준비하던 시절이 떠오르더라. 경제학 전공자가 박사 유학 갈려면 학점이 좋아야하는게 아니라, 수학과 (수리)통계학 과목 학점이 좋아야한다. 진짜 좋은 학교 어드미션 받아서 유학 가는 친구들은 수학과 애들을 제치고 A+들을 수두룩하게 받았고, 그게 아니라면 수학과 통계학을 활용해서 경제학 논문을 잘 쓸 수 있는 소개 더보기 통계학 모르는데 데이터 사이언스 독학할 수 있나요?[…]

데이터 사이언스와 수학&통계학 (2)

철학자님이 수포자에 대한 필자의 글을 읽으셨는지, 또 재밌는 글들을 더 보내주셨다. 프랑스 철학자 루소의 “인간불평등 기원론”에 필적할 연구가 필요하다는 생각이 든다고 하시는데, 일단 아래의 인용문구를 먼저 소개한다. 최초의 좌절: 그대의 책임이 아니다. “태초에 폭력이 있었다. 그 폭력은 그 분이 수학을 창조하셨다는 것이다. 수학교육을 통해 열등감을 가진 80%를 만들어 그들을 저임금 근로자로 삼으라. 수학을 적당히 잘하는 소개 더보기 데이터 사이언스와 수학&통계학 (2)[…]

데이터 사이언스와 수학&통계학 (1)

2달 전 수업을 듣고가신 그 철학자님께서 가끔 재미난 글을 찾으시면 메일을 보내주신다. 필자와 핀트가 맞아서인지 (감히 철학자님께 핀트가 맞는다는 표현이 적절한지는 모르겠지만) 좋은 글들이 많은데, 어제는 요즘 필자의 관심사를 어떻게 알아내셨는지 “‘수포자’의 잘못된 원인 분석이 잘못된 해법을 부른다.”라는 글을 보내주셨다. 링크를 따라가면 꽤나 장문의 분석글을 읽을 수 있는데, 핵심 포인트를 두 개 잡아내면, “수학이 필요하지 소개 더보기 데이터 사이언스와 수학&통계학 (1)[…]

코드만 돌린다고 아냐, 모델이 어떻게 돌아가는지 알아야지

데이터 사이언스 강의 6주차 수업을 끝내고 수업 매니저분들, 학생분들과 이런저런 이야기를 나눴다. 제일 많이 들은 이야기는 역시 왜 이렇게 어렵냐, 첫 시간부터 알파고에 썼다던 Neural Network로 인공지능 적용하는거 한 두줄짜리 코드로 퐉~ 보여줄 줄 알았는데, 계속 통계학 수식만 나와서 괴롭다는 이야기였다. 공감한다 – 다른 글에 썼듯이 필자도 MIT에서 머신러닝 들을 때, 반 학기 동안 통계학 수업 잘못 들어온 줄 알았었다. 소개 더보기 코드만 돌린다고 아냐, 모델이 어떻게 돌아가는지 알아야지[…]

데이터 사이언스 괜찮은 강의들 리스트 1

데이터 사이언스는 데이터 분석도 아니고, 머신러닝도 아니고, 그렇다고 무턱대고 통계학도 아니다. 그럼 뭐냐고? 누가 필자에게 도대체 뭘 공부했길래 스스로를 데이터 사이언티스트라고 주장하냐고 물어보길래 반 페이지 남짓을 써 봤다가, 이건 너무 엉뚱한 소리인 것 같아서 부끄러운 마음에 글 전체를 쓱 지웠다. 데이터 사이언티스트가 뭘 하는지에 대한 이야기는 여러번 했는데, 그럼 뭘 배워야된다고 이야길 해야할까? 사실 여기에 소개 더보기 데이터 사이언스 괜찮은 강의들 리스트 1[…]

데이터 사이언스 ≠ 머신러닝

2000년대 초만해도 컴퓨터 공학에서 머신러닝 전공은 비주류였(다고 들었)다. 1980년대까지만해도 머신러닝에 대한 여러 투자가 있었으나, 당시 컴퓨팅 파워로는 우리가 지금 보고 있는 수준의 상품을 만들어 내는데 계산 비용 (Computational cost, 예. CPU 속도, 램, 시간, 필요 전력 등등)이 너무 많이 들었기 때문에 시장 수요도 적었고, 현실적인 제약을 본 박사생들이 연구 주제로 택하는 일도 드물었다. 다시말하면, 약 소개 더보기 데이터 사이언스 ≠ 머신러닝[…]

X