데이터 사이언스 블로그

데이터 사이언스, 머신러닝, 빅데이터 분석, 시뮬레이션

블록체인이 도입될 수 있는 업무

펀드매니저를 하고 있는 절친이 진지한 상담을 원한다면서 늦은 밤에 사무실로 찾아왔다. 요즘 4차산업 어쩌고 저쩌고에 블록체인이라고 말들이 많고, 머신러닝이 펀드매니저 업무를 대체하는 수준을 넘어서서 아예 코인이라는게 완전히 우리가 아는 금융 시스템을 바꿔놓을 것처럼 말들하는데, 진짜 그렇게 되냐고 걱정이 가득한 표정이었다. 여의도에서 소문만 듣고 주식사고 있는 애들은 좀 걱정하고 정신차려야 한다고 놀리고 싶은 욕구가 샘솟았지만, 그래도 소개 더보기 블록체인이 도입될 수 있는 업무[…]

진로 상담 in Data Science

학부 4학년 1학기 무렵으로 기억한다. 고교시절부터 오직 Finance에만 관심을 갖고, 언젠가는 한국에 IMF 구제금융 쇼크를 날린 유태계 자본들을 갖고노는 월가 최고의 거물이 되겠다던 부질없는 망상만 갖고 대학과 전공을 정해서 열심히 살던 시절이다. 3학년 때 한국고등교육재단 (SK그룹 산하)의 경제학 전공 장학생으로 선발되고, 그 학생들을 지도(?)해주셨던 경제학과 교수님께 진로 상담차 30분 정도만 시간을 내 주시면 안 되겠냐고 소개 더보기 진로 상담 in Data Science[…]

통계학자가 본 머신러닝

요즘 자주 듣는 표현 중에 필자의 귀를 매우 거스르는 표현들이 몇 가지 있다 빅데이터를 배운다 딥러닝을 배운다 빅데이터는 용량만 큰 데이터가 아니라 유저들의 행동을 초 단위로 추적한 데이터라고 이미 여러번 포스팅을 했다. 딥러닝도 머신러닝의 Neural net 모델 중 layer의 숫자가 좀 많은 모델들을 부르는 이름이라는 것도 같은 맥락에서 여러번 언급을 했었다. 말을 바꾸면 빅데이터와 딥러닝은 소개 더보기 통계학자가 본 머신러닝[…]

인공지능 – DQN, I2A, AGI, Brain Initiative

“인공지능”이라는 단어를 들으면 제일 먼저 떠오르는 그림은 무엇인가? 알파고? 로봇이 통치하는 세상? 매트릭스 속에서 건전지로 바뀐 인간? 아마 10년전만해도 인공지능이라는 단어와 함께 연관 검색어가 될 만한 단어는 “자동화”였을 것이다. 물레방아부터 증기기관까지 근세까지 인류의 목표는 인간의 노동력을 대체할 수 있도록 자연의 힘을 인간의 목적에 맞게 활용하는 것이었다고해도 과언이 아니다. 다만 최근까지의 자동화 시스템은 인간의 “사고”를 복제한 소개 더보기 인공지능 – DQN, I2A, AGI, Brain Initiative[…]

머신러닝에 왜 통계학이 필수일까?

작년 (2017년) 이맘때로 기억한다. 어느 벤처 투자사 (Venture Capital)와 미팅을 하는데, 왜 머신러닝에 통계학이 필수적인지 잘 이해가 안 된다는 질문과, 머신러닝은 알아서 변수를 다 찾아주는 거라고 들었는데, 도대체 무슨 변수를 어떻게 찾아서 최적화를 한다는 건지 잘 이해를 못하겠다고 하더라. 그 중 한 명은 통계학을 꽤나 쓰는 학문으로 석사 유학을 다녀오신 분이고, 다른 한 분은 국내 소개 더보기 머신러닝에 왜 통계학이 필수일까?[…]

머신러닝 교육 포기하고 외주업체를 써야하는 이유

가끔 출장 교육(?)이 가능하냐는 연락을 받는다. 거의 대부분은 일언지하에 거절한다. 그런 보따리 강사하려고 이 강의를 시작한게 아니라, 실력없는 사람들의 3류 강의, 직접 데이터 다뤄본 적이 없는 교수들의 책 속에만 파묻힌 강의에 분노해서, 시장이 좀 교육이 되었으면 하는 기대를 갖고 남는 시간을 활용해서 하는 강의인데, 폰돈 몇 푼 쥐어주면서 “이 강의를 듣고 나면 우리 회사 사람들이 소개 더보기 머신러닝 교육 포기하고 외주업체를 써야하는 이유[…]

머신러닝 다루는 컴퓨터공학과, 통계학과 수업들

수업에 찾아오는 공대생들이 매번 넋나간 표정으로 앉아있는 것 같아서, 도대체 우리나라 공대들은 어떤걸 가르치길래 문과인 경제학과 출신도 따라오는 수학&통계학도 이해 못해서 쩔쩔매고, 학부 수업에 머신러닝 관련된 전공 수업이 얼마나 없길래 외부에 저렇게 학원들이 많이 생기는지 궁금해졌다. 우리학교 컴공과 웹페이지에 교과목 정보 리스트를 쭈욱~ 훑어봤는데, 필요한 수업들 다 있는데? (Source: 인스티즈) 학부 아니고 대학원이라구요? 음… 대학원 말고, 소개 더보기 머신러닝 다루는 컴퓨터공학과, 통계학과 수업들[…]

작정하고 쓰는 머신러닝 강의 비판 (2)

필자는 학부 때부터 경영학과를 무시했다. 왜? 수학 안 하니까. 실험도 안 하고. 그래놓고 영어 약자만 읊어대니까. 필자의 학부시절, 총장으로 계시던 정운찬 교수님이 학부 교육 과정에서 깊이를 찾을 수 없는 경영학과를 없애고, 행정학과처럼 대학원 과정만 남기려고 하셨다. 실제로 미국의 거의 대부분의 학교들에도 학부에 경영학과 과정이 없기도 하다. 당시 컨펌되지 않은 소문에 따르면 경영학과 모 교수님이 바닥에 소개 더보기 작정하고 쓰는 머신러닝 강의 비판 (2)[…]

작정하고 쓰는 머신러닝 강의 수강생 비판 (feat. 꼰대)

필자의 수업 타이틀인 “데이터 사이언스”라는 이름을 처음 듣게 되는 경로는 아마도 알파고, 인공지능 같은 Buzzword 였을 것이고, 그 다음으로 좀 관심이 있어서 검색을 하면, 딥러닝이라는 단어, 같이 검색되는 머신러닝이라는 단어를 만나고, 그리고나서야 데이터 사이언스라는 단어를 만날 것이라고 생각한다. 정작 데이터 사이언스가 가장 포괄적인 개념이고, 머신러닝은 특정한 데이터의 패턴을 찾아주는 응용통계학이고, 딥러닝은 그 중에서 좀 계산비용이 소개 더보기 작정하고 쓰는 머신러닝 강의 수강생 비판 (feat. 꼰대)[…]

R과 Python을 같이 써 보자 – RPy2(1)

이전글 – 왜 Python 이 아니라 R로 강의하는거야?   귀국하고 지난 1년 반 남짓한 기간 동안 데이터 사이언티스트로 살면서 필자가 싸워(?)야했던 오해 중 가장 큰 두 개를 꼽자면,  빅데이터 = 용량만 많은 데이터 데이터 사이언티스트 = 공대 출신 개발자 라는 잘못된 이해들이었다. 수 십개의 블로그 포스팅도 빅데이터란 유저들의 행동데이터를 말하고, 데이터 사이언티스트는 그 행동데이터에서 패턴을 소개 더보기 R과 Python을 같이 써 보자 – RPy2(1)[…]

데이터 사이언스와 게임이론

데이터 사이언스라는 업무가 결국은 빅데이터가 있는 곳에서만 유의미한 탓에, IT업계 정도만 진짜 빅데이터를 갖고 뭔가 여러가지 시도를 하고 있는 것을 본다. 얼마 전까지만해도 한국의 IT회사들 대부분이 이미지 인식이나 음성 인식같은 기초적인 데이터 사이언스 업무에만 관심을 갖고, Noise가 더 많은 데이터를 처리 or 가공하려는 시도는 안 하는 통에 많은 경우에 공대 출신 개발자들에 대한 수요만 많은 소개 더보기 데이터 사이언스와 게임이론[…]

머신러닝과 블록체인

이전 글: 데이터 사이언스와 비트코인 필자의 박사 논문은 은행 네트워크에 외부 충격이 와서 1 or 2개 은행이 그 직격탄을 맞고 (예시. 2008년 Bear Sterns와 Lehman Brothers), 그 때 파산하는 은행과 직접 금융거래로 묶여 있던 다른 은행들이 그 충격을 어떻게 흡수하고, 은행 네트워크 속에서 간접적인 영향을 받는 다른 제3, 제4의 은행들이 그 충격을 어떻게 피할까, 그런 소개 더보기 머신러닝과 블록체인[…]

인과관계 vs. 상관관계 – Granger causality

데이터 사이언스 강의를 하다보면, 통계학이 뭐가 중요하냐고, 그냥 “빅”데이터 전부를 “딥”러닝 모델에 다 집어넣으면 알아서 답 가르쳐주는거 아니냐고, 왜 자꾸 고등학교 이후로 보지도 않은 수학 이야기하면서 수업을 진행하냐고 불편한 기색을 못 감추는 분들이 있다. 아무 변수나 막 집어넣는 걸 피하려고 여러가지 작업을 해 놓은 현업 머신러닝 적용 논문 (“합리적으로 변수 추출하기” 참조)을 소개시켜줘도 그런 말씀을 하시는 소개 더보기 인과관계 vs. 상관관계 – Granger causality[…]

비전문가들도 데이터 사이언스를 공부해야하는 이유?

학부시절, 아니 대학원 재학 시절에도 마찬가지였는데, 필자의 전공 교수님들이 대체로 보면 굉장히 까칠하다. 어릴 땐 나름대로 상처가 된 적도 있었는데, 대학원 들어가는 준비하면서 좀 이해가 되는 느낌을 받았고, 박사 재학 중에는 필자도 그런 “괴물”이 되어가는 걸 느꼈다. (사실 원래도 좀 까칠하다 ㅋㅋ) 요즘와서는 학창시절 불편하게 생각했던 교수님들의 모습을 그대로 닮아버린게 아닐까 싶어서 가끔 뜨끔할 때가 소개 더보기 비전문가들도 데이터 사이언스를 공부해야하는 이유?[…]

딥러닝 최적화된 그래픽 카드

이전 글 몇 달전의 일이다. 2016년에 구매했던 ThinkPad T460p 을 중고로 팔았다. 참고로 필자는 “빨콩 매니악”이기 때문에 “빨콩”이 달린 ThinkPad 노트북만 쓰고, 직업적인 이유로 퍼포먼스가 강조된 매우 고사양 노트북 위주로 구매한다. 필자가 쓰던 ThinkPad T460p는 말 그대로 “끝판왕” 모델이었는데, i7-6820HQ에 DDR4램 32GB, 그리고 그래픽 카드가 ThinkPad 14인치 이하 모델 중 제일 좋은 GeForce 940MX + 소개 더보기 딥러닝 최적화된 그래픽 카드[…]

X