커리어 쌓기 in Data Science

국내에서 데이터 사이언티스트로 성장하고 싶으면 어떤 커리어를 밟아야할까에 대한 질문을 많이 받는다. 개발자들이 Data Engineer쪽 커리어를 밟거나, BI들이 Data Analyst쪽 커리어로 나가는 건 이미 여러번 이야기를 했는데, 정작 Data Scientist로 성장하기 위해 한국에서 어떤 커리어를 밟아야할까에 대한 고민을 깊게 해 본적은 없었던 것 같다. Engineer나 Analyst는 학부 출신들이 전공만 맞다면 충분히 도전할 수 있는 영역이기 소개 더보기 커리어 쌓기 in Data Science[…]

딥러닝의 비밀을 파헤치는 새로운 이론???

어느 블로그를 지나가다가 본 내용이다. Hebrew University of Jerusalem 출신 어느 교수가 딥러닝이 어떻게 작동하는지 설명하는 “새로운” 이론을 제시했단다. “Deep learning is an information bottleneck procedure that compresses noisy data as much as possible while preserving information about what the data represent.” 풀어서 설명하면, 여러개의 데이터를 압축시켜서 병의 좁은 목으로도 넣을 수 있도록 만드는데, 정작 그 소개 더보기 딥러닝의 비밀을 파헤치는 새로운 이론???[…]

수학이라는 장벽 for 4차 산업

외부 강의 요청이 있거나, 장문의 상담 이메일을 받거나, 책을 쓰자는 연락을 받고 미팅을 하면, 가장 먼저 물어보는 내용이 “어느 정도 수준의 수학”을 알아야 머신러닝을 이해할 수 있느냐다. 몇 번 말이 오가고 나면 이 분들이 왜 필자를 잡고 있는지 금방 눈치채게 된다. 필자가 문과 출신이기 때문이다. “수학”, “통계학”이 중요하다고 열심히 써 놨지만, “너는 경제학 출신이니 수학을 소개 더보기 수학이라는 장벽 for 4차 산업[…]

블록체인 커뮤니티의 도전

학부시절, 아니 박사까지 공부하면서 가장 좋아했고, 필자의 일상을 큰 틀에서 지배하는 수업을 딱 하나만 골라야한다면 게임이론을 고르고 싶다. 남들은 경제학 전공하면 돈 놀이하는 공부를 한다거나, 수요-공급 곡선 그려놓고 정신승리한다고 착각하시는데, 게임이론을 공부하고 그 툴을 이용해서 논문을 쓰다보면, 인간을 움직이게 하는 인센티브를 어떻게 구성한 “게임”을 만들 수 있을까, 더 나아가서는 시스템을 어떻게 구성해야 그 시스템이 간섭없이 소개 더보기 블록체인 커뮤니티의 도전[…]

데이터 사이언스 모델링이란? – Data Filtering

학부 3학년 때다. 경영학과 수업 중에 우리과 전공으로 인정되는 몇 안 되는 수업 중 하나인 재무관리 수업 첫 시간으로 기억한다. 기업들의 Financing이 기업 가치 평가, 경영 의사 결정에 어떤 영향을 미칠 수 있는지에 대한 내용을 다루는 수업이었는데, 고학년 거시경제학 수업에서 ABS로 리파이낸싱하는 부분을 이해하는데 도움되는 수업이라는 말을 듣고 큰 기대를 하고 수업에 들어갔다. 다른 과 소개 더보기 데이터 사이언스 모델링이란? – Data Filtering[…]

블록체인이 도입될 수 있는 업무

펀드매니저를 하고 있는 절친이 진지한 상담을 원한다면서 늦은 밤에 사무실로 찾아왔다. 요즘 4차산업 어쩌고 저쩌고에 블록체인이라고 말들이 많고, 머신러닝이 펀드매니저 업무를 대체하는 수준을 넘어서서 아예 코인이라는게 완전히 우리가 아는 금융 시스템을 바꿔놓을 것처럼 말들하는데, 진짜 그렇게 되냐고 걱정이 가득한 표정이었다. 여의도에서 소문만 듣고 주식사고 있는 애들은 좀 걱정하고 정신차려야 한다고 놀리고 싶은 욕구가 샘솟았지만, 그래도 소개 더보기 블록체인이 도입될 수 있는 업무[…]

진로 상담 in Data Science

학부 4학년 1학기 무렵으로 기억한다. 고교시절부터 오직 Finance에만 관심을 갖고, 언젠가는 한국에 IMF 구제금융 쇼크를 날린 유태계 자본들을 갖고노는 월가 최고의 거물이 되겠다던 부질없는 망상만 갖고 대학과 전공을 정해서 열심히 살던 시절이다. 3학년 때 한국고등교육재단 (SK그룹 산하)의 경제학 전공 장학생으로 선발되고, 그 학생들을 지도(?)해주셨던 경제학과 교수님께 진로 상담차 30분 정도만 시간을 내 주시면 안 되겠냐고 소개 더보기 진로 상담 in Data Science[…]

통계학자가 본 머신러닝

요즘 자주 듣는 표현 중에 필자의 귀를 매우 거스르는 표현들이 몇 가지 있다 빅데이터를 배운다 딥러닝을 배운다 빅데이터는 용량만 큰 데이터가 아니라 유저들의 행동을 초 단위로 추적한 데이터라고 이미 여러번 포스팅을 했다. 딥러닝도 머신러닝의 Neural net 모델 중 layer의 숫자가 좀 많은 모델들을 부르는 이름이라는 것도 같은 맥락에서 여러번 언급을 했었다. 말을 바꾸면 빅데이터와 딥러닝은 소개 더보기 통계학자가 본 머신러닝[…]

인공지능 – DQN, I2A, AGI, Brain Initiative

“인공지능”이라는 단어를 들으면 제일 먼저 떠오르는 그림은 무엇인가? 알파고? 로봇이 통치하는 세상? 매트릭스 속에서 건전지로 바뀐 인간? 아마 10년전만해도 인공지능이라는 단어와 함께 연관 검색어가 될 만한 단어는 “자동화”였을 것이다. 물레방아부터 증기기관까지 근세까지 인류의 목표는 인간의 노동력을 대체할 수 있도록 자연의 힘을 인간의 목적에 맞게 활용하는 것이었다고해도 과언이 아니다. 다만 최근까지의 자동화 시스템은 인간의 “사고”를 복제한 소개 더보기 인공지능 – DQN, I2A, AGI, Brain Initiative[…]

머신러닝에 왜 통계학이 필수일까?

작년 (2017년) 이맘때로 기억한다. 어느 벤처 투자사 (Venture Capital)와 미팅을 하는데, 왜 머신러닝에 통계학이 필수적인지 잘 이해가 안 된다는 질문과, 머신러닝은 알아서 변수를 다 찾아주는 거라고 들었는데, 도대체 무슨 변수를 어떻게 찾아서 최적화를 한다는 건지 잘 이해를 못하겠다고 하더라. 그 중 한 명은 통계학을 꽤나 쓰는 학문으로 석사 유학을 다녀오신 분이고, 다른 한 분은 국내 소개 더보기 머신러닝에 왜 통계학이 필수일까?[…]

머신러닝 교육 포기하고 외주업체를 써야하는 이유

가끔 출장 교육(?)이 가능하냐는 연락을 받는다. 거의 대부분은 일언지하에 거절한다. 그런 보따리 강사하려고 이 강의를 시작한게 아니라, 실력없는 사람들의 3류 강의, 직접 데이터 다뤄본 적이 없는 교수들의 책 속에만 파묻힌 강의에 분노해서, 시장이 좀 교육이 되었으면 하는 기대를 갖고 남는 시간을 활용해서 하는 강의인데, 폰돈 몇 푼 쥐어주면서 “이 강의를 듣고 나면 우리 회사 사람들이 소개 더보기 머신러닝 교육 포기하고 외주업체를 써야하는 이유[…]

머신러닝 다루는 컴퓨터공학과, 통계학과 수업들

수업에 찾아오는 공대생들이 매번 넋나간 표정으로 앉아있는 것 같아서, 도대체 우리나라 공대들은 어떤걸 가르치길래 문과인 경제학과 출신도 따라오는 수학&통계학도 이해 못해서 쩔쩔매고, 학부 수업에 머신러닝 관련된 전공 수업이 얼마나 없길래 외부에 저렇게 학원들이 많이 생기는지 궁금해졌다. 우리학교 컴공과 웹페이지에 교과목 정보 리스트를 쭈욱~ 훑어봤는데, 필요한 수업들 다 있는데? (Source: 인스티즈) 학부 아니고 대학원이라구요? 음… 대학원 말고, 소개 더보기 머신러닝 다루는 컴퓨터공학과, 통계학과 수업들[…]

작정하고 쓰는 머신러닝 강의 비판 (2)

필자는 학부 때부터 경영학과를 무시했다. 왜? 수학 안 하니까. 실험도 안 하고. 그래놓고 영어 약자만 읊어대니까. 필자의 학부시절, 총장으로 계시던 정운찬 교수님이 학부 교육 과정에서 깊이를 찾을 수 없는 경영학과를 없애고, 행정학과처럼 대학원 과정만 남기려고 하셨다. 실제로 미국의 거의 대부분의 학교들에도 학부에 경영학과 과정이 없기도 하다. 당시 컨펌되지 않은 소문에 따르면 경영학과 모 교수님이 바닥에 소개 더보기 작정하고 쓰는 머신러닝 강의 비판 (2)[…]

작정하고 쓰는 머신러닝 강의 수강생 비판 (feat. 꼰대)

필자의 수업 타이틀인 “데이터 사이언스”라는 이름을 처음 듣게 되는 경로는 아마도 알파고, 인공지능 같은 Buzzword 였을 것이고, 그 다음으로 좀 관심이 있어서 검색을 하면, 딥러닝이라는 단어, 같이 검색되는 머신러닝이라는 단어를 만나고, 그리고나서야 데이터 사이언스라는 단어를 만날 것이라고 생각한다. 정작 데이터 사이언스가 가장 포괄적인 개념이고, 머신러닝은 특정한 데이터의 패턴을 찾아주는 응용통계학이고, 딥러닝은 그 중에서 좀 계산비용이 소개 더보기 작정하고 쓰는 머신러닝 강의 수강생 비판 (feat. 꼰대)[…]

R과 Python을 같이 써 보자 – RPy2(1)

이전글 – 왜 Python 이 아니라 R로 강의하는거야?   귀국하고 지난 1년 반 남짓한 기간 동안 데이터 사이언티스트로 살면서 필자가 싸워(?)야했던 오해 중 가장 큰 두 개를 꼽자면,  빅데이터 = 용량만 많은 데이터 데이터 사이언티스트 = 공대 출신 개발자 라는 잘못된 이해들이었다. 수 십개의 블로그 포스팅도 빅데이터란 유저들의 행동데이터를 말하고, 데이터 사이언티스트는 그 행동데이터에서 패턴을 소개 더보기 R과 Python을 같이 써 보자 – RPy2(1)[…]

X