R과 Python을 같이 써 보자 – RPy2(1)

이전글 – 왜 Python 이 아니라 R로 강의하는거야?   귀국하고 지난 1년 반 남짓한 기간 동안 데이터 사이언티스트로 살면서 필자가 싸워(?)야했던 오해 중 가장 큰 두 개를 꼽자면,  빅데이터 = 용량만 많은 데이터 데이터 사이언티스트 = 공대 출신 개발자 라는 잘못된 이해들이었다. 수 십개의 블로그 포스팅도 빅데이터란 유저들의 행동데이터를 말하고, 데이터 사이언티스트는 그 행동데이터에서 패턴을 소개 더보기 R과 Python을 같이 써 보자 – RPy2(1)[…]

데이터 사이언스와 게임이론

데이터 사이언스라는 업무가 결국은 빅데이터가 있는 곳에서만 유의미한 탓에, IT업계 정도만 진짜 빅데이터를 갖고 뭔가 여러가지 시도를 하고 있는 것을 본다. 얼마 전까지만해도 한국의 IT회사들 대부분이 이미지 인식이나 음성 인식같은 기초적인 데이터 사이언스 업무에만 관심을 갖고, Noise가 더 많은 데이터를 처리 or 가공하려는 시도는 안 하는 통에 많은 경우에 공대 출신 개발자들에 대한 수요만 많은 소개 더보기 데이터 사이언스와 게임이론[…]

머신러닝과 블록체인

이전 글: 데이터 사이언스와 비트코인 필자의 박사 논문은 은행 네트워크에 외부 충격이 와서 1 or 2개 은행이 그 직격탄을 맞고 (예시. 2008년 Bear Sterns와 Lehman Brothers), 그 때 파산하는 은행과 직접 금융거래로 묶여 있던 다른 은행들이 그 충격을 어떻게 흡수하고, 은행 네트워크 속에서 간접적인 영향을 받는 다른 제3, 제4의 은행들이 그 충격을 어떻게 피할까, 그런 소개 더보기 머신러닝과 블록체인[…]

인과관계 vs. 상관관계 – Granger causality

데이터 사이언스 강의를 하다보면, 통계학이 뭐가 중요하냐고, 그냥 “빅”데이터 전부를 “딥”러닝 모델에 다 집어넣으면 알아서 답 가르쳐주는거 아니냐고, 왜 자꾸 고등학교 이후로 보지도 않은 수학 이야기하면서 수업을 진행하냐고 불편한 기색을 못 감추는 분들이 있다. 아무 변수나 막 집어넣는 걸 피하려고 여러가지 작업을 해 놓은 현업 머신러닝 적용 논문 (“합리적으로 변수 추출하기” 참조)을 소개시켜줘도 그런 말씀을 하시는 소개 더보기 인과관계 vs. 상관관계 – Granger causality[…]

비전문가들도 데이터 사이언스를 공부해야하는 이유?

학부시절, 아니 대학원 재학 시절에도 마찬가지였는데, 필자의 전공 교수님들이 대체로 보면 굉장히 까칠하다. 어릴 땐 나름대로 상처가 된 적도 있었는데, 대학원 들어가는 준비하면서 좀 이해가 되는 느낌을 받았고, 박사 재학 중에는 필자도 그런 “괴물”이 되어가는 걸 느꼈다. (사실 원래도 좀 까칠하다 ㅋㅋ) 요즘와서는 학창시절 불편하게 생각했던 교수님들의 모습을 그대로 닮아버린게 아닐까 싶어서 가끔 뜨끔할 때가 소개 더보기 비전문가들도 데이터 사이언스를 공부해야하는 이유?[…]

X