R과 Python을 같이 써 보자 – RPy2(1)

이전글 – 왜 Python 이 아니라 R로 강의하는거야?   귀국하고 지난 1년 반 남짓한 기간 동안 데이터 사이언티스트로 살면서 필자가 싸워(?)야했던 오해 중 가장 큰 두 개를 꼽자면,  빅데이터 = 용량만 많은 데이터 데이터 사이언티스트 = 공대 출신 개발자 라는 잘못된 이해들이었다. 수 십개의 블로그 포스팅도 빅데이터란 유저들의 행동데이터를 말하고, 데이터 사이언티스트는 그 행동데이터에서 패턴을 소개 더보기 R과 Python을 같이 써 보자 – RPy2(1)[…]

데이터 과학자가 갖춰야 할 5가지 스킬셋

데이터 사이언스, 데이터 과학, 데이터 과학자, 머신러닝, 딥러닝, R 주변에서 데이터 사이언티스트가 될려면 어떤 공부를 해야되는지 묻는 경우가 참 많다. 전에 다녔던 크리테오라는 프랑스 리타게팅 광고 회사의 세일즈 팀 사람들은 Data Analyst 와 Data Scientist가 무슨 차이가 있는지 잘 모르고 날 더러 그냥 데이터 팀 사람이라고 불렀고, 그 중 누구는 자기가 데이터 쪽으로 커리어를 전환하고 소개 더보기 데이터 과학자가 갖춰야 할 5가지 스킬셋[…]

머신러닝 초보자에게 바치는 5가지 “하지 마라” 시리즈

데이터 사이언스, 머신러닝, 빅데이터, 교재 데이터 사이언스 강의를 시작했다, 그 강의 중에 머신러닝도 많이 들어가있다고 소개를 했더니, 어떤 책을 사서 공부해야되냐고 묻는 사람, 그거할려면 개발 지식 필요하냐고 묻는 사람, 통계학 지식이 필요하냐고 묻는 사람 등등 다양한 종류의 질문을 받았다. 필자는 이렇게 대답하고 싶다. “일단 예제 하나 돌려보세요.” 언젠가 어느 개발자가 “친구가 R 공부하려고 하는데, 어떻게 소개 더보기 머신러닝 초보자에게 바치는 5가지 “하지 마라” 시리즈[…]

왜 Python이 아니라 R로 강의하는거야? – R w/ TensorFlow

실리콘밸리에서 데이터 사이언티스트라고 소개하면 (당연히 직장이 어딘지 물어보고 난 다음에) 어떤 프로그램을 쓰는지 물어본다. 필자가 처음 실리콘밸리에서 직장을 찾던 시절에는 R과 Matlab, SPSS같은 패키지를 댔었고, 회사가서 일을 하면서 Tableau 같은 Visualization tool을 어떻게 빅데이터 셋에 적용하는지 배웠다. 보통은 개발자 출신들이 Python으로 데이터 사이언스에 접근하고, 통계쪽 백그라운드 있는 사람들이 R로 데이터 사이언스에 접근하게 되는지라, R vs. 소개 더보기 왜 Python이 아니라 R로 강의하는거야? – R w/ TensorFlow[…]

X