R과 Python을 같이 써 보자 – RPy2(1)

이전글 – 왜 Python 이 아니라 R로 강의하는거야?   귀국하고 지난 1년 반 남짓한 기간 동안 데이터 사이언티스트로 살면서 필자가 싸워(?)야했던 오해 중 가장 큰 두 개를 꼽자면,  빅데이터 = 용량만 많은 데이터 데이터 사이언티스트 = 공대 출신 개발자 라는 잘못된 이해들이었다. 수 십개의 블로그 포스팅도 빅데이터란 유저들의 행동데이터를 말하고, 데이터 사이언티스트는 그 행동데이터에서 패턴을 소개 더보기 R과 Python을 같이 써 보자 – RPy2(1)[…]

딥러닝(Deep learning)을 R로 구현하기 – Prediction Model

일반에 딥러닝으로 알려져 있는 머신러닝 모델의 가장 기본이 바로 신경망(Neural Network) 모델이다. 다른 글에서 신경망 모델로 Sin(X) 그래프를 추적하는 예제를 하나 풀어봤었는데, 기본적으로 아래처럼 네트워크가 100% 꽉 들어차 있는 Fully Connected Neural Network 모델이 기본형이다. (Deep Neural Network, 일반에는 딥러닝으로 알려져 있다.) 여기서 몇 개의 노드(node)가 사라지는 경우, 또 넣었다 뺐다 하는 경우(Dropout 이라고 한다) 소개 더보기 딥러닝(Deep learning)을 R로 구현하기 – Prediction Model[…]

데이터 과학자가 갖춰야 할 5가지 스킬셋

데이터 사이언스, 데이터 과학, 데이터 과학자, 머신러닝, 딥러닝, R 주변에서 데이터 사이언티스트가 될려면 어떤 공부를 해야되는지 묻는 경우가 참 많다. 전에 다녔던 크리테오라는 프랑스 리타게팅 광고 회사의 세일즈 팀 사람들은 Data Analyst 와 Data Scientist가 무슨 차이가 있는지 잘 모르고 날 더러 그냥 데이터 팀 사람이라고 불렀고, 그 중 누구는 자기가 데이터 쪽으로 커리어를 전환하고 소개 더보기 데이터 과학자가 갖춰야 할 5가지 스킬셋[…]

머신러닝 초보자에게 바치는 5가지 “하지 마라” 시리즈

데이터 사이언스, 머신러닝, 빅데이터, 교재 데이터 사이언스 강의를 시작했다, 그 강의 중에 머신러닝도 많이 들어가있다고 소개를 했더니, 어떤 책을 사서 공부해야되냐고 묻는 사람, 그거할려면 개발 지식 필요하냐고 묻는 사람, 통계학 지식이 필요하냐고 묻는 사람 등등 다양한 종류의 질문을 받았다. 필자는 이렇게 대답하고 싶다. “일단 예제 하나 돌려보세요.” 언젠가 어느 개발자가 “친구가 R 공부하려고 하는데, 어떻게 소개 더보기 머신러닝 초보자에게 바치는 5가지 “하지 마라” 시리즈[…]

머신러닝 언어처리 – R로 WordCloud 만들어보기

머신러닝에서 가장 고난이도 작업이 언어 처리고 그 중에서도 더 고난이도 작업이 자연어 처리다.  언어처리를 제대로 하기 위해서 한국말 같이 조사가 많이 들어가는 언어는 조사와 명사, 동사를 구분해내야하고, 또 어떤 쓰임새로 쓰였는지도 모델 내에서 소화해야한다. 여기서 자연어 처리로 한 단계 더 넘어가면, 이 단어가 이 문장에서 단어 그대로의 의미로 쓰였는지, 아니면 비꼬는 표현인지도 알아내야하고, 결국 문맥이라는 소개 더보기 머신러닝 언어처리 – R로 WordCloud 만들어보기[…]

왜 Python이 아니라 R로 강의하는거야? – R w/ TensorFlow

실리콘밸리에서 데이터 사이언티스트라고 소개하면 (당연히 직장이 어딘지 물어보고 난 다음에) 어떤 프로그램을 쓰는지 물어본다. 필자가 처음 실리콘밸리에서 직장을 찾던 시절에는 R과 Matlab, SPSS같은 패키지를 댔었고, 회사가서 일을 하면서 Tableau 같은 Visualization tool을 어떻게 빅데이터 셋에 적용하는지 배웠다. 보통은 개발자 출신들이 Python으로 데이터 사이언스에 접근하고, 통계쪽 백그라운드 있는 사람들이 R로 데이터 사이언스에 접근하게 되는지라, R vs. 소개 더보기 왜 Python이 아니라 R로 강의하는거야? – R w/ TensorFlow[…]

X