머신러닝 언어처리 – R로 WordCloud 만들어보기

머신러닝에서 가장 고난이도 작업이 언어 처리고 그 중에서도 더 고난이도 작업이 자연어 처리다.  언어처리를 제대로 하기 위해서 한국말 같이 조사가 많이 들어가는 언어는 조사와 명사, 동사를 구분해내야하고, 또 어떤 쓰임새로 쓰였는지도 모델 내에서 소화해야한다. 여기서 자연어 처리로 한 단계 더 넘어가면, 이 단어가 이 문장에서 단어 그대로의 의미로 쓰였는지, 아니면 비꼬는 표현인지도 알아내야하고, 결국 문맥이라는 소개 더보기 머신러닝 언어처리 – R로 WordCloud 만들어보기[…]

X