앤그램 썸네일형 리스트형 N-Gram 댓글 분석 │R 한글 텍스트 마이닝 │어린이 자외선 차단제 선크림 N-Gram은 말 그대로 N개의 연속적인 단어들의 나열을 뜻합니다. 코퍼스에서 N개의 단어로 나누고 이를 하나의 토큰으로 간주합니다. 여기서 N이 한 개 일 때는 유니그램(unigram), 두 개일 때는 바이그램(bigram, 세 개일 때는 트라이그램(trigram)이라고 하는데요. 이번 포스팅에서는 어린이 자외선 차단제 댓글들을 이용하여 N-Gram 분석 방법과 결과를 각각 정리하여 공유하겠습니다. 물론 분석에 이용한 댓글들과 R 한글 텍스트 마이닝 코드는 포스팅 하단에 업로드해 두었습니다. 관심 있는 분들은 각각 내려받은 후, 순서대로 따라 해 보시기 바랍니다. 어린이 자외선 차단제 선크림 선블록│댓글 분석 │LDA 토픽 모델링 │R 한글 텍스트 마이닝지난 포스팅에서는 어린이 자외선 차단제 댓글들을.. 더보기 이전 1 다음