잠재 디리클레 할당 썸네일형 리스트형 어린이 자외선 차단제│댓글 분석│LDA 토픽 모델링│한글 텍스트 마이닝 지난 포스팅에서는 어린이 자외선 차단제 댓글들을 이용하여 품사분석, 전처리 그리고 빈도분석까지 실행해 보았습니다. 이번 포스팅에서는 이어서 잠재 디리클레 할당(Latent Dirichlet Allocation, 이하 LDA) 기반의 토픽 모델링 분석 결과와 R 코딩을 공유하겠습니다. 분석 절차와 내용을 간단히 설명하면, 다음과 같습니다. 첫째 토픽 모델링 분석을 위한 R 패키지인 topicmodels을 추가 설치한 후, 명사만 추출하여 Document Term Matrix(이하 DTM)을 생성합니다. 둘째, 임의로 토픽 수를 5개로 설정한 후, 토픽 모델링 분석 결과를 제시합니다. 셋째, ldatuning R 패키지를 추가 설치한 후, 최적의 토픽 수를 결정합니다. 넷째, 최적의 토픽 수 기반의 새로운 .. 더보기 이전 1 다음