막대 그래프 썸네일형 리스트형 N-Gram 댓글 분석 │R 한글 텍스트 마이닝 │어린이 자외선 차단제 선크림 N-Gram은 말 그대로 N개의 연속적인 단어들의 나열을 뜻합니다. 코퍼스에서 N개의 단어로 나누고 이를 하나의 토큰으로 간주합니다. 여기서 N이 한 개 일 때는 유니그램(unigram), 두 개일 때는 바이그램(bigram, 세 개일 때는 트라이그램(trigram)이라고 하는데요. 이번 포스팅에서는 어린이 자외선 차단제 댓글들을 이용하여 N-Gram 분석 방법과 결과를 각각 정리하여 공유하겠습니다. 물론 분석에 이용한 댓글들과 R 한글 텍스트 마이닝 코드는 포스팅 하단에 업로드해 두었습니다. 관심 있는 분들은 각각 내려받은 후, 순서대로 따라 해 보시기 바랍니다. 어린이 자외선 차단제 선크림 선블록│댓글 분석 │LDA 토픽 모델링 │R 한글 텍스트 마이닝지난 포스팅에서는 어린이 자외선 차단제 댓글들을.. 더보기 R 한글 텍스트 마이닝 (1) │네이버 생성형 AI 큐 국내 보도자료 분석│엑셀 데이터 호출 및 빈도분석 시각화 지난 포스팅에서 한글 텍스트 마이닝 분석을 위한 KoNLP 설치하는 방법까지 설명하였습니다. 이어서 테스트도 할 겸 엑셀의 텍스트 데이터를 호출하고, 빈도 분석까지 간단히 정리해 보겠습니다. 예제 데이터는 9월 20일 출시된 네이버의 생성형 AI 서비스인 큐에 대한 국내 보도자료이며, 이 중 제목과 키워드를 이용합니다. KoNLP 설치 순서 │scala-library-2.11.8.jar 오류 해결 방법 │R 4.3.1 (Window 11 기준)R에서 한글 텍스트 마이닝 분석을 실행하기 위해서는 JAVA와 KoNLP 패키지를 설치해야 합니다. 포스팅을 업데이트하는 현재 날짜는 2023년 9월 19일입니다. 오늘 기준 R 최근 버전은 4.3.1이며, 해당 버e-datanews.tistory.com 1. 데.. 더보기 이전 1 다음