본문 바로가기

R 한글 텍스트 마이닝

동시 출현 네트워크 분석 │귀멸의 칼날 │의미망 분석 │네이버 영화평 지난 포스팅에 이어서 귀멸의 칼날 네이버 영화평에 대한 의미망 분석을 추가해보겠습니다. 관련 내용은 지난 포스팅에서 언급한 바 있습니다만, 추가로 동시 출현 네트워크 분석을 시도해보겠습니다. 1. 데이터 전처리 이전 지난 포스팅에서 자세히 이야기하지는 않았으나, 아래 그림에서도 확인 가능하듯이 텍스트 데이터들의 전처리가 필요합니다. 데이터를 정제하는 작업은 한 번에 끝나지 않습니다. 특히 제 경험치에 비춰보면 한글 텍스트 마이닝은 데이터 정제 작업에 많은 시간이 소요됩니다. 2. 1차 전처리 이후 다음 그림은 1차 전처리 이후 결과를 워드클라우드2 패키지를 이용하여 구현한 결과입니다. 데이터 정제 작업이 더 추가 필요할 것으로 생각됩니다만, 이번 포스팅은 예시 자료이므로 데이터 정제 작업은 이 정도에서 .. 더보기
귀멸의 칼날 : 무한열차편 │감성분석 │네이버 영화 │R 텍스트 마이닝 극장판 귀멸의 칼날(무한열차편) 네이버 영화평 5,044개를 웹크롤링한 후, 감성분석 텍스트 마이닝을 실행해보겠습니다. 분석도구는 R 4.0.2입니다. 감성 분석 전에 아래 포스팅 참조하여 한글 텍스트 마이닝을 위한 KoNLP 패키지를 설치하기 바랍니다. 2021.05.21 - [교육] - R 4.0. 이상 KoNLP 설치순서 │KoNLP 설치 오류 해결 │한글 텍스트 마이닝 R 4.0. 이상 KoNLP 설치순서 │KoNLP 설치 오류 해결 │한글 텍스트 마이닝 R이 4.0 이상에서 한글 텍스트 마이닝을 위한 KoNLP 설치와 활용이 어려워졌습니다. 아래와 같은 순서대로 설치하고, 3. java, rjava 설치 이하 R code 는 R의 콘솔창에 그대로 붙여넣기만 하면 됩니다. e-datanews.ti.. 더보기
KoNLP 설치 순서 │2023년 9월 업데이트 │scala-library-2.11.8.jar 오류 해결 방법 │R 4.3.1 (Window 11 기준) R에서 한글 텍스트 마이닝 분석을 실행하기 위해서는 JAVA와 KoNLP 패키지를 설치해야 합니다. 포스팅을 업데이트하는 현재 날짜는 2023년 9월 19일입니다. 오늘 기준 R 최근 버전은 4.3.1이며, 해당 버전을 기준으로 윈도 11에서 KoNLP 설치 순서와 'scala-library-2.11.8.jar' 오류 해결 방법을 정리하고, 오류 수정 후, 형태소 분석 결과까지 확인해 보겠습니다. 1. JAVA 설치 먼저 JAVA를 설치하겠습니다. 다음 이미지를 클릭하여 다운로드 페이지로 이동합니다. 그리고 Windows-offline(64-bit) 클릭하여 내 컴퓨터로 내려받기를 완료합니다. 2. R 4.3.1 내려받기 KoNLP 설치를 위해 작성일 현재 가장 최근 버전인 R 4.3.1을 내려받습니다... 더보기