본문 바로가기

교육

귀멸의 칼날 : 무한열차편 │감성분석 │네이버 영화 │R 텍스트 마이닝

극장판 귀멸의 칼날(무한열차편) 네이버 영화평 5,044개를 웹크롤링한 후, 감성분석 텍스트 마이닝을 실행해보겠습니다. 분석도구는 R 4.0.2입니다. 감성 분석 전에 아래 포스팅 참조하여 한글 텍스트 마이닝을 위한 KoNLP 패키지를 설치하기 바랍니다. 

 

R 4.0. 이상 KoNLP 설치순서 │KoNLP 설치 오류 해결 │한글 텍스트 마이닝

R이 4.0 이상에서 한글 텍스트 마이닝을 위한 KoNLP 설치와 활용이 어려워졌습니다. 아래와 같은 순서대로 설치하고, 3. java, rjava 설치 이하 R code 는 R의 콘솔창에 그대로 붙여넣기만 하면 됩니다.

e-datanews.tistory.com

 

댓글 마케팅 분석 활용 : 퍼플렉시티 AI와 클로드 3.5 소네트 비교

소비자, 이용자 반응인 댓글 분석 결과는 마케팅 측면에서 시사하는 바가 큽니다. 이번 포스팅에서는 웹스크래핑된 댓글들을 퍼플렉시티 AI와 클로드 3.5 소네트의 파일 첨부 기능을 활용하여 업

e-datanews.tistory.com

 

1. 분석대상 

귀멸의 칼날 영화 포스터
극장판 귀멸의 칼날 : 무한궤도편


극장판 귀멸의 칼날 : 무한열차편은 금년 1월 27일 국내 개봉이후, 현재까지 누적관객 2백만명을 뛰어넘었습니다. 불편한 대일 관계, 코로나 상황등을 감안하면 아주 이례적인 흥행몰이가 아닌가 싶은데요. 관람객 9.62, 기자 및 평론가 6.00 그리고 네티즌 9.29 평점을 받고 있습니다. 

네이버 영화 웹사이트
네이버 영화 분석 : 귀멸의 칼날

네이버 영화평 분석결과를 잠깐 살펴보면, 10대 여성에서 만족도가 가장 높고, 관람추이는 20대 남성이 다소 많은 것으로 나타났습니다. 마지막으로 연출, 영상미, 스토리가 감상 포인트라고 하네요. 

2. 영화평 웹크롤링 

현재까지 영화평은 총 5,044건입니다. 이를 모두 수집하고, 단어 빈도 기준으로 상위 키워드를 추출한 후, 2회 이상 빈도 단어를 대상으로 워드클라우드를 구현해 보겠습니다. 마지막으로 군산대학교 감성사전을 기초로 영화평에 대한 감성분석 결과를 제시하겠습니다. 

해당 분석과 관련하여 웹크롤링부터 감성분석까지 모든 R 코드는 송지원님의 RPubs 를 이용하였습니다. 구체적인 R 코드가 궁금한 분들은 링크를 걸어두었으니, 해당 웹페이지를 참고하여 직접 실습해보길 바랍니다. 

3. R 코드 실행 및 결과 

귀멸의 칼날 영화평 웹크롤링부터 감성분석까지 R 실행코드 테스트 

 

4. 빈도 분석 결과 

귀멸의 칼날 워드클라우드 분석결과
귀멸의 칼날 영화평, 2회 이상 빈도 단어 워드클라우드

귀멸의 칼날 영화평에 대한 상위 20대 빈도 단어를 출력해보면 "진짜, 감동, 연출, 스토리, 최고, 렌코쿠, 눈물, 마지막, 작화, 액션, 영상미, 애니, 전투, 극장판, 재밌게, 내용, 가슴, 웅장" 입니다. 해당 단어들은 100회-500회 이상 등장한 단어들이고요. 상위 빈도 단어들만 보아도 귀멸의 칼날에 대한 관객들의 반응이 대강 짐작이 갑니다. 

5. 감성 분석 결과

귀멸의 칼날 영화평 감성분석 결과
귀멸의 칼날 네이버 영화평 감성 분석 결과


분석결과 위 그림에서도 살펴볼 수 있는 바와 같이 긍정단어 740, 부정 367 그리고 중립어가 3,939개로 나타났습니다. 
감성 분석 사전은 국내에서 많이 인용하고 있는 군산대학교 감성사전을 이용하였고, 링크를 걸어둘테니 관심있는 분들은 참고하기 바랍니다. 

6. 정리


언어는 하나의 단어가 하나의 의미를 갖기 보다는 여러 중첩적인 의미를 갖는 경우가 많습니다. 우리 한글의 경우에도 하나의 단어가 하나의 의미로 사용되기 보다는 다의적인 용도로 사용되는 경우가 많습니다. 감성 분석을 실행하고, 분석결과를 해석할 때, 이런 점을 유념할 필요가 있음을 강조합니다.