지난 포스팅에서는 Rtweet, twitteR 패키지를 활용하여 "BTSmeal", "콜드체인" 트윗을 수집하고, 영문, 한글 텍스트 마이닝 분석을 연습해 보았습니다. 이번 포스팅에서는 #보라해 해시태그를 이용해 Rtweet을 이용한 한글 트위터 텍스트 마이닝을 과제로 수행해 보기 바랍니다.
2021.06.01 - [교육] - rtweet 사용법 │BTS meal │R 크롤링
2021.06.03 - [교육] - 트위터 크롤링 │콜드체인 │twitteR│Cold chain issues in Korea
1. ts_plot() 함수를 이용한 #보라해 트윗 건수 시계열 분석
#보라해를 이용한 트윗 건수를 시계열로 구현하면 다음과 같고, 이전 포스팅 결과와 같은 R 스크립트를 이용했습니다.
여러분 각자 구현해 보기 바랍니다.
2. 워드 클라우드 구현
"#보라해" 에 관한 트윗을 수집한 후, 한글 텍스트 데이터에 대한 몇 가지 전처리 과정을 거쳤습니다. 그리고 다음 그림처럼 30회 이상 빈도를 가지는 단어를 중심으로 워드 클라우드를 구현하였습니다.
"#보라해" 워드 클라우드 분석 결과를 보면서, 데이터 정제 작업 중 무엇이 필요한지 아이디어가 있어야 합니다. 현재 결과로는 "#보라해" 와 관련된 추가적인 지식과 정보를 획득하기 어렵습니다. 앞에서 공부한 전처리 방법을 활용해 일본어, 특수기호 및 불용어 처리를 추가로 진행한 후, 해당 결과를 워드 클라우드로 제시해 보기 바랍니다.
'교육' 카테고리의 다른 글
텍스트마이닝 분석 절차 │비정형 데이터 분석 방법 │중국 경제 해외 연구 (0) | 2021.07.01 |
---|---|
구글 설문 챗봇 │fobi.io (0) | 2021.06.23 |
트위터 크롤링 │콜드체인 │twitteR│Cold chain issues in Korea (0) | 2021.06.03 |
네이버 뉴스댓글수집 분석 │비트코인 10년 만에 최대 낙폭 │R 크롤링 (0) | 2021.06.02 |
rtweet 사용법 │BTS meal │R 크롤링 (0) | 2021.06.01 |