본문 바로가기

교육

#보라해 │Rtweet │트위터 R크롤링 │연습문제

지난 포스팅에서는 Rtweet, twitteR 패키지를 활용하여 "BTSmeal", "콜드체인" 트윗을 수집하고, 영문, 한글 텍스트 마이닝 분석을 연습해 보았습니다. 이번 포스팅에서는 #보라해 해시태그를 이용해 Rtweet을 이용한 한글 트위터 텍스트 마이닝을 과제로 수행해 보기 바랍니다. 

2021.06.01 - [교육] - rtweet 사용법 │BTS meal │R 크롤링

 

rtweet 사용법 │BTS meal │R 크롤링

이번 포스팅은 rtweet 패키지를 이용한 트윗 R 크롤링 방법에 관하여 정리합니다. 사례는 "#BTS meal"를 이용합니다. rtweet은 본인의 트위터 계정만 있다면 별도의 승인 절차 없이 필요한 트윗을 수집

e-datanews.tistory.com

2021.06.03 - [교육] - 트위터 크롤링 │콜드체인 │twitteR│Cold chain issues in Korea

 

트위터 크롤링 │콜드체인 │twitteR│Cold chain issues in Korea

R의 twitteR 패키지를 활용한 트위터 크롤링 방법에 관하여 정리합니다. 검색할 트윗은 콜드체인입니다. twitteR을 이용하기 위해서는 사전에 트위터 API 개발자 등록과 승인을 받아야 한다는 점에서

e-datanews.tistory.com

 

1. ts_plot() 함수를 이용한 #보라해 트윗 건수 시계열 분석

#보라해를 이용한 트윗 건수를 시계열로 구현하면 다음과 같고, 이전 포스팅 결과와 같은 R 스크립트를 이용했습니다. 
여러분 각자 구현해 보기 바랍니다. 

한국 BTS 셋트 트윗건수
#보라해 트윗건수

 

2. 워드 클라우드 구현

"#보라해" 에 관한 트윗을 수집한 후, 한글 텍스트 데이터에 대한 몇 가지 전처리 과정을 거쳤습니다. 그리고 다음 그림처럼 30회 이상 빈도를 가지는 단어를 중심으로 워드 클라우드를 구현하였습니다. 

BTS셋트 트윗 워드클라우드
#보라해 워드 클라우드

 

"#보라해" 워드 클라우드 분석 결과를 보면서, 데이터 정제 작업 중 무엇이 필요한지 아이디어가 있어야 합니다. 현재 결과로는 "#보라해" 와 관련된 추가적인 지식과 정보를 획득하기 어렵습니다. 앞에서 공부한 전처리 방법을 활용해 일본어, 특수기호 및 불용어 처리를 추가로 진행한 후, 해당 결과를 워드 클라우드로 제시해 보기 바랍니다.