본문 바로가기

교육

네이버 뉴스댓글수집 분석 │비트코인 10년 만에 최대 낙폭 │R 크롤링

다음 뉴스 댓글 자동 수집 분석에 이어 네이버 뉴스 댓글을 자동 수집하고, 분석하는 R 크롤링 방법에 관하여 소개합니다. 분석 데이터는 "비트코인, 10년 만에 최대 낙폭"이라는 기사에 대한 댓글입니다. R코드는 포스팅 하단에 업로드해 두었습니다. 

2021.05.31 - [교육] - 다음 뉴스 댓글 자동 수집 │R 크롤링 │ 도쿄 올림픽 보이콧

 

다음 뉴스 댓글 자동 수집 │R 크롤링 │ 도쿄 올림픽 보이콧

다음 뉴스 댓글을 자동 수집하는 R 크롤링 방법을 간단히 소개하겠습니다. 뉴스 데이터는 도쿄 올림픽을 보이콧 여부에 대한 국내 뉴스 보도입니다. 뉴스 댓글은 특정 사건에 대한 여론을 가늠

e-datanews.tistory.com

 

1. 네이버 뉴스 댓글 자동 수집을 위한 R패키지 설치 

네이버 뉴스 댓글 자동 수집을 위한 R 패키지 N2H4를 설치합니다. 해당 패키지에 대한 자세한 내용은 개발자인 박찬엽 님의 블로그를 참고하기 바랍니다. 

네이버뉴스 댓글 자동수집 R 패키지 설치
R 패키지 N2H4 설치 

 

2. 네이버 뉴스 댓글 자동 수집 R 크롤링과 텍스트 마이닝 

"블록체인 10년 만에 최대 낙폭" 이라는 뉴스 기사에 대한 댓글은 R 패키지 N2H4에 의해 자동 수집됩니다. 자동 수집된 댓글 정보는 comments라는 객체에 저장되고, 댓글 텍스트 데이터인 contents 만 따로 추출합니다. 추출된 댓글 데이터는 2글자 이상의 명사만 따로 분리하고 워드 클라우드로 구현하였습니다. 자세한 R 코드는 아래 그림과 하단에 첨부한 R 코드를 참고하기 바랍니다. 

R크롤러와 텍스트마이닝 코드
R 크롤링과 텍스트 마이닝 분석 

 

3. 뉴스 댓글 워드클라우드 구현 

"비트코인, 10년 만에 최대 낙폭"이라는 뉴스 기사 댓글에 대한 데이터 시각화 테스트 결과는 다음과 같습니다. 비트코인 하락에 따라 가상 화폐 가치에 대한 논쟁, 주식, 달러 등 다른 자산 투자에 대한 댓글이 많았던 것 같습니다. 

비트코인 최대 낙폭 뉴스기사 워드클라우드 data-ke-mobilestyle=
비트코인 최대 낙폭 뉴스 댓글 워드 클라우드 분석 결과 

4. 정리

다음 뉴스 댓글 자동 수집과 분석 포스팅에 이어 비트코인 네이버 뉴스 댓글 자동 수집과 분석에 대하여 간략히 살펴보았습니다. 이번 포스팅에서 사용한 R 코드를 업로드 해 두니 참고하기 바랍니다. 추가로 지난 포스팅에서 "귀멸의 칼날"에 관한 감성분석을 시도한 적이 있습니다. 관련 R 코드를 참고하여 다음과 네이버 뉴스 댓글 수집 후, 감성 분석을 추가로 진행해 보는 것도 좋을 것 같습니다. 

naver_reply_test.R
0.00MB