다음 뉴스 댓글 자동 수집 분석에 이어 네이버 뉴스 댓글을 자동 수집하고, 분석하는 R 크롤링 방법에 관하여 소개합니다. 분석 데이터는 "비트코인, 10년 만에 최대 낙폭"이라는 기사에 대한 댓글입니다. R코드는 포스팅 하단에 업로드해 두었습니다.
2021.05.31 - [교육] - 다음 뉴스 댓글 자동 수집 │R 크롤링 │ 도쿄 올림픽 보이콧
1. 네이버 뉴스 댓글 자동 수집을 위한 R패키지 설치
네이버 뉴스 댓글 자동 수집을 위한 R 패키지 N2H4를 설치합니다. 해당 패키지에 대한 자세한 내용은 개발자인 박찬엽 님의 블로그를 참고하기 바랍니다.
2. 네이버 뉴스 댓글 자동 수집 R 크롤링과 텍스트 마이닝
"블록체인 10년 만에 최대 낙폭" 이라는 뉴스 기사에 대한 댓글은 R 패키지 N2H4에 의해 자동 수집됩니다. 자동 수집된 댓글 정보는 comments라는 객체에 저장되고, 댓글 텍스트 데이터인 contents 만 따로 추출합니다. 추출된 댓글 데이터는 2글자 이상의 명사만 따로 분리하고 워드 클라우드로 구현하였습니다. 자세한 R 코드는 아래 그림과 하단에 첨부한 R 코드를 참고하기 바랍니다.
3. 뉴스 댓글 워드클라우드 구현
"비트코인, 10년 만에 최대 낙폭"이라는 뉴스 기사 댓글에 대한 데이터 시각화 테스트 결과는 다음과 같습니다. 비트코인 하락에 따라 가상 화폐 가치에 대한 논쟁, 주식, 달러 등 다른 자산 투자에 대한 댓글이 많았던 것 같습니다.
4. 정리
다음 뉴스 댓글 자동 수집과 분석 포스팅에 이어 비트코인 네이버 뉴스 댓글 자동 수집과 분석에 대하여 간략히 살펴보았습니다. 이번 포스팅에서 사용한 R 코드를 업로드 해 두니 참고하기 바랍니다. 추가로 지난 포스팅에서 "귀멸의 칼날"에 관한 감성분석을 시도한 적이 있습니다. 관련 R 코드를 참고하여 다음과 네이버 뉴스 댓글 수집 후, 감성 분석을 추가로 진행해 보는 것도 좋을 것 같습니다.
'교육' 카테고리의 다른 글
#보라해 │Rtweet │트위터 R크롤링 │연습문제 (0) | 2021.06.04 |
---|---|
트위터 크롤링 │콜드체인 │twitteR│Cold chain issues in Korea (0) | 2021.06.03 |
rtweet 사용법 │BTS meal │R 크롤링 (0) | 2021.06.01 |
다음 뉴스 댓글 자동 수집 │R 크롤링 │ 도쿄 올림픽 보이콧 (0) | 2021.05.31 |
동시 출현 네트워크 분석 │귀멸의 칼날 │의미망 분석 │네이버 영화평 (0) | 2021.05.29 |