본문 바로가기

교육

국제 뉴스 데이터 수집과 분석│News API in R

이번 포스팅에서는 News API( https://newsapi.org/ )를 통해 국제 뉴스 데이터를 수집하기 위한 R 스크립트를 공유하고, 기초적인 텍스트 마이닝 분석을 통해 빈도수 기준 핵심 키워드를 도출하는 실습을 진행해보겠습니다. 연습용 R 스크립트는 포스팅 하단에 업로드하였습니다. 

 

국제 무역 해외 뉴스 데이터 수집과 키워드 분석 

NEWS API를 통해 키워드를 활용한 관련 국제 뉴스 데이터를 수집하는 방법을 R을 이용하는 실습을 진행합니다. 앞에서 살펴본 바 있는 국내 뉴스 빅데이터 서비스인 빅카인즈 와 유사한 서비스라고 생각하면 이해가 쉬울 듯합니다. 

news API를 이용한 국제 뉴스 데이터 수집
NEWS API 를 활용한 국제뉴스 데이터 수집

 

News API 등록과 Key 발급 

News API를 이용하여 국제 뉴스 데이터를 수집하기 위해서는 아래 그림을 클릭하여 해당 웹사이트로 이동한 후, 회원가입을 진행해야 합니다. 가입과 동시에 News API의 본인 Key가 발급됩니다. 회원가입은 무료이며, 무료로 사용하는 경우 뉴스 데이터 수집은 다소 제한적입니다. 자세한 내용은 아래 이미지를 클릭한 후, 해당 웹사이트의 가격 정책을 참고하기 바랍니다. 

news API Register
NEWS API 등록과 KEY 발급

 

News API in R

News API에 접근하기 위한 Key를 발급받았다면, 아래 그림의 1번에 발급받은 Key를 붙여 넣기 합니다. 또한 2번처럼 검색 키워드를 입력하면, 관련 키워드를 포함한 언론사, 제목, 일시 등 검색 결과를 얻을 수 있습니다만, 뉴스 전문은 제공하지 않으니 참고 바랍니다. 빅카인즈처럼 관련 뉴스의 키워드 제공이 없다는 점은 아쉬운 대목입니다(아래 이미지를 클릭하면 참고한 깃허브로 이동합니다). 

news API in R
News API in R

 

2021년 7월, 국제 무역 해외 뉴스 키워드 분석 결과

수집된 국제 무역 해외 뉴스 데이터 중 뉴스 타이틀을 이용하여 워드 클라우드(빈도수 기준 3회 이상)를 구현하여 2021년 7월 국제 무역 영어 뉴스의 키워드를 도출하였습니다. 최근 몇 년 동안 국제 무역 뉴스에서 "중국"은 상위권 뉴스 키워드입니다. 2021년 7월에도 여전히 "중국"은 해외 뉴스에서 빈번하게 등장하고 있음을 확인할 수 있습니다. 이 외에도 유럽에서 최근 많은 논의가 진행 중인 "탄소 국경세" 도 7월 상위권 뉴스 키워드로 등장하고 있음을 확인할 수 있습니다. 

news API Wordcloud
2021년 국제 무역 뉴스 키워드 분석 결과

 

이번 포스팅에서는 활용한 R 스크립트는 아래 파일입니다. News API  접근 R 스크립트와 워드 클라우드 구현과 이를 위한 간단한 텍스트 마이닝 절차가 포함되어 있으니 참고하기 바랍니다. 

NewsAPI_0731_blog.R
0.00MB