본문 바로가기

교육

뉴욕타임즈 API 활용법 │R 텍스트마이닝

뉴욕타임스 API를 활용하여 키워드 검색 후, 키워드 관련 기사 헤드라인을 가져오는 텍스트 마이닝을 테스트해보겠습니다. 이를 위해서 우선 뉴욕타임스 API에 APP을 신규로 등록해야 하고, 성공적으로 APP 등록을 마쳤다면, R 스크립트 파일과 실습 영상도 업로드해둘 테니 각자 연습해 보기 바랍니다. 

 

 

뉴욕타임스 API 등록 절차 

뉴욕타임스 API 등록 절차는 아래와 같이 4단계로 요약할 수 있습니다. 자세한 사항은 각각의 이미지와 함께 설명하겠습니다. 

  • 뉴욕타임스 개발자 네트워크 회원가입 
  • 개발자 신규 계정 생성
  • New APP 이름 및 API 활성화 
  • API Key 발급 완료

 

뉴욕타임즈 개발자 네트워크 웹사이트
뉴욕타임즈 개발자 네트워크 웹사이트

위 이미지를 링크하면, 뉴욕타임스 개발자 네트워크 웹사이트로 이동할 수 있습니다. 해당 웹사이트로 이동한 후, 개발자 신규 등록을 해보겠습니다. Get Started를 클릭합니다. 

개발자 신규 계정 생성
개발자 신규 계정 생성

Get Started를 클릭하면, 위 이미지와 같은 화면으로 이동합니다. Create account를 클릭하여 개발자 신규 등록을 실행합니다. 이때 이메일 확인을 요구하는데, 가급적 gmail로 확인하기 바랍니다. 국내 메일은 이유를 알 수 없는 오류 메시지가 계속 뜨네요. 

new app 생성
new app 생성

위의 이미지처럼 우측 상단의 본인 이메일을 눌러주면 Apps이 활성화됩니다. 이를 클릭해주면 NEW APP이 나타납니다. 해당 버튼을 클릭하면, 아래처럼 New App의 속성을 설정할 수 있는 페이지로 이동하게 됩니다. 

New APP 이름 및 API 활성화
New APP 이름 및 API 활성화

신규 APP의 이름은 필수항목입니다. 적절한 이름을 기입한 후, 뉴욕타임스에서 제공하는 다양한 API들을 활성화시켜야 하는데요. Enable 버튼을 눌러주기만 하면 됩니다. 마지막으로 save 버튼을 눌러 저장합니다. 

API KEY 발급 완료
API KEY 발급 완료

여기까지 잘 따라왔다면, 위 이미지처럼 뉴욕타임스 뉴욕타임스 API KEY 값이 생성되었음을 확인할 수 있습니다. 뉴욕타임스 기사 키워드 검색 및 텍스트 마이닝을 위하여 해당 API KEY 값을 복사해둡니다. 

 

뉴욕타임스 API, 텍스트 마이닝 테스트

뉴욕타임스 API 서비스를 활용하여 키워드 검색 후, 간단한 텍스트 마이닝 테스트를 실행해보겠습니다. Reference는 아래와 같고, 원문에서 키워드만 변경하여 테스트 실행해보았습니다. 

 

Text analytics with nytimes data

Search New York Times Articles Through API Our goal here is to access the archive of New York Times article through its search API. There are some R packages in the R community. The firstis called rtimes and its main function is to “search and retrieve d

rstudio-pubs-static.s3.amazonaws.com

테스트 결과 아래 키워드 분석 결과처럼 잘 실행되었음을 확인할 수 있습니다. 포스팅 하단에 업로드해 둔 R 스크립트 코드를 보면 알겠지만, 바이든과 시진핑 2022년 관련 기사를 수집하였고, 아래 이미지는 바이든 대통령과 시진핑 주석 2022년 뉴욕타임스 보도기사 중 빈도가 높았던 단어들을 빈도수 기준으로 시각화한 것입니다. 테스트는 각자 해보기 바랍니다. 

2022 뉴욕타임즈 바이든 대통령과 시진핑 주석 키워드 빈도 분석 결과
2022 뉴욕타임즈 바이든 대통령과 시진핑 주석 키워드 빈도 분석 결과

 

R Script와 실습 영상

뉴욕타임스 API 개발자 등록을 성공리에 마쳤다면, 실제 키워드 관련 보도기사를 수집하고, 텍스트 마이닝을 실행해봐야겠지요? 앞서 설명한 대로 차근차근 따라서 개발자 등록을 마친 후, 아래 R Script 실행코드를 업로드해두겠습니다. 각자 내려받고 실습해보기 바랍니다. 

nytimes_API_B.R
0.00MB

 

뉴욕타임즈 API 활용한 텍스트마이닝 실행결과

위 영상은 업로드한 R Script를 활용하여 2022년 뉴욕타임스 바이든 대통령과 시진핑 주석의 기사 수집 후, 워드 클라우드와 빈도 분석으로 시각화한 실행 영상이니 같이 참고하기 바랍니다.