뉴욕타임스 API를 활용하여 키워드 검색 후, 키워드 관련 기사 헤드라인을 가져오는 텍스트 마이닝을 테스트해보겠습니다. 이를 위해서 우선 뉴욕타임스 API에 APP을 신규로 등록해야 하고, 성공적으로 APP 등록을 마쳤다면, R 스크립트 파일과 실습 영상도 업로드해둘 테니 각자 연습해 보기 바랍니다.
뉴욕타임스 API 등록 절차
뉴욕타임스 API 등록 절차는 아래와 같이 4단계로 요약할 수 있습니다. 자세한 사항은 각각의 이미지와 함께 설명하겠습니다.
- 뉴욕타임스 개발자 네트워크 회원가입
- 개발자 신규 계정 생성
- New APP 이름 및 API 활성화
- API Key 발급 완료
위 이미지를 링크하면, 뉴욕타임스 개발자 네트워크 웹사이트로 이동할 수 있습니다. 해당 웹사이트로 이동한 후, 개발자 신규 등록을 해보겠습니다. Get Started를 클릭합니다.
Get Started를 클릭하면, 위 이미지와 같은 화면으로 이동합니다. Create account를 클릭하여 개발자 신규 등록을 실행합니다. 이때 이메일 확인을 요구하는데, 가급적 gmail로 확인하기 바랍니다. 국내 메일은 이유를 알 수 없는 오류 메시지가 계속 뜨네요.
위의 이미지처럼 우측 상단의 본인 이메일을 눌러주면 Apps이 활성화됩니다. 이를 클릭해주면 NEW APP이 나타납니다. 해당 버튼을 클릭하면, 아래처럼 New App의 속성을 설정할 수 있는 페이지로 이동하게 됩니다.
신규 APP의 이름은 필수항목입니다. 적절한 이름을 기입한 후, 뉴욕타임스에서 제공하는 다양한 API들을 활성화시켜야 하는데요. Enable 버튼을 눌러주기만 하면 됩니다. 마지막으로 save 버튼을 눌러 저장합니다.
여기까지 잘 따라왔다면, 위 이미지처럼 뉴욕타임스 뉴욕타임스 API KEY 값이 생성되었음을 확인할 수 있습니다. 뉴욕타임스 기사 키워드 검색 및 텍스트 마이닝을 위하여 해당 API KEY 값을 복사해둡니다.
뉴욕타임스 API, 텍스트 마이닝 테스트
뉴욕타임스 API 서비스를 활용하여 키워드 검색 후, 간단한 텍스트 마이닝 테스트를 실행해보겠습니다. Reference는 아래와 같고, 원문에서 키워드만 변경하여 테스트 실행해보았습니다.
테스트 결과 아래 키워드 분석 결과처럼 잘 실행되었음을 확인할 수 있습니다. 포스팅 하단에 업로드해 둔 R 스크립트 코드를 보면 알겠지만, 바이든과 시진핑 2022년 관련 기사를 수집하였고, 아래 이미지는 바이든 대통령과 시진핑 주석 2022년 뉴욕타임스 보도기사 중 빈도가 높았던 단어들을 빈도수 기준으로 시각화한 것입니다. 테스트는 각자 해보기 바랍니다.
R Script와 실습 영상
뉴욕타임스 API 개발자 등록을 성공리에 마쳤다면, 실제 키워드 관련 보도기사를 수집하고, 텍스트 마이닝을 실행해봐야겠지요? 앞서 설명한 대로 차근차근 따라서 개발자 등록을 마친 후, 아래 R Script 실행코드를 업로드해두겠습니다. 각자 내려받고 실습해보기 바랍니다.
위 영상은 업로드한 R Script를 활용하여 2022년 뉴욕타임스 바이든 대통령과 시진핑 주석의 기사 수집 후, 워드 클라우드와 빈도 분석으로 시각화한 실행 영상이니 같이 참고하기 바랍니다.
'교육' 카테고리의 다른 글
키워드 네트워크 분석 방법 │한글 텍스트마이닝│KHcoder 활용 (0) | 2022.05.24 |
---|---|
한국 화장품 일본 소비자 리뷰 No Coding 무료 텍스트마이닝│코딩하지 않고 동시 출현 네트워크 분석│KHcoder │韓国 コスメ Yahooショッピングレビューの共起語を探す (0) | 2022.05.23 |
네이버 블로그 R 텍스트마이닝 │20대 여친 여사친 선물 추천 비교│네이버 오픈 API 활용 (0) | 2022.05.18 |
일본 남자 여자 패션 인스타 인플루언서 5 명 │2023년 1월 업데이트 정보 │Insta Lab (0) | 2022.05.13 |
카페 창업 뜨는 지역 │ 통계 지리 정보 서비스 이용 방법 │통계청 (0) | 2022.04.08 |