본문 바로가기

텍스트 네트워크 분석

R 한글 텍스트 마이닝 (5) : 단어 문서 행렬 │cast_tdm 함수 │텍스트 네트워크 분석 R을 이용한 한글 텍스트 마이닝 다섯 번째 포스팅은 TDM, cast_tdm 함수를 이용한 단어 문서 행렬의 구성 방법에 관한 R 실습 코드와 설명입니다. 마지막에 단어 문서 행렬 구성 후, qgraph 패키지를 이용한 동시출현네트워크분석(co-occurrence network anlysis)까지 설명하고 마무리하겠습니다. 실습할 데이터는 계속 이어서 네이버 큐 보도자료입니다. 해당 데이터는 두번째 포스팅에 올려두었으니, 참고 바랍니다. 또한 아래 포스팅을 참고하여 KoNLP 패키지 먼저 설치해야 R을 이용한 한글 텍스트 마이닝 분석이 가능합니다. R 한글 텍스트 마이닝 분석 (4) : tidygraph와 ggraph │키워드 네트워크 분석 R을 이용한 한글 텍스트 마이닝 분석 다섯 번째 포스팅 주제는 .. 더보기
해외 뉴스 텍스트 네트워크 분석 │영어 데이터 정제 방법 비건 스킨케어 해외 뉴스 데이터를 NewsAPI를 이용하여 수집 및 저장하고, KHCoder로 호출한 후, 불용어 등 데이터 정제 방법에 관하여 정리합니다. 국제 뉴스 데이터 수집과 분석│News API in R 이번 포스팅에서는 News API( https://newsapi.org/ )를 통해 국제 뉴스 데이터를 수집하기 위한 R 스크립트를 공유하고, 기초적인 텍스트 마이닝 분석을 통해 빈도수 기준 핵심 키워드를 도출하는 실습 e-datanews.tistory.com 1. 비건 스킨케어 해외 뉴스 수집 │KHCoder로 텍스트 데이터 호출 NewsAPI를 이용한 비건 스킨케어 해외 뉴스 데이터를 수집하고, 해당 데이터를 KHCoder로 호출합니다. 수집된 뉴스 데이터는 아래 파일을 이용하였습니다. 실습.. 더보기