본문 바로가기

n-gram

N-Gram 댓글 분석 │R 한글 텍스트 마이닝 │어린이 자외선 차단제 선크림 N-Gram은 말 그대로 N개의 연속적인 단어들의 나열을 뜻합니다. 코퍼스에서 N개의 단어로 나누고 이를 하나의 토큰으로 간주합니다. 여기서 N이 한 개 일 때는 유니그램(unigram), 두 개일 때는 바이그램(bigram, 세 개일 때는 트라이그램(trigram)이라고 하는데요. 이번 포스팅에서는 어린이 자외선 차단제 댓글들을 이용하여 N-Gram 분석 방법과 결과를 각각 정리하여 공유하겠습니다. 물론 분석에 이용한 댓글들과 R 한글 텍스트 마이닝 코드는 포스팅 하단에 업로드해 두었습니다. 관심 있는 분들은 각각 내려받은 후, 순서대로 따라 해 보시기 바랍니다.  어린이 자외선 차단제 선크림 선블록│댓글 분석 │LDA 토픽 모델링 │R 한글 텍스트 마이닝지난 포스팅에서는 어린이 자외선 차단제 댓글들을.. 더보기
텍스트마이닝 분석 절차 │비정형 데이터 분석 방법 │중국 경제 해외 연구 텍스트 데이터의 분석 방법인 텍스트 마이닝 분석 절차에 대하여 예시 자료와 함께 개념적인 이해를 도모해보고자 합니다. 중국 경제에 관한 해외 연구 분석 사례를 중심으로  비정형 데이터 분석 방법인 텍스트 마이닝 분석 절차와 방법을 중심으로 정리하겠습니다. 아마존 재팬 일본 고객 불만 리뷰 텍스트 마이닝 │2022 어린이 선크림아마존 재팬의 고객들은 어린이 선크림에 대하여 어떤 불만들을 갖고 있는지 분석해 보고자 합니다. 이를 위해 SPF 30, PA++ 품목들 중 고객 평점 4점 이상, 리뷰 건수 100건 이상인 품목들 중에서 고e-datanews.tistory.com 텍스트 마이닝 토픽분석 키워드 네트워크 분석 │국내 연구 동향 │2002년-2022년한국 학술지 인용 색인에서 텍스트 마이닝, 토픽분석 .. 더보기