본문 바로가기

계층적 군집분석

무료 일본어 AI 자동 텍스트 마이닝 사이트 사용법 (2) │아마존 재팬 고객 리뷰 분석 │User Local(ユーザーローカル) 이번 포스팅은 User Local(ユーザーローカル)을 이용하여 일본어 고객 리뷰를 자동 텍스트 마이닝 분석해 봅니다. 예제로 사용할 리뷰는 지난 포스팅에서 사용했던 아마존 재팬의 유기농 립스틱 상품이며, 코딩하지 않고 아마존 리뷰를 수집하는 방법은 다음 포스팅을 참고하기 바랍니다. 무료 웹스크래핑 Dataminer 사용 방법 │아마존 고객 리뷰 │keto diet 웹스크래핑 서비스인 dataminer 사용 방법을 정리합니다. 미리 말씀드리면, 정말 매우 간단합니다. 다만, 일정한 페이지까지는 웹스크래핑이 무료이나, 무료 서비스 이용 범위를 넘어서면 과금된 e-datanews.tistory.com 1. 로그인 및 분석 파일 업로드 지난 첫번째 포스팅을 참고하여 User Local(ユーザーローカル)의 로그인.. 더보기
계층적 군집분석 │ 와드(Ward) │ 유클리디안 거리 군집분석은 비슷한 속성을 가진 분석대상을 몇 개의 집단으로 묶고 각 집단의 특징을 파악하여 전체 데이터를 탐색하는 방법입니다. 몇 개의 집단으로 묶기 위해서는 묶이는 집단 간 유사도가 필요합니다. KHCoder3에서 제공하고 있는 유사도 계산 방법은 지난 포스팅에서도 소개했습니다만, 이번 포스팅에서는 유클리디안 거리에 대하여 정리하고 계층적 군집분석을 테스트해보겠습니다. 1. 계층적 군집분석의 거리 계산 방법 개별 분석 대상 간의 거리를 기준으로 수형도 즉 나무 모양의 계층구조를 상향식으로 만들어 가는 방법입니다. 거리를 계산하는 방법에 따라 단일결합, 완전결합, 평균결합, 중심경합 그리고 와드(Ward)기준이 있습니다. 단일결합은 최소거리를, 완전결합은 최대거리를, 평균결합은 평균거리를, 중심결합은 집.. 더보기