본문 바로가기

KHCoder3

계층적 군집분석 │ 와드(Ward) │ 유클리디안 거리 군집분석은 비슷한 속성을 가진 분석대상을 몇 개의 집단으로 묶고 각 집단의 특징을 파악하여 전체 데이터를 탐색하는 방법입니다. 몇 개의 집단으로 묶기 위해서는 묶이는 집단 간 유사도가 필요합니다. KHCoder3에서 제공하고 있는 유사도 계산 방법은 지난 포스팅에서도 소개했습니다만, 이번 포스팅에서는 유클리디안 거리에 대하여 정리하고 계층적 군집분석을 테스트해보겠습니다. 1. 계층적 군집분석의 거리 계산 방법 개별 분석 대상 간의 거리를 기준으로 수형도 즉 나무 모양의 계층구조를 상향식으로 만들어 가는 방법입니다. 거리를 계산하는 방법에 따라 단일결합, 완전결합, 평균결합, 중심경합 그리고 와드(Ward)기준이 있습니다. 단일결합은 최소거리를, 완전결합은 최대거리를, 평균결합은 평균거리를, 중심결합은 집.. 더보기
KH Coder3 대응분석│삼성 현대차 SK그룹의 경영철학 비교 │한글 텍스트 마이닝 KH Coder3을 이용한 한글 텍스트 마이닝 분석 방법 중 대응분석 사용방법에 대하여 정리하겠습니다. 대응분석이란 2개 이상의 명목 척도로 측정된 범주형 변수들 간의 연관성을 분석하고 이를 플롯팅하는 방법으로서 대표적인 탐색적 자료 분석 방법입니다. 1. 분석자료 준비 KH Coder3의 대응분석 사용법을 정리하기 위해 준비한 분석자료는 삼성그룹, 현대차 그룹, SK그룹의 경영철학입니다. 해당 경영철학은 모두 각 그룹사 웹사이트에서 복사해왔고, 엑셀로 정리하여 다음과 같이 업로드해두었습니다. 2. 분석자료 호출 및 전처리 Project > New 하고 각 그룹사 경영철학이 정리된 엑셀 파일을 호출합니다. 다음 PRe-Processing > Run pre-processing를 통해 데이터 전처리를 실행합.. 더보기