본문 바로가기

교육

KH Coder3 대응분석│삼성 현대차 SK그룹의 경영철학 비교 │한글 텍스트 마이닝

KH Coder3을 이용한 한글 텍스트 마이닝 분석 방법 중 대응분석 사용방법에 대하여 정리하겠습니다. 대응분석이란 2개 이상의 명목 척도로 측정된 범주형 변수들 간의 연관성을 분석하고 이를 플롯팅하는 방법으로서 대표적인 탐색적 자료 분석 방법입니다.

 

1. 분석자료 준비 

KH Coder3의 대응분석 사용법을 정리하기 위해 준비한 분석자료는 삼성그룹, 현대차 그룹, SK그룹의 경영철학입니다. 해당 경영철학은 모두 각 그룹사 웹사이트에서 복사해왔고, 엑셀로 정리하여 다음과 같이 업로드해두었습니다. 

philosophy.xlsx
0.01MB

 

 

2. 분석자료 호출 및 전처리 

Project > New 하고 각 그룹사 경영철학이 정리된 엑셀 파일을 호출합니다. 다음 PRe-Processing > Run pre-processing를 통해 데이터 전처리를 실행합니다.

 

3. 대응분석 준비 

Tools > Words > Correspondence Analysis 클릭합니다. 그럼 그림과 같은 새 창이 열립니다. 여기서 일단 2회 이상 출현한 명사와 태그만 이용하여 대응분석 결과를 시각화해보겠습니다. 

KH Coder3 한글 텍스트 마이닝 대응분석 옵션값 지정
KH Coder3 한글 텍스트 마이닝 대응분석 옵션값 지정

 

4. 대응분석 결과

각 그룹사별 경영철학 대응분석 결과는 다음과 같습니다. 분석 결과에 알 수 있는 바와 같이 각 그룹사별로 경영철학이 뚜렷히 다르게 대응되고 있는데요. 가령, 삼성그룹은 기술-인류-제품-확보, 현대차 그룹은 글로벌-조직-기업-문화-존중, SK그룹은 회사-행복-이해관계자-동시-지속-추구와 대응되고 있음을 알 수 있습니다. 

삼성, 현대차 및 SK그룹사 간 경영철학의 대응분석 결과
삼성, 현대차 및 SK그룹사 간 경영철학의 대응분석 결과

 

5. 대응분석 결과 수정

이번에는 대응분석 옵션값을 조정하여 분석 결과를 보다 명확히 구현해보겠습니다. 
아래 그림은 Show labels only for distinctive words: Top에서 단어수를 15개로 수정하고 Bubble plot은 120%로 수정한 후, 재시도 한 대응분석 결과입니다. 분석 결과 그림에서 확인할 수 있는 바와 같이 각 그룹사별 경영철학 단어들이 보다 명확하게 대응되고 있음을 확인할 수 있습니다. 

삼성, 현대차 및 SK그룹사 간 경영철학의 대응분석 결과 수정
삼성, 현대차 및 SK그룹사 간 경영철학의 대응분석 결과 수정

 

6. 정리

이번 포스팅에서는 KH Coder3를 이용한 한글 텍스트 마이닝 분석 방법 중 대응분석 절차, 분석방법 및 결과를 수정하는 방법까지 살펴보았습니다. 대응분석 자체에 대한 이론은 다른 포스팅에서 정리하겠습니다. 

 

계층적 군집분석 │ 와드(Ward) │ 유클리디안 거리

군집분석은 비슷한 속성을 가진 분석대상을 몇 개의 집단으로 묶고 각 집단의 특징을 파악하여 전체 데이터를 탐색하는 방법입니다. 몇 개의 집단으로 묶기 위해서는 묶이는 집단 간 유사도가

e-datanews.tistory.com

다음 포스팅에서는 KH Coder3가 제공하는 계층적 군집분석 사례를 살펴보도록 하겠습니다.