본문 바로가기

교육

Gephi 사용법│의미망 모형│코사인 유사도│논문작성프로그램

Gephi 사용법│의미망 모형│코사인 유사도│논문작성프로그램 

텍스트마이닝 분석방법 중 흔희 의미망 분석을 구현하는 방법은 여러 가지가 있으며, 이 블로그에서도 igraph패키지라든가 sna패키지를 사용하여 구현한 바 있습니다.  하지만 이 외에도 다양한 분석방법이 사용가능한데, 그중 오늘은 window 기준 gephi 사용방법에 관하여 간략히 정리하고자 합니다. 

 

텍스트 마이닝 │한글 │R 4.3.1│Window 11 기준

R을 이용한 한글 텍스트 마이닝(R 4.3.1과 윈도 11 기준) 포스팅이 계속 업데이트되고 있습니다. 관심 있는 분들은 KoNLP 설치 오류 해결 후, 다음 포스팅 순서에 따라 실습해 보기 바랍니다. 키워드

e-datanews.tistory.com



1. 실습영상

Gephi를 활용한 의미망분석 분석방법 실습영상

2. Java 설치

우선 gephi를 설치하기에 앞서 깃허브 페이지(https://github.com/ojdkbuild/ojdkbuild)에서 java를 설치해야 합니다. 

github, java 다운로드

깃허브페이지로 이동했다면, 스크롤을 좀 내려보면 다음과 같은 설치프로그램이 나타납니다. 이 중 확장자명이 msi인 링크를 클릭하면, 다운로드가 진행되고, 다운로드 완료이후에는 넥스트(혹은 다음) 버튼을 눌러 설치를 완료합니다. 

확장자 msi 실행프로그램 다운로드 및 설치

3. Gephi 설치

이제 gephi 프로그램을 설치합니다. 우선 gephi 웹사이트로 이동합니다. 이동이후 gephi 웹사이트 화면 상단의 다운로드 버튼을 클릭하면 프로그램 다운로드 페이지로 이동하고, 역시 해당 버튼을 클릭하면 gephi 다운로드가 진행됩니다. 

gephi 설치

gephi 프로그램 다운로드가 완료되면, 역시 넥스트(다음) 버튼을 계속 눌러 설치를 완료하면 됩니다. 완료한 이후, 바탕화면의 gephi 아이콘을 클릭하면 다음과 같은 작업화면 페이지가 나타나게 됩니다. 작업화면은 크게 가운데 결과화면을 중심으로 오른쪽은 네트워크의 특성(노드, 에지, 중심성 등)을 계측하는 통계메뉴와 각 계측결과를 미세조정하는 필터링메뉴가 있습니다. 왼쪽은 계측된 네트워크의 특성요소를 선택하여 그래프에 반영하는 상단의 appearnace메뉴와 네트워크 형태를 결정하는 layout 메뉴가 하단에 있습니다. 이 외에도 결과화면은 하단의 메뉴들은 노드와 에지를 미세조정할 수 있도록 다양한 아이콘들이 배치되어 있습니다. 

gephi 화면구성

추가적인 분석방법이 필요한 경우에는 화면 맨 위에 도구메뉴를 클릭하면, 보다 다양한 모듈들이 이용가능합니다. 

gephi 추가도구 설치

이제 본격적인 분석을 위해 사전에 준비한 인접행렬 파일을 gephi프로그램으로 불러옵니다. 인접행렬은 R에서 코사인유사도를 이용하여 계산하였습니다. 

gephi 분석 파일 불러오기

이처럼 gephi에서 인접행렬 파일을 불러오면, 다음 그림처럼 불러온 파일을 확인하는 화면이 나타나며, 이상이 없으면, 다음 버튼을 눌러 후속작업을 진행하면 됩니다. 

gephi 불러온 파일 확인

예제파일은 시간의 흐름에 따라 네트워크의 변화형태를 관찰하는 것이 아니므로 디폴트값인 intervals 그대로 둔 상태에서 다음 버튼을 클릭하면 됩니다. 

gephi 파일 불러오기 완료

특별한 이슈가 발생하지 않았다면, 제대로 분석파일을 불러온 것입니다. 현재 예제파일은 노드가 8개, 엣지가 14개인 것으로 분석되었습니다. 마지막으로 그래프 타입이 방향성이 있는지 혹은 방향이 없는지 등 선택한 후, 오케이 버튼을 클릭하면 그래프 이미지가 구현됩니다. 

분석파일 노드 및 엣지 분석결과

구현된 네트워크 그래프에 좀 더 시각적 효과를 보태기 위해서는 앞서 언급한 바와 같이 결과화면, 오른쪽과 왼쪽의 각 메뉴들을 클릭한 후, 반영된 결과를 계속 모니터링하고 최종 결과를 저장하면 됩니다. 

분석파일 gephi 실행결과 화면

4. 참고

메뉴도 많고 동작 아이콘도 많다보니 언뜻 보면 좀 복잡해 보일 수 있습니다만, 유튜브 등에 관련 튜토리올 동영상들이 많이 올라와 있습니다. 관련 동영상들도 함께 보면서 계속 실습해 보면 프로그램 핸들링은 금방 익숙해질 수 있습니다. 다만 중요한 점은 분석결과를 통해 어떠한 통찰력을 얻을 수 있느냐인데요. 이 부분은 데이터분석 경험치가 생기면 자연스럽게 생기리라 기대합니다. 
마지막으로 에듀캐스트라는 온라인교육 웹사이트가 있습니다. 회원가입 후,  "Gephi와 네트워크 시각화로 시작하는 데이터 분석" 이라는 강좌를 검색 후, 수강해 보기를 권합니다. 물론 회원가입 및 강의 모두 무료로 진행 중입니다. 강의 분량은 대략 3시간이 조금 넘는 분량인데요. 이론과 핸들링에 관한 직관적인 설명이 매우 좋아 Gephi를 처음 접하는 분들께 추천합니다. 

R이나 Python 처럼 코딩하지 않고, 무료로 다양한 언어들의 텍스트마이닝을 수행할 수 있는 도구가 KHcoder입니다. 키워드 네트워크 분석 등 관심 있는 분들은 아래 포스팅도 참고 바랍니다. 

 

키워드 네트워크 분석 방법 │한글 텍스트마이닝│KHcoder 활용

논문 작성 방법 중의 하나로 많이 사용되는 한글 키워드 네트워크 분석 방법에 관하여 정리합니다. 예제 키워드는 인플루언서이며, 해당 키워드를 이용하여 국내 연구를 정리해보겠습니다. 분

e-datanews.tistory.com

KHCoder3을 내려받고, 설치부터 다양한 분석 사례까지 여러 포스팅을 차례로 업데이트하였습니다. 관심 있는 분들은 아래 포스팅을 참고하기 바랍니다. 

 

한글 텍스트 마이닝│KH Coder3 내려받고 설치하기 │Window 기준

KHcoder3을 활용한 한글 텍스트 마이닝 방법을 총정리하는 첫 번째 포스팅입니다. 이번 포스팅에서는 KHcoder3을 내려받고 설치하는 방법에 대하여 정리하겠습니다. 우선 KHcoder3는 텍스트 마이닝 전

e-datanews.tistory.com