무료로 일본어 AI 텍스트 마이닝을 자동으로 구현해 볼 수 있는 대표적인 웹사이트는 User Local(ユーザーローカル)입니다. 최근 User Local(ユーザーローカル)이 여러 가지 기능들을 개선 및 제공하고 있어서 이번 포스팅을 통해 소개해보고자 합니다. 다만, 일본어로 사용자 계정 생성을 위한 회원가입이 필요하고, 특정 서비스는 글자 수(200,000자까지)가 제한된 경우도 있습니다. 이번 포스팅에서는 계정 생성 방법과 샘플 데이터를 이용하여 User Local(ユーザーローカル) 에서 제공하는 네 가지 카테고리 서비스 중 "하나의 문서를 분석" 하는 카테고리의 세부 분석 서비스 메뉴인 워드클라우드, 동시 출현 네트워크 분석, 계층적 군집분석, 감정 분석, 문서 요약, 문서 검색 서비스 기능까지만 살펴보겠습니다.
1. 무료 회원 가입
먼저 User Local(ユーザーローカル)에서 제공하는 텍스트 마이닝 AI 서비스를 무료로 이용하기 위해서는 다음과 같은 회원 가입이 필요합니다. User Local 웹사이트로 이동하고, 웹사이트 우측 상단의 신규 가입이라는 아이콘을 클릭합니다. 그럼 아래 이미지와 같은 계정생성 정보등록 페이지로 이동하게 됩니다. 한국어를 일본어로 변환하는 웹서비스 등을 이용하여 빈칸을 채워줍니다. 아래 이미지의 각 기입 순서는 이름 > 회사명 > 부서 > 비밀번호 > 비밀번호 확인 순입니다. 이용자가 학생인 경우에는 재학중인 학교명과 전공명을 기입해도 됩니다.
2. 샘플 텍스트 데이터 불러오기
신규 계정을 생성하고 나면, 아래 이미지처럼 우측 상단에 서비스 로그인 아이콘이 생성됩니다. 또한 User Local(ユーザーローカル) 에서 제공하는 샘플 데이터를 활용하여 자동 일본어 텍스트 마이닝 서비스를 경험해 볼 수 있습니다. 아래 이미지처럼 메뉴 하단에 샘플(サンプル) 원고를 클릭합니다. 그러면 User Local(ユーザーローカル)에서 제공하는 워드클라우드 등 다양한 텍스트 마이닝 서비스들을 무료로 이용 및 확인할 수 있습니다.
3. 워드클라우드
User Local(ユーザーローカル)이 제공하는 워드클라우드의 특징은 품사별로 단어의 색깔이 다르게 구현된다는 점입니다. 먼저 명사는 파란색, 동사는 빨간색, 형용사와 형용동사는 초록색을 각각 의미합니다. 마지막으로 완성된 워드클라우드는 이미지 하단의 다운로드 버튼을 클릭하여 내 컴퓨터로 내려받을 수 있습니다.
4. 동시 출현 네트워크 분석
각 품사별로 구분된 단어들이 동시 출현 정도를 네트워크 그래프로 구현한 결과를 제시해 줍니다. 동시 출현 네트워크 분석 결과 이미지 우측 상단에 동시 출현 횟수 다운로드(共起回数を ダウンロード)를 클릭하면, 각 단어 별 동시 출현 분석 결과를 확인할 수 있습니다. 예제 파일의 분석 결과는 이미지 하단에 파일로 업로드해 둘 테니 참고하기 바랍니다.
5. 계층적 군집분석
단어 간의 출현 경향이 유사(가로축의 숫자)한 단어들을 수형도로 구현한 것으로 그룹 간 차이는 색상으로 구분합니다. 즉 같은 색의 단어는 가까운 군집에 속한다고 할 수 있습니다(상세 설명은 이쪽을 클릭!).
6. 감정 AI 분석
두 번째 서비스 메뉴는 감정분석입니다. 전체 문서를 분석하고 감정의 추세를 시각적으로 제시해 줍니다. 먼저 다음 이미지는 감정분석 결과의 요약입니다. 긍정적인 감정의 문장비율은 초록색으로 부정적인 경우는 빨간색으로 중립인 경우는 회색으로 표시됩니다. 또한 5가지의 감정(기쁨, 좋음, 슬픔, 두려움, 분노) 크기를 레이더 그래프 형태로 제시해 줍니다.
이 외에도 다음 이미지처럼 문서의 시작(왼쪽)부터 끝(오른쪽)까지 분할 및 분석하여 감정 기복의 추이를 시각화하여 제시해 줄 수도 있습니다. 해당 감정의 정도가 클수록 영역의 증폭이 커집니다.
7. AI 문서 요약
세 번째 서비스 메뉴는 AI 문서 요약입니다. 챗 GPT API를 이용하여 분석할 문서의 주요 내용을 요약할 수 있습니다. 아래 이미지처럼 초록색 버튼을 클릭하면, 챗 GPT에 의한 요약 서비스가 시작됩니다. 이 외에도 3줄, 5줄 및 10줄 요약도 별도 가능합니다.
8. 본문 검색
마지막 네 번째 서비스 메뉴는 베타 서비스 중인 본문 검색 서비스입니다. 특정 단어(여기서는 大丈夫)를 입력창에 입력한 후, 돋보기 아이콘의 찾기 버튼을 클릭하면, 해당 단어(大丈夫)와 연관된 워드클라우드 분석 결과와 동시 출현 네트워크 분석 결과를 확인할 수 있고, png 등의 파일로 내려받을 수 있습니다.
9. 정리
이번 포스팅에서는 무료로 일본어 텍스트 마이닝 웹 서비스를 제공하는 User Local(ユーザーローカル) 웹사이트의 신규 계정 생성 방법과 User Local(ユーザーローカル)에서 제공하는 샘플 데이터를 활용하여 "하나의 문서를 분석" 하는 카테고리 서비스를 중심으로 구체적으로 어떤 텍스트 마이닝 서비스가 제공되는지 정리해 보았습니다. 다음 포스팅에서는 이어서 실제 아마존 재팬 고객 리뷰 스크래핑 자료를 활용하여 실습을 진행해보겠습니다.
이어서 다음 포스팅에서는 실제 아마존 재팬의 일본 고객 리뷰 데이터를 활용하여 User Local(ユーザーローカル) 사용 방법을 정리하겠습니다.
'교육' 카테고리의 다른 글
R 한글 텍스트 마이닝 (5) : 단어 문서 행렬 │cast_tdm 함수 │텍스트 네트워크 분석 (0) | 2023.10.31 |
---|---|
무료 일본어 AI 자동 텍스트 마이닝 사이트 사용법 (2) │아마존 재팬 고객 리뷰 분석 │User Local(ユーザーローカル) (0) | 2023.10.17 |
R 한글 텍스트 마이닝 분석 (4) : tidygraph와 ggraph │키워드 네트워크 분석 (0) | 2023.10.10 |
R 한글 텍스트 마이닝 (3) : TF - IDF (0) | 2023.10.03 |
R 한글 텍스트 마이닝 분석 (2) │품사 분석과 불용어 추가 전처리 (0) | 2023.10.01 |