이번 포스팅은 User Local(ユーザーローカル)을 이용하여 일본어 고객 리뷰를 자동 텍스트 마이닝 분석해 봅니다. 예제로 사용할 리뷰는 지난 포스팅에서 사용했던 아마존 재팬의 유기농 립스틱 상품이며, 코딩하지 않고 아마존 리뷰를 수집하는 방법은 다음 포스팅을 참고하기 바랍니다.
1. 로그인 및 분석 파일 업로드
지난 첫번째 포스팅을 참고하여 User Local(ユーザーローカル)의 로그인을 먼저 합니다. 그리고 "해석하고 싶은 파일을 입력한다(解析したい テキスト を入力する)" 에서 한 개의 문서를 분석(1つの文書を解析) 그리고 두 번째 서브 메뉴인 파일 업로드(ファイル を アップロード)를 클릭합니다. 그리고 준비한 아마존 재팬의 유기농 립스틱 상품 리뷰를 업로드합니다. 파일 업로드가 완료된 후에는 입력창 하단의 텍스트마이닝 실행(テキストマイニング する) 버튼을 클릭하면, 자동으로 고객 리뷰 분석이 실행됩니다. 연습용 아마존 재팬 고객 리뷰 엑셀 파일도 업로드해 두겠습니다.
2. 분석 결과 : 워드클라우드
분석 결과는 워드클라우드, 품사별 단어출현빈도, 동시 출현 네트워크 분석, 2차원맵, 품사별 관계 해석(係り受け解析), 계층적 군집분석 순서로 자동 도출됩니다. 먼저 워드클라우드 분석 결과는 다음과 같습니다. 분석결과에 따르면, 보습력(湿る), 발색(発色), 사용법(塗りやすい, 使いやすい), 유기농(オーガニック) 등 관련 상품 특성에 대한 단어들을 중심으로 워드클라우드가 구현되었음을 알 수 있습니다. 또한 워드클라우드 분석결과처럼 플롯팅 된 이미지 상단에 마우스 커서를 올려놓으면 해당 이미지를 png, svg 등의 확장자를 가진 파일을 내 컴퓨터로 내려받을 수 있습니다.
3. 분석 결과 : 단어 출현 빈도
단어들의 출현 수준을 나타내며, 분석 결과는 엑셀 파일 등으로 내려받을 수도 있습니다. 지난 포스팅에서 설명한 바와 같이 단어들의 품사별로 각 단어들의 색상이 다르게 표시됩니다. 분석 파일은 엑셀로 내려받을 수 있고, 실제로 내려받은 파일도 업로드해 두겠습니다.
4. 분석 결과 : 2차원 맵
출현경향이 유사한 단어들은 가깝게 맵핑한 후, 해당 단어들은 같은 색으로 그룹화하여 구현합니다. 분석 결과 역시 내려받을 수 있습니다.
5. 분석 결과 : 품사별 관계 해석(係り受け解析)
각 품사별도 대응하여 관계를 해석합니다. 해당 분석을 통해 특정 단어의 의미를 좀 더 분명히 이해할 수 있게 됩니다. 가령, 「高い(높음)」→「高くない(높지 않다)」)처럼 관계 해석을 통해 전혀 다른 해석 결과를 얻을 수도 있습니다. 분석 결과인 아래 이미지를 보면, 명사인 色味(색감)과 형용사인 可愛い(귀여워)가 대응되어 해당 립스틱 색감에 대한 고객들의 반응을 알 수 있게 됩니다. 이처럼 User Local(ユーザーローカル)에서는 명사-형용사 외에도 명사-동사, 명사-명사의 관계 해석 결과를 자동 제시해 줍니다.
6. 분석 결과 : 계층적 군집분석
이전 포스팅에서도 이야기했습니다만, 각 단어 간에 출현하는 경향이 비슷한 단어들을 같은 색상으로 군집화하여 제시함으로써 고객 리뷰의 주요 내용들을 추론해 볼 수 있습니다.
7. 분석 결과 : 감정 분석
해당 상품에 대한 고객 리뷰 감정분석 결과를 요약하면 다음과 같습니다. 긍정(초록색)적 비중이 20.2%, 부정(붉은색)적 비중이 20.2%를 차지하고 있어 감정분석을 통해 고객들의 반응을 엿볼 수 있습니다.
8. 분석 결과 : 문서 요약
해당 상품 고객 리뷰는 챗 GPT 서비스를 이용하여 요약해줍니다. 아래 그림은 해당 상품 고객 리뷰를 요약한 것으로 해석 결과는 다음과 같습니다.
この文章は、ある商品の レビュー です。 レビュー では、商品の使用感や効果、香りなどが述べられています。一部の人は商品の硬さや伸びに不満を持っているようですが、色味や保湿力には満足している人もいます。 また、オーガニック の成分や カラーリップ の特徴についても言及されています。全体的には、好みや肌質によって評価が分かれるようです。
이 글은 한 제품의 리뷰입니다. 리뷰에는 제품의 사용감, 효과, 향 등에 대한 내용이 담겨 있다. 일부 사람들은 제품의 경도와 신축성에 대해 불만을 표시하고 있지만, 색감과 보습력에는 만족하는 사람들도 있다. 또한, 유기농 성분과 컬러 립스틱의 특징에 대해서도 언급하고 있다. 전반적으로 취향과 피부 타입에 따라 평가가 엇갈리는 것 같다.
이 글은 한 제품의 리뷰입니다. 리뷰에는 제품의 사용감, 효과, 향 등에 대한 내용이 담겨 있다. 일부 사람들은 제품의 경도와 신축성에 대해 불만을 표시하고 있지만, 색감과 보습력에는 만족하는 사람들도 있다. 또한, 유기농 성분과 컬러 립스틱의 특징에 대해서도 언급하고 있다. 전반적으로 취향과 피부 타입에 따라 평가가 엇갈리는 것 같다.
9. 분석 결과 : 하이라이트
문서 요약 기능 중 하이라이트 기능도 있습니다. 아래 이미지처럼 문서에서 중요한 부분을 강조하여 표시합니다. 다음 결과는 하이라이트 중 "히트맵"으로 하이라이트를 구현한 결과입니다.
이 외에도 "마커", "모노톤"이라는 서비스 기능도 있습니다. 그 중 우선 "마커" 표시 기능은 중요한 부분을 빨간색으로 강조 표시합니다. "히트맵" 표시의 경우에는 빨강(중요도 높음), 노랑(중요도 중간), 파랑(중요도 낮음)으로 문장의 중요도를 색으로 구분하여 표시합니다. '모노톤' 표시에서는 중요한 부분의 문장일수록 진하고 크게 표시합니다.
'교육' 카테고리의 다른 글
빗썸 관심도 변화 │구글 레이싱 라인 그래프 암호화폐(BTC ETH XRP LUNA) │Flourish (0) | 2023.11.14 |
---|---|
R 한글 텍스트 마이닝 (5) : 단어 문서 행렬 │cast_tdm 함수 │텍스트 네트워크 분석 (0) | 2023.10.31 |
AI 자동 무료 텍스트 마이닝 일본어 사이트 사용법 (1)│ユーザーローカル (0) | 2023.10.16 |
R 한글 텍스트 마이닝 분석 (4) : tidygraph와 ggraph │키워드 네트워크 분석 (0) | 2023.10.10 |
R 한글 텍스트 마이닝 (3) : TF - IDF (0) | 2023.10.03 |