본문 바로가기

품사 분석

R 한글 텍스트 마이닝 분석 (2) │품사 분석과 불용어 추가 전처리 이번 포스팅은 SimplePos09 함수를 이용하여 명사를 추출하고, 추가적인 불용어 처리 방법을 정리합니다. 분석에 활용할 텍스트 데이터 지난 포스팅에서 사용했던 네이버의 생성형 AI 서비스 큐에 대한 보도자료를 계속 이용하겠습니다. R 코드는 포스팅 하단에 업로드해 두었습니다. R 한글 텍스트 마이닝 │네이버 생성형 AI 큐 국내 보도자료 분석│엑셀 데이터 호출 및 빈도분석 지난 포스팅에서 한글 텍스트 마이닝 분석을 위한 KoNLP 설치하는 방법까지 설명하였습니다. 이어서 테스트도 할 겸 엑셀의 텍스트 데이터를 호출하고, 빈도 분석까지 간단히 정리해 보겠습니다. e-datanews.tistory.com 01. 로딩 분석에 필요한 라이브러리를 로딩합니다. 더보기 library(tidyverse) lib.. 더보기
무료 코딩 없는 웹스크래핑 텍스트 마이닝 데이터 시각화│일본 유기농 립스틱 아마존 재팬 현지 고객 리뷰 사례 분석 무료로 코딩 없이 웹스크래핑 도구인 DataMiner와 KH Coder3을 이용하여, 실제 아마존 재팬에서 판매 중인 일본산 유기농 립스틱 고객 리뷰 분석 사례를 정리해 보겠습니다. 1. 무료 웹스크래핑, DataMiner 무료로 웹스크래핑이 가능한 도구들이 많이 있고, 이전 포스팅에서도 몇 가지 무료 웹스크래핑 도구 사용법들을 소개 한 바 있는데요. 이번 포스팅에서는 새로운 무료 웹스크래핑 도구인 DataMiner를 이용합니다. 정확하게는 한 달에 500페이지까지만 무료이며, 그 이상 사용하는 경우에는 과금이 됩니다. 자세한 사항은 과금 정보는 해당 링크를 통해 확인하기 바랍니다. 또한 구체적인 사용방법은 DataMiner에서 제공하는 아래 유튜브 튜토리얼 영상을 참고하기 바랍니다. DataMiner .. 더보기
KH Coder3 텍스트 데이터 호출 │전처리 실행 │형태소 품사 분석 │동시출현네트워크분석 이번 포스팅에서는 2개 이상의 문서, 텍스트(. txt) 파일의 데이터를 호출한 후, 전처리 실행 방법, 형태소 및 품사 분석, 동시 출현 네트워크 분석을 간단히 구현해 보겠습니다. 1. 두 개 이상의 문서 준비 KHCoder3 폴더내 test라는 새로운 폴더를 만들고, 아래 test01, test02, test03 파일을 test 폴더에 각각 저장합니다. text01, 인하대학교 국제통상학과에 재학중입니다. text02, 인하대학교 공학대학원에 재학중입니다. text03, 인하대학교는 인천에 있습니다. 2. 텍스트 데이터 호출하기 KH Coder3를 실행시킨 후, 상단 메뉴에서 project > import > Multiple texts in a fold를 클릭합니다. 새 창이 뜨면 browse 버튼을.. 더보기