본문 바로가기

TF-IDF

R 한글 텍스트 마이닝 (3) : TF - IDF R을 이용한 한글 텍스트 마이닝 세 번째 포스팅은 TF-IDF입니다. TF-IDF 개념은 이전 포스팅에서도 많이 언급했습니다. 주요 개념은 다음 포스팅 등을 참고하기 바랍니다. 단어 빈도-역문서 빈도 분석(TF-IDF) 개념과 계산 방법│ChatGPT의 오류, 영혼 없는 사과 단어빈도-역문서빈도(Term Frequency-Inverse Document Frequency: 이하 TF-IDF) 분석은 전처리와 토큰화 이후 분석할 텍스트 데이터를 탐색하는 가장 기초적인 분석 단계입니다. 이번 포스팅에서는 TF-IDF의 개 e-datanews.tistory.com 또한 분석 예제 파일도 이전 포스팅에서 다루었던 파일을 계속 사용하겠습니다. 앞서 정리했던 주제들은 윈도 11 기준 KoNLP 설치 방법부터 품사분석.. 더보기
단어 빈도-역문서 빈도 분석(TF-IDF) 개념과 계산 방법│ChatGPT의 오류, 영혼 없는 사과 단어빈도-역문서빈도(Term Frequency-Inverse Document Frequency: 이하 TF-IDF) 분석은 전처리와 토큰화 이후 분석할 텍스트 데이터를 탐색하는 가장 기초적인 분석 단계입니다. 이번 포스팅에서는 TF-IDF의 개념과 계산 방법을 ChatGPT를 이용하여 정리합니다. 특히 ChatGPT를 이용한 코딩 공부 시, 유의사항도 함께 확인하기 바랍니다. ChatGPT 사용 후기│티스토리 글쓰기 정보 수집 2023년 첫 번째 블로그는 1주일 간 사용해 본 ChatGPT 후기입니다. 작년 12월 1일 ChatGPT이 첫 공개된 후, 다양한 활용 사례가 공유되고 있는데요. 이번 포스팅에서는 ChatGPT을 활용한 티스토리 같은 블 e-datanews.tistory.com R ChatGP.. 더보기
아마존FBA│요가복│미국 레깅스 소비자 고객평점별 핵심키워드 분석 아마존FBA│요가복│미국 레깅스 소비자 고객평점별 핵심키워드 분석 이번 포스팅은 2019년 하반기이후 미국 아마존 소비자들로부터 강력한 지지를 받고 있는 Colorfulkoala의 레깅스 품목을 살펴보는 한편, 구매후기를 이용한 간략한 텍스트마이닝 분석결과를 공유하고자 합니다. [상품개요] 우선 분석품목은 아래 그림에서 확인할 수 있는 바와 같이 아마존 미국의 여성스포츠레깅스, 여성요가바지, 여성애슬레틱 1위에 오른 제품으로 오늘까지 총 8,181명으로부터 평가를 받았습니다. 특히 총 8,181명의 82%가 평점 5점을 주고 있다는 점에서 매우 놀라운, 아니 매우 부러운 품목입니다. 이처럼 아마존미국 고객으로부터 엄청난 평가를 받고 있는 주요 요인 중 하나가 저렴한 상품가격인데요. 아래 그림에서 확인할 .. 더보기