텍스트 마이닝 썸네일형 리스트형 N-Gram 댓글 분석 │R 한글 텍스트 마이닝 │어린이 자외선 차단제 선크림 N-Gram은 말 그대로 N개의 연속적인 단어들의 나열을 뜻합니다. 코퍼스에서 N개의 단어로 나누고 이를 하나의 토큰으로 간주합니다. 여기서 N이 한 개 일 때는 유니그램(unigram), 두 개일 때는 바이그램(bigram, 세 개일 때는 트라이그램(trigram)이라고 하는데요. 이번 포스팅에서는 어린이 자외선 차단제 댓글들을 이용하여 N-Gram 분석 방법과 결과를 각각 정리하여 공유하겠습니다. 물론 분석에 이용한 댓글들과 R 한글 텍스트 마이닝 코드는 포스팅 하단에 업로드해 두었습니다. 관심 있는 분들은 각각 내려받은 후, 순서대로 따라 해 보시기 바랍니다. 어린이 자외선 차단제 선크림 선블록│댓글 분석 │LDA 토픽 모델링 │R 한글 텍스트 마이닝지난 포스팅에서는 어린이 자외선 차단제 댓글들을.. 더보기 KHCoder 업데이트 공지 │서비스 유료화 │2024년 2월 28일 기준 KHCoder를 한동안 사용하질 않아서 모르고 있었습니다만, 오늘 우연히 확인할 일이 있어서 웹사이트를 방문하고 나서야 최근 서비스 유료화 공지 내용을 확인할 수 있었습니다. 2024년 2월 28일 공지되었는데요. 시간이 다소 경과는 하였으나, KHCoder 서비스 유료화 업데이트 공지 내용을 정리하여 공유하겠습니다. 이후 KHCoder를 사용하시는 분들은 참고하시기 바랍니다. KHCoder 활용 한글, 영어 , 일본어 등 다국어 텍스트 마이닝 분석 안내제 강의용 블로그에 올라온 KHCoder 활용순서(한글, 영어, 일본어 등 다국어 텍스트 마이닝)를 아래와 같이 순서대로 정리해서 말씀드리겠습니다. 그날그날 강의 목적에 따라 작성하다 보니 포스e-datanews.tistory.com 1. 무료 테스트.. 더보기 R 한글 텍스트 마이닝 분석 (4) : tidygraph와 ggraph │키워드 네트워크 분석 R을 이용한 한글 텍스트 마이닝 분석 다섯 번째 포스팅 주제는 tidygraph와 ggraph를 이용한 키워드 네트워크 분석입니다. 이전에 활용한 네이버의 생성형 AI 서비스 큐 보도자료를 계속 인용하겠습니다. 실습할 R 코드는 포스팅 하단에 올려두었습니다. R 한글 텍스트 마이닝 (3) : TF - IDF R을 이용한 한글 텍스트 마이닝 세 번째 포스팅은 TF-IDF입니다. TF-IDF 개념은 이전 포스팅에서도 많이 언급했습니다. 주요 개념은 다음 포스팅 등을 참고하기 바랍니다. 단어 빈도-역문서 빈도 분 e-datanews.tistory.com 1. 패지키 로딩, 작업 폴더 지정, 엑셀 데이터 호출 및 데이터 전처리 분석에 필요한 R 패지키 로드, `setwd` 함수를 이용한 작업 폴더 지정("C:/.. 더보기 R 한글 텍스트 마이닝 (3) : TF - IDF R을 이용한 한글 텍스트 마이닝 세 번째 포스팅은 TF-IDF입니다. TF-IDF 개념은 이전 포스팅에서도 많이 언급했습니다. 주요 개념은 다음 포스팅 등을 참고하기 바랍니다. 단어 빈도-역문서 빈도 분석(TF-IDF) 개념과 계산 방법│ChatGPT의 오류, 영혼 없는 사과 단어빈도-역문서빈도(Term Frequency-Inverse Document Frequency: 이하 TF-IDF) 분석은 전처리와 토큰화 이후 분석할 텍스트 데이터를 탐색하는 가장 기초적인 분석 단계입니다. 이번 포스팅에서는 TF-IDF의 개 e-datanews.tistory.com 또한 분석 예제 파일도 이전 포스팅에서 다루었던 파일을 계속 사용하겠습니다. 앞서 정리했던 주제들은 윈도 11 기준 KoNLP 설치 방법부터 품사분석.. 더보기 R 한글 텍스트 마이닝 분석 (2) │품사 분석과 불용어 추가 전처리 이번 포스팅은 SimplePos09 함수를 이용하여 명사를 추출하고, 추가적인 불용어 처리 방법을 정리합니다. 분석에 활용할 텍스트 데이터 지난 포스팅에서 사용했던 네이버의 생성형 AI 서비스 큐에 대한 보도자료를 계속 이용하겠습니다. R 코드는 포스팅 하단에 업로드해 두었습니다. R 한글 텍스트 마이닝 │네이버 생성형 AI 큐 국내 보도자료 분석│엑셀 데이터 호출 및 빈도분석 지난 포스팅에서 한글 텍스트 마이닝 분석을 위한 KoNLP 설치하는 방법까지 설명하였습니다. 이어서 테스트도 할 겸 엑셀의 텍스트 데이터를 호출하고, 빈도 분석까지 간단히 정리해 보겠습니다. e-datanews.tistory.com 01. 로딩 분석에 필요한 라이브러리를 로딩합니다. 더보기 library(tidyverse) lib.. 더보기 도지코인 │NewsAPI│R과 Voyant-tools 분석 비교 특정 해외 뉴스 키워드(도지코인)를 활용하여 News API에서 텍스트 데이터를 수집한 후, R과 Voyant-tools를 이용하여 분석 결과를 비교합니다. 2개 이상의 URL을 동시 입력한 후, 텍스트 데이터 자동 추출 및 텍스트 마이닝을 실행할 수도 있으니, News API를 이용한 데이터 수집 후, 활용해 보는 것도 좋겠습니다. 도지코인 PPT 자동 생성하는 ChatGPT 기반 TOME AI 서비스 도지코인 같은 특정 키워드를 프롬프트에 입력하는 것만으로 PPT를 자동 생성하는 TOME AI 서비스 사용법을 정리하는 포스팅입니다. 서비스 과금 정책이 이번 달부터 변경되어 다소 아쉽기는 합니 e-datanews.tistory.com 1. NewsAPI, 키워드 활용 해외 뉴스 데이터 수집 News A.. 더보기 이전 1 다음