본문 바로가기

교육

웹스크랩퍼 활용사례│텍스트데이터 자동수집│ 카자흐스탄 flip.kz 사례

웹스크랩퍼 활용사례│텍스트데이터 자동수집│카자흐스탄 flip.kz 사례

이번 포스팅은 웹스크랩퍼를 활용하여 고객 구매후기 혹은 사용후기와 같은 리뷰 혹은 댓글 등 텍스트데이터를 자동으로 수집할 수 있는 크롬익스텐션 사용법을 소개하고자 합니다. 구체적인 설치 및 사용법 설명에 앞서 우선 어떻게 사용하는지 아래 유튜트 동영상을 먼저 살펴보기 바랍니다. 

 

웹스크랩퍼를 사용하기 위해서는 크롬익스텐션 설치를 먼저 해야 합니다. 아래 그림을 참고하여 구글에서 먼저 web scraper를 검색한 후, 설치하면 됩니다. 이전 포스팅에서 크롬익스텐션 설치를 하였으므로 구체적인 설명은 생략합니다. 

 


구매자 사용후기를 수집할 웹사이트는 카자흐스탄의 화장품 전문온라인샵은 플립으로 해보겠습니다. 

카자흐스탄 최대 화장품 온라인 전문점, flip.kz


일단 아래와 같이 마스카라 화장품에 대한 구매후기가 있습니다. 웹스크래핑할 당시 총 287개 구매후기가 작성되어 있었습니다. 

 flip.kz 현지고객 구매후기 


웹스크랩퍼 설치가 완료되었다면, 먼저 도구더보기 > 개발자도구를 클릭하여 열겠습니다. 

webscraper 불러오기


그럼 아래 그림에서 보시는바와 같이 맨 오른쪽에 web scraper가 보입니다. 이를 클릭한 후, create new sitemap에서create sitemap을 클릭합니다.  

webscraper, 텍스트수집을 위한 sitemap 신규작성


그 다음 sitemap 이름을 적당히 기재한 후, 스크랩핑할 웹사이트 url을 복사하고, start URL에 붙여줍니다. 그리고 하단에 ADD new selector를 클릭합니다. 

webscraper, add new selector 클릭


수집대상 구매후기 혹은 사용후기와 같은 텍스트이므로 먼저 스크랩핑할 id를 적당히 기재합니다. 그 다음 type에서 text로 선택하고, 하단에 select를 누른 후, 상단에 구매후기 혹은 사용후기를 클릭하면 스크랩핑할 부분에 분홍색 블록이 나타나게 되고, 해당 블록을 클릭합니다. 

webscraper 텍스트파일을 수집하기위한 사전준비


구매후기와 같은 텍스트를 하나만 수집할 것이 아니므로 하단의 그림처럼 multiple을 클릭한 후, 두번째 구매후기를 클릭하면 이하 모든 구매후기가 자동으로 클립핑됨을 확인할 수 있습니다. 

webscraper 복수의 텍스트데이터 수집


텍스트데이터가 제대로 수집되었는지 Data Preview 를 클릭해서 확인하면, 아래 그림과 같이 총 287개 구매후기 혹은 사용후기 수집이 모두 완료되었음을 확인할 수 있습니다. 

webscraper, 총 287개 소비자 구매후기 수집완료

[웹스크랩퍼 동영상 튜토리얼 바로가기]

웹스크랩퍼 활용방법

그 외 좀 더 상세한 WebScraper 사용법은 아래 유튜브 동영상과 제작사의 동영상 튜토리얼에서 확인가능합니다. 위에 링크와 동영상 일부를 남겨두겠습니다. 관심있는 분들은 참고하면 되겠습니다.