본문 바로가기

분석

쇼피(Shopee) 웹스크래핑 │웹페이지 긁어오기│No Coding │ParseHub 소개

쇼피(Shopee) 웹스크래핑 │웹페이지 긁어오기│No Coding │ParseHub 소개 

 

R 이나 Python 을 이용하지 않고 내가 원하는 웹페이지의 정보를 긁어올 수 있다면, 그것도 무료로 이용할 수 있는 서비스가 있다면, 한 번 해볼만하지 않을까 싶다. 
이번 포스팅에서는 쇼피(shopee) 웹스크래핑을  실행한다. 다만 코딩없이 웹스크래핑 할 수 있는 parsehub를 통해 실행해본다. 관심있는 분들은 우선 프로그램을 설치한 후, parsehub 에서 제공하는 여러가지 튜토리올을 학습해보기를 권한다. parsehub 설치방법은 매우 간단한데, 유튜브 영상도 참고하기 바란다. 참고로 유튜브 영상에서는 프로그램 설치와 특히 쇼피(shopee) 싱가폴의 리스팅 페이지의 상품명, 가격, 판매량 등을 웹스크래핑하는 테스트영상을 포함한다. 

쇼피(Shopee) 웹스크래핑 │웹페이지 긁어오기│No Coding │ParseHub 소개

 

 

parsehub 첫화면에 프로그램을 다운로드 버튼을 클릭하면, 설치안내 페이지로 이동한다. 

웹스크래핑 할 수 있는 페이지 분량과 시간이 제한되어 있기는 하나, 무료로 해당 서비스를 이용할 수 있다는 점을 감안하면 나쁘지 않다. 

프로그램 설치가 끝나면, 본인의 컴퓨터 바탕화면에 바로가기 아이콘이 설정되었을 것이고, 해당 아이콘을 클릭한 후, 본인 메일주소와 비밀번호를 입력하면, 위 그림과 같은 메인페이지가 나타난다. 여기서 실제로 테스트를 진행할 때는 유튜브영상에도 있지만 New Projcet 를 클릭하고, 웹스크래핑할 페이지를 불러오면 된다. 하지만 본격적인 사용전에 화면 오른쪽에 있는 여러가지 interactive tutorials 을 이용해보기를 권한다. 좀 더 빠르게 parsehub를 익힐 수 있다. 

여러가지 tutorials 중에 기본편은 반드시 연습해볼 필요가 있다. 위 그림처럼 화면 왼쪽하단에 parsehub 사용법을 따라서 할 수 있는 작은 팝업창이 생성되므로 해당 팝업창의 안내에 따라 parsehub 을 진행하면 된다. 

화면 하단에 생성된 팝업창의 안내에 따라 Next 등의 버튼을 클릭하게 되면 메인 화면에 웹스크래핑 절차들이 반전되며, 반전된 버튼 등을 클릭하면 그 다음 절차들이 순서대로 진행된다. 만일 사용자가 올바르게 진행절차를 따르지 않게 되면, 화면 하단 팝업창이 다소 요란하게 흔들리는데 처음에 살짝 신경이 거슬릴 수도 있다는 점은 사전에 알려둔다.

일단 코딩없이 웹스크래핑을 진행할 수 있는 프로그램 혹은 서비스는 많이 있으나, 개인적으로 이번 포스팅에서 소개한 paesehub 서비스가 가장 직관적이며, 편리하다고 생각한다. 유튜브 영상의 쇼피(shopee) 웹스크래핑 테스트 영상에서도 볼 수 있는 바와 같이 스크래핑 대상 객체를 마우스로 클릭하고, 이를 선으로 계속 연결하여 본인이 원하는 대상을 스크래핑하는 아이디어가 parsehub 서비스의 가장 압권이 아닌가 싶다. 

다음 포스팅에서는 이번 포스팅에 이어서 쇼피(shoppee) 웹스크래핑을 이어간다.  다만, 첫페이지뿐만 아니라 다음 페이지를 자동으로 넘기고, 웹스크래핑하는 방법을 소개하는 포스팅을 준비할 예정이다. 

이어서 보기 클릭 ☞ [카드뉴스] 쇼피 웹스크래핑 │쇼피 웹 크롤링│페이지 자동 넘기기 │빅데이터무역교육│paginating│How to Use ParseHub

이어서 보기 클릭 ☞ 무료 웹스크래핑 웹크롤링 프로그램 Parsehub 사용법 │아마존 미니어처하우스 인형의집 고객 구매후기 자동수집

이어서 보기 클릭 ☞ 아마존FBA│요가복│미국 레깅스 소비자 고객평점별 핵심키워드 분석

이어서 보기 클릭 ☞ 왼손잡이 선물 추천 │아마존 고객 구매후기 │텍스트마이닝 │감성분석 │Left Handed Gifts │Analyzing Review of Amazon Customer │Focusing on Text mining Analysis

이어서 보기 클릭 ☞ 이미지 한번에 다운로드 │노! 코딩!!│FATKUN