구글 바드를 웹스크랩핑 코드 요청과 이를 활용한 실제 웹스크랩핑을 구현해 보는 포스팅입니다. 웹스크랩 핑할 페이지는 위키 문서의 AI 역사에 관한 텍스트 데이터입니다.
구글 바드 R 웹스크랩핑 영상
다음 영상은 구글 바드에게 웹스크랩핑 R 코드를 요청하고, 바드가 알려준 R 코드를 실행하여 텍스트 데이터를 가져오는 영상입니다. 영상에서도 설명하고 있습니다. 구글 바드는 총 3가지의 답변을 합니다만, 첫 번째 답변 결과를 이용한 웹스크랩핑은 실패했고, 두 번째와 세 번째 R 코드는 실행이 잘 되었습니다. 관련 R 코드는 아래 본문에 업로드해 두겠습니다.
두 번째 웹스크랩핑 R 코드
구글 바드가 알려준 두 번째와 세 번째 웹스크랩핑 코드 캡처 이미지입니다. 첫 번째 코드는 생략하고, 두 번째와 세 번째 코드는 아래와 같습니다.
library(rvest)
# 스크랩할 웹 사이트의 URL을 설정합니다.
url <- "https://en.wikipedia.org/wiki/Artificial_intelligence"
# 웹 페이지를 읽습니다.
page <- read_html(url)
# 텍스트를 추출합니다.
text <- page %>%
html_nodes("body > p") %>%
html_text()
# 텍스트를 콘솔에 인쇄합니다.
print(text)
세 번째 웹스크랩핑 R 코드
library(rvest)
# 웹 페이지를 읽습니다.
url <- "https://en.wikipedia.org/wiki/Artificial_intelligence"
page <- read_html(url)
# 텍스트를 추출합니다.
text <- page %>%
html_nodes("body") %>%
html_text()
# 텍스트를 출력합니다.
cat(text)
오늘 포스팅에서는 구글 바드 사용 사례 중 웹페이지의 텍스트 데이터를 웹스크랩핑하는 프롬프트에 관하여 정리하였습니다. 관련하여 다양한 R 코딩 응용이 가능할 것으로 생각되는데요. 다양한 아이디어를 활용하여 구글 바드에 접목시켜 보면 좋겠습니다.
'정보' 카테고리의 다른 글
AI 무료 이미지 온라인 편집 도구 추천 (0) | 2023.06.04 |
---|---|
무료 ChatGPT-4 챗 GPT4 공짜 사용법과 사용 후기 (feat.뤼튼) (0) | 2023.06.01 |
구글 바드 번역 │암호 화폐 최근 해외 뉴스 번역 및 한글 요약 후, 구글 문서로 내보내기 (0) | 2023.05.18 |
도지코인 PPT 자동 생성하는 ChatGPT 기반 TOME AI 서비스 (0) | 2023.05.09 |
실시간 일본에서 인기 높은 한국 선물 고르는 방법 3가지 │아마존재팬 라쿠텐 야후쇼핑 (0) | 2023.05.08 |