무료로 이미지에 포함된 텍스트를 추출하는 서비스를 공유합니다. 흔히 광학 문자 인식(OCR, Optical Character
Recognitio)이라고 하는데요. Python 등을 활용해 직접 만들어 볼 수 있습니다만, 웹에서 무료로 그것도 클릭 몇 번으로 해당 서비스를 이용할 수 있어서 편리합니다.
1. 광학 문자 인식(OCR) 이란?
Amazon Web Services(AWS)에 따르면, 광학 문자 인식(OCR)은 텍스트 이미지를 기계가 읽을 수 있는 텍스트 포맷으로 변환하는 과정입니다. 예를 들어 양식 또는 영수증을 스캔하는 경우 컴퓨터는 스캔본을 이미지 파일로 저장합니다. 이미지 파일에서는 텍스트 편집기를 사용하여 단어를 편집, 검색하거나 단어 수를 계산할 수 없습니다. 그러나 OCR을 사용하면 이미지를 텍스트 문서로 변환하여 내용을 텍스트 데이터로 저장할 수 있습니다.
2. 이미지 내 텍스트 추출 방법
해당 서비스 소개를 보면, 광학 문자 인식을 사용하여 이미지, 스캔 한 문서 또는 인쇄된 PDF에서 텍스트를 추출한다고 되어 있네요. 추출하는 방법은 매우 간단합니다. 우선 해당 웹사이트로 이동합니다. 그 다음 아래 그림처럼 이미지를 끌어온 후, 로봇이 아닙니다. 확인 후, Convert를 클릭하면 이미지 내 텍스트 추출이 실행됩니다.
실행이 완료되면, 다음 그림처럼 이미지에서 추출된 텍스트가 나타납니다.
3. 정리
상품 상세 페이지 등을 만들다 보면, 오늘 정리한 이미지 텍스트 추출하는 방법이 필요한 경우가 있으니 유용하게 활용하셨으면 합니다.
'정보' 카테고리의 다른 글
텍스트 마이닝 토픽분석 키워드 네트워크 분석 │국내 연구 동향 │2002년-2022년 (0) | 2023.01.13 |
---|---|
픽셀 깨지지 않게 이미지 확대 하는 방법 │waifu2x.udp.jp (0) | 2023.01.12 |
립밤 말차 허브티 등 가성비 선물 추천│ 2,000원 미만의 아마존 구매 가능 선물 │ strategist (0) | 2023.01.06 |
한 살 생일 장난감 선물 5 選(feat, ChatGPT와 아마존 US) (0) | 2023.01.05 |
일본 현지 추천 한국 비건 스킨케어 브랜드 5選 모음 (0) | 2023.01.04 |