이미지의 필기 입력 감지

광학 문자 인식(OCR)으로 필기 입력 감지

Vision API는 이미지에서 텍스트를 감지하고 추출할 수 있습니다.

  • DOCUMENT_TEXT_DETECTION은 이미지(또는 파일)에서 텍스트를 추출하지만, 응답이 밀집 텍스트와 문서에 맞게 최적화됩니다. JSON은 페이지, 블록, 단락, 단어, 줄바꿈 정보를 포함합니다.

    OCR 시스템이 텍스트를 식별하고 추출하는 방식을 시뮬레이션한 스크린샷으로, 제목, 단락, 아이콘이 강조 표시되어 있습니다.

    DOCUMENT_TEXT_DETECTION의 한 가지 구체적인 용도는 이미지에서 필기 입력을 감지하는 것입니다.

    Google Cloud Platform이 필기체로 쓰여진 줄무늬 종이

직접 사용해 보기

Google Cloud를 처음 사용하는 경우 계정을 만들어 실제 시나리오에서 Cloud Vision API의 성능을 평가할 수 있습니다. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.

Cloud Vision API 무료로 사용해 보기

문서 텍스트 감지 요청

Google Cloud 프로젝트 및 인증 설정