Optical Character Recognition (OCR) is a foundational technology behind the conversion of typed, handwritten or printed text from images into machine-encoded text.

What types of OCR does Google Cloud offer?

Google Cloud offers two types of OCR: OCR for documents and OCR for images and videos. Document AI is a document understanding platform optimized for document processing (powered by GenAI). Cloud Vision is commonly used to detect text, handwriting, and a wide range of objects from images and videos.

How does OCR work at Google Cloud?

Google Cloud powers OCR with best-in-class AI. It goes beyond traditional text recognition by understanding, organizing, and enriching data to generate business-ready insights. You can use the tools as a unified suite (e.g., Document AI) or call relevant APIs directly.

How Google Cloud AI and OCR work together?

All OCR solutions give you access to pre-trained ML models that you can deploy immediately or uptrain for specific needs. You can also train custom models using AutoML without needing machine learning expertise.

Which OCR solution is right for me?

If you want to analyze a document or build a processing pipeline, use Document AI. If you want to analyze and process images, use Cloud Vision. Both APIs are free to try with a Google Cloud account.

Gemini Enterprise Agent Platform에서 추론, 코딩, 멀티모달을 이해하는 데 가장 적합한 모델인 Gemini 3 사용해 보기

OCR(광학 문자 인식)

세계적 수준의 Google Cloud AI를 통한 OCR(광학 문자 인식)

이미지 및 문서에서 텍스트 및 데이터를 추출하고, 구조화되지 않은 콘텐츠를 비즈니스에서 사용할 수 있는 구조화된 데이터로 변환하고, 유용한 정보를 얻을 수 있습니다.

API를 통해 OCR 기능을 애플리케이션에 통합합니다.

신규 고객에게는 가입 시 문서 요약 OCR 솔루션에 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.

개요

OCR이란 무엇인가요?

광학 문자 인식(OCR)은 이미지에서 입력되거나 필기 또는 인쇄된 텍스트를 머신으로 인코딩된 텍스트로 변환하는 데 사용되는 기본 기술입니다.

Google Cloud는 어떤 유형의 OCR을 제공하나요?

Google Cloud는 문서용 OCR과 이미지 및 동영상용 OCR이라는 두 가지 유형의 OCR을 제공합니다.

기본 기술을 공유하지만, Document AI는 문서 처리에 최적화된 문서 이해 플랫폼입니다. 커스텀 추출기는 생성형 AI를 기반으로 하며, 전문 프로세서를 선택할 필요 없이 일반 문서와 분야별 문서를 모두 더 정확하고 빠르게 처리합니다.

Cloud Vision은 이미지와 동영상의 텍스트, 필기 입력, 다양한 객체를 감지하는 데 일반적으로 사용됩니다.

Google Cloud에서 OCR은 어떻게 작동하나요?

Google Cloud는 동급 최고의 AI로 OCR을 지원합니다. 데이터 이해, 구성, 보강으로 기존 텍스트 인식을 뛰어넘어 궁극적으로 비즈니스에 필요한 유용한 정보를 얻을 수 있습니다.

OCR 도구를 효율성을 위해 간소화된 통합 도구 모음(예: Document AI)으로 사용하거나 Google Cloud 콘솔에서 직접 사용할 수 있는 관련 API를 호출하여 OCR 기능을 애플리케이션에 통합할 수 있습니다.

동영상

Document AI란?

4:36

Google Cloud AI와 OCR은 어떻게 함께 작동하나요?

위에서 언급한 모든 OCR 솔루션을 사용하면 API를 통해 즉시 배포하거나 업트레이닝을 통해 특정 요구사항에 대한 정확성을 개선할 수 있는 선행 학습된 ML 모델에 액세스할 수 있습니다.

AutoML을 사용하면 머신러닝 전문 지식이 없어도 자체 커스텀 모델을 학습시킬 수 있습니다.

커스텀 ML 모델 빌드에 대한 AutoML 문서를 확인하세요.

동영상

AutoML을 사용해 ML 모델을 빌드하고 학습시키는 시기 및 방법

2:11

어떤 OCR 솔루션이 나에게 적합한가요?

문서를 분석하거나 자동화된 문서 처리 파이프라인을 빌드하려면 Document AI를 사용하세요. 문서 이해부터 추출된 데이터와 함께 문서 검색, 저장, 제어, 관리에 이르기까지 전체 워크플로를 한 곳에서 처리합니다.

이미지를 분석 및 처리하려면 다른 Google Cloud 제품과 함께 Cloud Vision을 사용하여 최상의 결과를 얻으세요. 세부정보 및 빠른 시작 가이드는 일반적인 용도 섹션을 참조하세요.

두 API 모두 Google Cloud 계정으로 무료로 사용해 볼 수 있습니다.

OCR 서비스 비교

OCR 서비스		권장 용도	주요 특징
Cloud Vision API		짧은 지연 시간과 높은 용량이 필요한 일반적인 텍스트 추출 사용 사례	이미지 라벨 지정, 얼굴 및 랜드마크 감지, OCR, 세이프서치와 같은 사전 빌드된 기능
Document AI	Enterprise Document OCR	문서(PDF, 이미지 형태의 스캔한 문서 또는 Microsoft DocX 파일)의 텍스트를 디지털화합니다.	200개 이상의 언어, 50개 이상의 필기 언어에서 텍스트를 추출합니다. 수학 공식, 스타일 등을 인식하는 부가기능을 제공합니다.
	Document AI Workbench	생성형 AI(파운데이션 모델)로 모든 문서 추출, 분류, 분할	커스텀 추출기: 파운데이션 모델을 사용하여 광범위한 데이터 라벨링이나 학습 없이 파서를 빠르게 생성합니다. 효율적인 처리를 위한 맞춤 분류 기준 및 문서 분할기입니다.
	선행 학습된 모델	도메인별 문서에서 텍스트 및 필드 추출	다양한 조달, 대출, ID, 계약 문서에서 텍스트를 추출하고 디지털화합니다.

Cloud Vision API

권장 용도

짧은 지연 시간과 높은 용량이 필요한 일반적인 텍스트 추출 사용 사례

주요 특징

이미지 라벨 지정, 얼굴 및 랜드마크 감지, OCR, 세이프서치와 같은 사전 빌드된 기능

Document AI

Enterprise Document OCR

권장 용도

문서(PDF, 이미지 형태의 스캔한 문서 또는 Microsoft DocX 파일)의 텍스트를 디지털화합니다.

주요 특징

200개 이상의 언어, 50개 이상의 필기 언어에서 텍스트를 추출합니다.

수학 공식, 스타일 등을 인식하는 부가기능을 제공합니다.

Document AI Workbench

권장 용도

생성형 AI(파운데이션 모델)로 모든 문서 추출, 분류, 분할

주요 특징

커스텀 추출기: 파운데이션 모델을 사용하여 광범위한 데이터 라벨링이나 학습 없이 파서를 빠르게 생성합니다.

효율적인 처리를 위한 맞춤 분류 기준 및 문서 분할기입니다.

선행 학습된 모델

권장 용도

도메인별 문서에서 텍스트 및 필드 추출

주요 특징

다양한 조달, 대출, ID, 계약 문서에서 텍스트를 추출하고 디지털화합니다.

작동 방식

문서를 이해하고 처리하려면 Document AI를 사용하세요.
이미지의 경우 Cloud Vision을 사용하는 것이 좋습니다.
두 가지 모두 API 또는 업트레이닝을 통해 있는 그대로 배포할 수 있는 선행 학습된 ML 모델에 대한 액세스 권한을 제공합니다. AutoML을 사용하면 머신러닝 전문 지식이 없어도 커스텀 모델을 처음부터 학습시킬 수 있습니다.
Cloud Vision 또는 문서 OCR을 사용하면 매월 처음 1,000개의 단위가 무료로 제공됩니다. API를 호출하기만 하면 됩니다.

Cloud Vision이 이미지를 인식하고 분류하는 방법

데모

내 문서를 사용하여 문서 OCR의 작동 방식 알아보기

간단한 드래그 앤 드롭으로 Document AI API를 사용해 보세요.

일반적인 용도

생성형 AI로 문서에서 텍스트 추출

Document AI로 미묘한 문서에서 유용한 정보 확보

기반 모델을 기반으로 하는 Document AI 커스텀 추출기는 문서에서 일반 및 분야별로 텍스트와 데이터를 더 빠르고 정확하게 추출합니다. 5~10개의 문서만으로도 쉽게 미세 조정하여 성능을 더욱 개선할 수 있습니다.

자체 모델을 학습시키려면 데이터 세트에 기반 모델로 자동 라벨을 지정하여 프로덕션 시간을 단축하세요.

선행 학습된 특수 프로세서를 사용할 수도 있습니다. 전체 프로세서 목록을 참고하세요.

25:47

방법

Document AI로 미묘한 문서에서 유용한 정보 확보

기반 모델을 기반으로 하는 Document AI 커스텀 추출기는 문서에서 일반 및 분야별로 텍스트와 데이터를 더 빠르고 정확하게 추출합니다. 5~10개의 문서만으로도 쉽게 미세 조정하여 성능을 더욱 개선할 수 있습니다.

자체 모델을 학습시키려면 데이터 세트에 기반 모델로 자동 라벨을 지정하여 프로덕션 시간을 단축하세요.

선행 학습된 특수 프로세서를 사용할 수도 있습니다. 전체 프로세서 목록을 참고하세요.

25:47

엔드 투 엔드 문서 솔루션 빌드

문서 처리 및 이해 파이프라인 빌드

생성형 AI를 기반으로 하는 Document AI는 다양한 레이아웃과 품질의 문서에서 데이터를 매우 정확하게 추출합니다. Cloud Storage와 연결하여 비정형 문서에 엔터프라이즈급 규정 준수를 적용할 수 있습니다. BigQuery는 추출된 데이터를 원하는 방식으로 일괄 처리하고 분석하는 데 도움이 됩니다. Looker를 사용하면 BigQuery 테이블을 기반으로 시각화를 쉽게 빌드할 수 있습니다. Gemini Enterprise 에이전트 플랫폼의 Agent Search를 사용하면 Cloud Storage의 문서를 대화형 또는 전통적인 방식으로 쿼리하고 검색할 수 있습니다.

여러 Google Cloud 제품을 사용하는 엔드 투 엔드 문서 솔루션의 참조 아키텍처

실무형 실습: Document AI 및 Cloud Functions를 사용한 엔드 투 엔드 데이터 캡처 파이프라인 빌드

표시된 것처럼 전체 파이프라인을 설정하는 데 60~90분이 소요되며, Document AI 부분에는 10분이 소요됩니다.

방법

문서 처리 및 이해 파이프라인 빌드

생성형 AI를 기반으로 하는 Document AI는 다양한 레이아웃과 품질의 문서에서 데이터를 매우 정확하게 추출합니다. Cloud Storage와 연결하여 비정형 문서에 엔터프라이즈급 규정 준수를 적용할 수 있습니다. BigQuery는 추출된 데이터를 원하는 방식으로 일괄 처리하고 분석하는 데 도움이 됩니다. Looker를 사용하면 BigQuery 테이블을 기반으로 시각화를 쉽게 빌드할 수 있습니다. Gemini Enterprise 에이전트 플랫폼의 Agent Search를 사용하면 Cloud Storage의 문서를 대화형 또는 전통적인 방식으로 쿼리하고 검색할 수 있습니다.

실무형 실습: Document AI 및 Cloud Functions를 사용한 엔드 투 엔드 데이터 캡처 파이프라인 빌드

표시된 것처럼 전체 파이프라인을 설정하는 데 60~90분이 소요되며, Document AI 부분에는 10분이 소요됩니다.

이미지 태그 지정, 처리, 검색

Cloud Vision API 및 AutoML을 사용하여 이미지에 태그 지정 및 처리

이미지 태그 지정을 이미지 라벨 지정이라고도 합니다.

Cloud Vision API는 이미지에서 일반 객체, 랜드마크, 위치, 로고, 활동, 동물 종, 제품 등을 식별하고 라벨을 지정할 수 있습니다. 이미지에 감지된 라벨로 태그를 지정하면 이미지 검색, 처리 및 관리가 자동화되어 훨씬 쉬워집니다.

타겟팅 커스텀 라벨이 필요한 경우 Cloud AutoML을 사용하여 커스텀 ML 모델을 학습시킵니다.

Google OCR 기술을 온프레미스로 사용하려면 Cloud Marketplace에서 제공하는 OCR On-Prem을 사용하세요.

방법

Cloud Vision API 및 AutoML을 사용하여 이미지에 태그 지정 및 처리

이미지 태그 지정을 이미지 라벨 지정이라고도 합니다.

Cloud Vision API는 이미지에서 일반 객체, 랜드마크, 위치, 로고, 활동, 동물 종, 제품 등을 식별하고 라벨을 지정할 수 있습니다. 이미지에 감지된 라벨로 태그를 지정하면 이미지 검색, 처리 및 관리가 자동화되어 훨씬 쉬워집니다.

타겟팅 커스텀 라벨이 필요한 경우 Cloud AutoML을 사용하여 커스텀 ML 모델을 학습시킵니다.

Google OCR 기술을 온프레미스로 사용하려면 Cloud Marketplace에서 제공하는 OCR On-Prem을 사용하세요.

추가 리소스

가격 책정 예시

오른쪽에 나온 것처럼 라벨을 감지하는 기본 이미지 처리 파이프라인을 실행하려면 월별 비용이 $27.36입니다.

사용량 가정은 가격 계산기에서 확인할 수 있습니다.

매월 처음 1,000개 단위는 무료입니다.

이미지에서 텍스트 추출

Cloud Vision API를 사용하여 이미지에서 텍스트 추출

Cloud Vision API를 통해 다른 언어로 된 이미지에서 텍스트 및 필기 텍스트를 감지하고 추출할 수 있습니다. 또한 대륙 수준의 데이터 스토리지와 OCR 처리를 지정할 수 있는 멀티 리전 지원도 제공합니다.

적은 수의 이미지(요청당 최대 16개)에 대한 즉각적인 결과를 얻거나 더 많은 수의 이미지(요청당 최대 2,000개)에 대해 비동기식으로 일괄 처리하여 나중에 결과를 얻을 수 있습니다.

방법

Cloud Vision API를 사용하여 이미지에서 텍스트 추출

Cloud Vision API를 통해 다른 언어로 된 이미지에서 텍스트 및 필기 텍스트를 감지하고 추출할 수 있습니다. 또한 대륙 수준의 데이터 스토리지와 OCR 처리를 지정할 수 있는 멀티 리전 지원도 제공합니다.

적은 수의 이미지(요청당 최대 16개)에 대한 즉각적인 결과를 얻거나 더 많은 수의 이미지(요청당 최대 2,000개)에 대해 비동기식으로 일괄 처리하여 나중에 결과를 얻을 수 있습니다.

추가 리소스

가격 책정 예시

오른쪽에 나온 것처럼 이미지에서 텍스트를 추출하는 기본 처리 파이프라인을 실행하려면 월별 비용이 $27.36입니다.

사용량 가정은 가격 계산기에서 확인할 수 있습니다.

매월 처음 1,000개 단위는 무료입니다.

가격 책정

내 사용 사례의 비용은 얼마인가요?	필요한 제품과 주요 사용 가정을 바탕으로 사용 사례를 해결하기 위한 월별 비용을 파악할 수 있습니다.
사용 사례	사용 제품	사용량 가정	월별 예상 비용(USD)
이미지 태그 지정, 처리 및 검색	Cloud Vision Cloud Storage Pub/Sub Cloud Run	1. 월간 Cloud Vision 라벨 감지 API 호출 15,000회 2. 월간 스토리지 100GiB 3. 1.25GiB CPU 1개 4. Pub/Sub를 통해 매일 4GiB 게시 계산기의 계산 세부정보 보기	$27.36
문서에서 텍스트와 인사이트 추출	Document AI Cloud Storage BigQuery Cloud Functions	1. 월간 Document AI 양식 파서 API 호출 1,000회 2. 월간 스토리지 100GiB 3. 월간 쿼리 1TiB 4. RAM: 512MB, CPU: 800MHz 계산기의 계산 세부정보 보기	$71.87
이미지에서 텍스트 추출	Cloud Vision Cloud Storage Pub/Sub Cloud Run	1. 월간 Cloud Vision OCR API 호출 15,000회 2. 월간 스토리지 100GiB 3. 1.25GiB CPU 1개 4. Pub/Sub를 통해 매일 4GiB 게시 계산기의 계산 세부정보 보기	$27.36

Document AI, Vision API, AutoML의 전체 단가 가격 책정 세부정보를 확인하세요.

내 사용 사례의 비용은 얼마인가요?

필요한 제품과 주요 사용 가정을 바탕으로 사용 사례를 해결하기 위한 월별 비용을 파악할 수 있습니다.

이미지 태그 지정, 처리 및 검색

사용 제품

Cloud Vision

Cloud Storage

Pub/Sub

Cloud Run

사용량 가정

1. 월간 Cloud Vision 라벨 감지 API 호출 15,000회

2. 월간 스토리지 100GiB

3. 1.25GiB CPU 1개

4. Pub/Sub를 통해 매일 4GiB 게시

계산기의 계산 세부정보 보기

월별 예상 비용(USD)

$27.36

문서에서 텍스트와 인사이트 추출

사용 제품

Document AI

Cloud Storage

BigQuery

Cloud Functions

사용량 가정

1. 월간 Document AI 양식 파서 API 호출 1,000회

2. 월간 스토리지 100GiB

3. 월간 쿼리 1TiB

4. RAM: 512MB, CPU: 800MHz

계산기의 계산 세부정보 보기

월별 예상 비용(USD)

$71.87

이미지에서 텍스트 추출

사용 제품

Cloud Vision

Cloud Storage

Pub/Sub

Cloud Run

사용량 가정

1. 월간 Cloud Vision OCR API 호출 15,000회

2. 월간 스토리지 100GiB

3. 1.25GiB CPU 1개

4. Pub/Sub를 통해 매일 4GiB 게시

계산기의 계산 세부정보 보기

월별 예상 비용(USD)

$27.36

Document AI, Vision API, AutoML의 전체 단가 가격 책정 세부정보를 확인하세요.

가격 계산기

필요한 모든 도구를 한곳으로 가져와 프로젝트 비용을 예측합니다.

커스텀 견적

영업팀에 문의하여 조직의 고유한 요구사항에 맞는 커스텀 견적을 받아 보세요.

OCR(광학 문자 인식)

세계적 수준의 Google Cloud AI를 통한 OCR(광학 문자 인식)

OCR 하이라이트

OCR이란 무엇인가요?

Google Cloud는 어떤 유형의 OCR을 제공하나요?

Google Cloud에서 OCR은 어떻게 작동하나요?

Google Cloud AI와 OCR은 어떻게 함께 작동하나요?

어떤 OCR 솔루션이 나에게 적합한가요?

내 문서를 사용하여 문서 OCR의 작동 방식 알아보기

생성형 AI로 문서에서 텍스트 추출

Document AI로 미묘한 문서에서 유용한 정보 확보

방법

Document AI로 미묘한 문서에서 유용한 정보 확보

엔드 투 엔드 문서 솔루션 빌드

문서 처리 및 이해 파이프라인 빌드

방법

문서 처리 및 이해 파이프라인 빌드

이미지 태그 지정, 처리, 검색

Cloud Vision API 및 AutoML을 사용하여 이미지에 태그 지정 및 처리

가격 책정 예시

방법

Cloud Vision API 및 AutoML을 사용하여 이미지에 태그 지정 및 처리

추가 리소스

가격 책정 예시

이미지에서 텍스트 추출

Cloud Vision API를 사용하여 이미지에서 텍스트 추출

가격 책정 예시

방법

Cloud Vision API를 사용하여 이미지에서 텍스트 추출

추가 리소스

가격 책정 예시

가격 계산기

커스텀 견적

개념 증명 시작

신규 고객에게는 최대 $300의 무료 크레딧이 제공되어 Google Cloud 제품을 사용해 볼 수 있습니다

대규모 프로젝트가 있나요?

OCR 솔루션 및 사용 사례의 코드 샘플 보기

Cloud Vision API로 라벨을 감지하는 방법 알아보기

Google AI로 문서 처리 파이프라인을 자동화하는 방법 알아보기