이미지 및 문서에서 텍스트 및 데이터를 추출하고, 구조화되지 않은 콘텐츠를 비즈니스에서 사용할 수 있는 구조화된 데이터로 변환하고, 유용한 정보를 얻을 수 있습니다.
API를 통해 OCR 기능을 애플리케이션에 통합합니다.
신규 고객에게는 가입 시 문서 요약 OCR 솔루션에 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
개요
Google Cloud는 문서의 OCR과 이미지 및 동영상의 OCR이라는 두 가지 유형의 OCR을 제공합니다.
기본 기술을 공유하지만 Document AI는 문서 처리에 최적화된 문서 이해 플랫폼입니다. 커스텀 추출기는 GenAI를 기반으로 하며, 전문 프로세서를 선택할 필요 없이 일반 문서와 분야별 문서를 모두 더 정확하고 빠르게 처리합니다.
Cloud Vision은 일반적으로 이미지와 동영상에서 텍스트, 필기, 다양한 사물을 감지하는 데 사용됩니다.
Google Cloud는 동급 최고의 AI로 OCR을 지원합니다. 데이터 이해, 구성, 보강으로 기존 텍스트 인식을 뛰어넘어 궁극적으로 비즈니스에 필요한 유용한 정보를 얻을 수 있습니다.
OCR 도구를 효율성을 위해 간소화된 통합 도구 모음(예: Document AI)으로 사용하거나 Google Cloud 콘솔에서 직접 사용할 수 있는 관련 API를 호출하여 OCR 기능을 애플리케이션에 통합할 수 있습니다.
위에서 언급한 모든 OCR 솔루션을 사용하면 API를 통해 즉시 배포하거나 업트레이닝을 통해 특정 요구사항에 대한 정확성을 개선할 수 있는 선행 학습된 ML 모델에 액세스할 수 있습니다.
AutoML을 사용하면 머신러닝 전문 지식이 없어도 자체 커스텀 모델을 학습시킬 수 있습니다.
커스텀 ML 모델 빌드에 대한 AutoML 문서를 확인하세요.
문서를 분석하거나 자동화된 문서 처리 파이프라인을 빌드하려면 Document AI를 사용하세요. 문서 이해부터 추출된 데이터와 함께 문서 검색, 저장, 제어, 관리에 이르기까지 전체 워크플로를 한 곳에서 처리합니다.
이미지를 분석 및 처리하려면 다른 Google Cloud 제품과 함께 Cloud Vision을 사용하여 최상의 결과를 얻으세요. 세부정보 및 빠른 시작 가이드는 '일반적인 용도 섹션'을 참조하세요.
두 API 모두 Google Cloud 계정으로 무료로 사용해 볼 수 있습니다.
OCR 서비스 비교
OCR 서비스 | 적합한 환경 | 주요 특징 | |
---|---|---|---|
| 짧은 지연 시간과 높은 용량이 필요한 일반 텍스트 추출 사용 사례 | 이미지 라벨 지정, 얼굴 및 랜드마크 인식, OCR, 세이프서치와 같은 사전 빌드된 기능이 있습니다. | |
Enterprise Document OCR | 문서(PDF, 이미지 형태의 스캔한 문서 또는 Microsoft DocX 파일)의 텍스트를 디지털화합니다. | 200개 이상의 언어, 50개 필기 입력 언어로 텍스트를 추출합니다. 수학 공식, 스타일 등을 인식하는 부가기능입니다. | |
| Document AI Workbench | 생성형 AI (기반 모델)로 모든 문서를 추출, 분류, 분할 | 커스텀 추출기: 기반 모델을 사용하여 광범위한 데이터 라벨 지정이나 학습 없이 빠르게 파서를 만듭니다. 효율적인 처리를 위한 맞춤 분류 기준 및 문서 분할기입니다. |
| 선행 학습된 모델 | 도메인별 문서에서 텍스트 및 필드 추출 |
짧은 지연 시간과 높은 용량이 필요한 일반 텍스트 추출 사용 사례
이미지 라벨 지정, 얼굴 및 랜드마크 인식, OCR, 세이프서치와 같은 사전 빌드된 기능이 있습니다.
Enterprise Document OCR
문서(PDF, 이미지 형태의 스캔한 문서 또는 Microsoft DocX 파일)의 텍스트를 디지털화합니다.
200개 이상의 언어, 50개 필기 입력 언어로 텍스트를 추출합니다.
수학 공식, 스타일 등을 인식하는 부가기능입니다.
Document AI Workbench
생성형 AI (기반 모델)로 모든 문서를 추출, 분류, 분할
커스텀 추출기: 기반 모델을 사용하여 광범위한 데이터 라벨 지정이나 학습 없이 빠르게 파서를 만듭니다.
효율적인 처리를 위한 맞춤 분류 기준 및 문서 분할기입니다.
작동 방식
문서를 이해하고 처리하려면 Document AI를 사용합니다.
이미지의 경우 Cloud Vision을 사용하는 것이 좋습니다.
두 가지 모두 API 또는 업트레이닝을 통해 있는 그대로 배포할 수 있는 선행 학습된 ML 모델에 대한 액세스 권한을 제공합니다. AutoML을 사용하면 머신러닝 전문 지식이 없어도 커스텀 모델을 처음부터 학습시킬 수 있습니다.
Cloud Vision 또는 문서 OCR을 사용하면 매월 처음 1,000개의 단위가 무료로 제공됩니다. API를 호출하기만 하면 됩니다.
데모
간단한 드래그 앤 드롭으로 Document AI API를 사용해 보세요.
일반적인 용도
기반 모델을 기반으로 하는 Document AI 커스텀 추출기는 문서에서 일반 및 분야별로 텍스트와 데이터를 더 빠르고 정확하게 추출합니다. 5~10개의 문서만으로 손쉽게 미세 조정하여 성능을 한층 더 높일 수 있습니다.
자체 모델을 학습시키려면 데이터 세트에 기반 모델로 자동 라벨을 지정하여 프로덕션 시간을 단축하세요.
선행 학습된 특수 프로세서를 사용할 수도 있습니다. 전체 프로세서 목록을 참고하세요.
기반 모델을 기반으로 하는 Document AI 커스텀 추출기는 문서에서 일반 및 분야별로 텍스트와 데이터를 더 빠르고 정확하게 추출합니다. 5~10개의 문서만으로 손쉽게 미세 조정하여 성능을 한층 더 높일 수 있습니다.
자체 모델을 학습시키려면 데이터 세트에 기반 모델로 자동 라벨을 지정하여 프로덕션 시간을 단축하세요.
선행 학습된 특수 프로세서를 사용할 수도 있습니다. 전체 프로세서 목록을 참고하세요.
GenAI를 기반으로 하는 Document AI는 다양한 레이아웃과 품질의 문서에서 매우 정확하게 데이터를 추출할 수 있습니다. Cloud Storage와 연결하면 구조화되지 않은 문서에서 엔터프라이즈급 규정을 준수할 수 있습니다. BigQuery를 사용하면 추출된 데이터를 원하는 방식으로 일괄 처리하고 분석할 수 있습니다. Looker를 사용하면 BigQuery 테이블을 기반으로 손쉽게 시각화를 빌드할 수 있습니다. Vertex AI Search를 사용하면 대화 방식으로 또는 기존에 Cloud Storage의 문서를 쿼리하고 검색할 수 있습니다.
위와 같이 전체 파이프라인을 설정하는 데는 60~90분이 걸리며 Document AI 부분에는 10분이 걸립니다.
GenAI를 기반으로 하는 Document AI는 다양한 레이아웃과 품질의 문서에서 매우 정확하게 데이터를 추출할 수 있습니다. Cloud Storage와 연결하면 구조화되지 않은 문서에서 엔터프라이즈급 규정을 준수할 수 있습니다. BigQuery를 사용하면 추출된 데이터를 원하는 방식으로 일괄 처리하고 분석할 수 있습니다. Looker를 사용하면 BigQuery 테이블을 기반으로 손쉽게 시각화를 빌드할 수 있습니다. Vertex AI Search를 사용하면 대화 방식으로 또는 기존에 Cloud Storage의 문서를 쿼리하고 검색할 수 있습니다.
위와 같이 전체 파이프라인을 설정하는 데는 60~90분이 걸리며 Document AI 부분에는 10분이 걸립니다.
이미지 태그 지정을 이미지 라벨 지정이라고도 합니다.
Cloud Vision API는 이미지에서 일반 객체, 랜드마크, 위치, 로고, 활동, 동물 종, 제품 등을 식별하고 라벨을 지정할 수 있습니다. 이미지에 감지된 라벨로 태그를 지정하면 이미지 검색, 처리 및 관리가 자동화되어 훨씬 쉬워집니다.
타겟팅된 커스텀 라벨이 필요한 경우 Cloud AutoML을 사용하여 커스텀 ML 모델을 학습시킵니다.
Google OCR 기술을 온프레미스로 사용하려면 Cloud Marketplace에서 제공하는 OCR On-Prem을 사용하세요.
오른쪽에 나온 것처럼 라벨을 감지하는 기본 이미지 처리 파이프라인을 실행하려면 월별 비용이 $27.36입니다.
사용량 가정은 가격 계산기에서 확인할 수 있습니다.
매월 처음 1,000개 단위는 무료입니다.
이미지 태그 지정을 이미지 라벨 지정이라고도 합니다.
Cloud Vision API는 이미지에서 일반 객체, 랜드마크, 위치, 로고, 활동, 동물 종, 제품 등을 식별하고 라벨을 지정할 수 있습니다. 이미지에 감지된 라벨로 태그를 지정하면 이미지 검색, 처리 및 관리가 자동화되어 훨씬 쉬워집니다.
타겟팅된 커스텀 라벨이 필요한 경우 Cloud AutoML을 사용하여 커스텀 ML 모델을 학습시킵니다.
Google OCR 기술을 온프레미스로 사용하려면 Cloud Marketplace에서 제공하는 OCR On-Prem을 사용하세요.
오른쪽에 나온 것처럼 라벨을 감지하는 기본 이미지 처리 파이프라인을 실행하려면 월별 비용이 $27.36입니다.
사용량 가정은 가격 계산기에서 확인할 수 있습니다.
매월 처음 1,000개 단위는 무료입니다.
Cloud Vision API를 통해 다른 언어로 된 이미지에서 텍스트 및 필기 텍스트를 감지하고 추출할 수 있습니다. 또한 대륙 수준의 데이터 스토리지와 OCR 처리를 지정할 수 있는 멀티 리전 지원도 제공합니다.
적은 수의 이미지(요청당 최대 16개)에 대한 즉각적인 결과를 얻거나 더 많은 수의 이미지(요청당 최대 2,000개)에 대해 비동기식으로 일괄 처리하여 나중에 결과를 얻을 수 있습니다.
오른쪽에 나온 것처럼 이미지에서 텍스트를 추출하는 기본 처리 파이프라인을 실행하려면 월별 비용이 $27.36입니다.
사용량 가정은 가격 계산기에서 확인할 수 있습니다.
매월 처음 1,000개 단위는 무료입니다.
Cloud Vision API를 통해 다른 언어로 된 이미지에서 텍스트 및 필기 텍스트를 감지하고 추출할 수 있습니다. 또한 대륙 수준의 데이터 스토리지와 OCR 처리를 지정할 수 있는 멀티 리전 지원도 제공합니다.
적은 수의 이미지(요청당 최대 16개)에 대한 즉각적인 결과를 얻거나 더 많은 수의 이미지(요청당 최대 2,000개)에 대해 비동기식으로 일괄 처리하여 나중에 결과를 얻을 수 있습니다.
오른쪽에 나온 것처럼 이미지에서 텍스트를 추출하는 기본 처리 파이프라인을 실행하려면 월별 비용이 $27.36입니다.
사용량 가정은 가격 계산기에서 확인할 수 있습니다.
매월 처음 1,000개 단위는 무료입니다.
가격 책정
내 사용 사례의 비용은 얼마인가요? | 필요한 제품과 주요 사용 가정을 바탕으로 사용 사례를 해결하기 위한 월별 비용을 파악할 수 있습니다. | ||
---|---|---|---|
사용 사례 | 사용 제품 | 사용량 가정 | 월별 예상 비용(USD) |
이미지 태그 지정, 처리, 검색 | Cloud Vision Cloud Storage Pub/Sub Cloud Run | 1. 월간 Cloud Vision 라벨 감지 API 호출 15,000회 2. 월간 스토리지 100GiB 3. 1.25GiB CPU 1개 4. Pub/Sub를 통해 매일 4GiB 게시 | $27.36 |
문서에서 텍스트 및 통계 추출 | Document AI Cloud Storage BigQuery Cloud Functions | 1. 월간 Document AI 양식 파서 API 호출 1,000회 2. 월간 스토리지 100GiB 3. 월간 쿼리 1TiB 4. RAM: 512MB, CPU: 800MHz | $71.87 |
이미지에서 텍스트 추출 | Cloud Vision Cloud Storage Pub/Sub Cloud Run | 1. 월간 Cloud Vision OCR API 호출 15,000회 2. 월간 스토리지 100GiB 3. 1.25GiB CPU 1개 4. Pub/Sub를 통해 매일 4GiB 게시 | $27.36 |
Document AI, Vision API, AutoML의 전체 단가 가격 책정 세부정보를 확인하세요.
내 사용 사례의 비용은 얼마인가요?
필요한 제품과 주요 사용 가정을 바탕으로 사용 사례를 해결하기 위한 월별 비용을 파악할 수 있습니다.
Cloud Vision
Cloud Storage
Pub/Sub
Cloud Run
1. 월간 Cloud Vision 라벨 감지 API 호출 15,000회
2. 월간 스토리지 100GiB
3. 1.25GiB CPU 1개
4. Pub/Sub를 통해 매일 4GiB 게시
$27.36
Document AI
Cloud Storage
BigQuery
Cloud Functions
1. 월간 Document AI 양식 파서 API 호출 1,000회
2. 월간 스토리지 100GiB
3. 월간 쿼리 1TiB
4. RAM: 512MB, CPU: 800MHz
$71.87
Cloud Vision
Cloud Storage
Pub/Sub
Cloud Run
1. 월간 Cloud Vision OCR API 호출 15,000회
2. 월간 스토리지 100GiB
3. 1.25GiB CPU 1개
4. Pub/Sub를 통해 매일 4GiB 게시
$27.36
Document AI, Vision API, AutoML의 전체 단가 가격 책정 세부정보를 확인하세요.