Google Cloud에서 광학 문자 인식(OCR)을 수행하는 방법을 알아보세요. 이 튜토리얼에서는 이미지 파일을 Cloud Storage에 업로드하고, Cloud Vision API를 사용하여 이미지에서 텍스트를 추출하고, Google Cloud Translation API를 사용하여 텍스트를 번역하고, 번역을 다시 Cloud Storage에 저장하는 방법을 설명합니다. Pub/Sub를 사용하여 여러 태스크를 큐에 추가하고 이를 실행하기 위한 적절한 Cloud Run Functions를 트리거할 수 있습니다.
텍스트 인식(OCR) 요청 전송에 대한 자세한 내용은 이미지에서 텍스트 인식, 이미지에서 필기 입력 인식, 파일에서 텍스트 인식(PDF/TIFF)을 참조하세요.
목표
- 여러 백그라운드 Cloud Run Functions를 작성하고 배포합니다.
- Cloud Storage에 이미지를 업로드합니다.
- 업로드된 이미지에서 텍스트를 추출, 번역, 저장합니다.
비용
이 문서에서는 비용이 청구될 수 있는 다음과 같은 Google Cloud 구성요소를 사용합니다.
- Cloud Run functions
- Pub/Sub
- Cloud Storage
- Cloud Translation API
- Cloud Vision
프로젝트 사용량을 기준으로 예상 비용을 산출하려면 가격 계산기를 사용하세요.
시작하기 전에
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Cloud Functions, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Cloud Functions, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
- 개발 환경을 준비합니다.
gcloud CLI가 이미 설치되어 있으면 다음 명령어를 실행하여 업데이트합니다.
gcloud components update
데이터 흐름 시각화
OCR 가이드 애플리케이션의 데이터 흐름 단계는 다음과 같습니다.
- 언어에 상관없이 텍스트를 포함하는 이미지가 Cloud Storage에 업로드됩니다.
- Vision API를 사용하여 텍스트를 추출하고 출발어를 감지하는 Cloud Run 함수가 트리거됩니다.
- 텍스트는 Pub/Sub 주제에 메시지를 게시하여 번역 큐에 추가됩니다. 번역은 출발어와 다른 각 도착어 큐에 추가됩니다.
- 도착어가 출발어와 일치하면 번역 큐를 건너뛰고 텍스트가 다른 Pub/Sub 주제인 결과 큐로 전송됩니다.
- Cloud Run 함수는 Translation API를 사용하여 번역 큐의 텍스트를 번역합니다. 번역 결과는 결과 큐로 전송됩니다.
- 다른 Cloud Run 함수가 결과 큐에 있는 번역된 텍스트를 Cloud Storage에 저장합니다.
- 결과는 Cloud Storage에서 각 번역의 텍스트 파일로 검색됩니다.
해당 단계를 시각화하면 다음과 같습니다.
애플리케이션 준비
이미지를 업로드할 Cloud Storage 버킷을 만듭니다.
YOUR_IMAGE_BUCKET_NAME
은 전역적으로 고유한 버킷 이름입니다.gcloud storage buckets create gs://
YOUR_IMAGE_BUCKET_NAME
텍스트 번역을 저장할 Cloud Storage 버킷을 만듭니다.
YOUR_RESULT_BUCKET_NAME
은 전역적으로 고유한 버킷 이름입니다.gcloud storage buckets create gs://
YOUR_RESULT_BUCKET_NAME
번역 요청을 게시할 Pub/Sub 주제를 만듭니다.
YOUR_TRANSLATE_TOPIC_NAME
은 번역 요청 주제의 이름입니다.gcloud pubsub topics create
YOUR_TRANSLATE_TOPIC_NAME
완료된 번역 결과를 게시할 Pub/Sub 주제를 만듭니다.
YOUR_RESULT_TOPIC_NAME
은 번역 결과 주제의 이름입니다.gcloud pubsub topics create
YOUR_RESULT_TOPIC_NAME
샘플 앱 저장소를 로컬 머신에 클론합니다.
Node.js
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git
또는 zip 파일로 샘플을 다운로드하고 압축을 풀 수 있습니다.
Python
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
또는 zip 파일로 샘플을 다운로드하고 압축을 풀 수 있습니다.
Go
git clone https://github.com/GoogleCloudPlatform/golang-samples.git
또는 zip 파일로 샘플을 다운로드하고 압축을 풀 수 있습니다.
자바
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
또는 zip 파일로 샘플을 다운로드하고 압축을 풀 수 있습니다.
Cloud Run 함수 샘플 코드가 포함된 디렉터리로 변경합니다.
Node.js
cd nodejs-docs-samples/functions/ocr/app/
Python
cd python-docs-samples/functions/ocr/app/
Go
cd golang-samples/functions/ocr/app/
자바
cd java-docs-samples/functions/ocr/ocr-process-image/
코드 이해하기
종속 항목 가져오기
애플리케이션은 Google Cloud Platform 서비스와 통신하기 위해 몇 가지 종속성을 가져와야 합니다.
Node.js
Python
Go
자바
이미지 처리
다음 함수는 Cloud Storage에서 업로드된 이미지 파일을 읽고 이미지에 텍스트가 포함되어 있는지를 감지하는 함수를 호출합니다.
Node.js
Python
Go
자바
다음 함수는 Vision API를 사용하여 이미지에서 텍스트를 추출하고 번역을 위해 큐에 추가합니다.
Node.js
Python
Go
자바
텍스트 번역
다음 함수는 추출된 텍스트를 번역하고 이를 Cloud Storage에 다시 저장하기 위해 대기열에 추가합니다.
Node.js
Python
Go
자바
번역 저장
마지막으로 다음 함수는 번역된 텍스트를 받아 Cloud Storage에 다시 저장합니다.
Node.js
Python
Go
자바
함수 배포
Cloud Storage 트리거를 사용하여 이미지 처리 함수를 배포하려면 샘플 코드(또는 자바의 경우
pom.xml
파일)가 포함된 디렉터리에서 다음 명령어를 실행합니다.Node.js
gcloud functions deploy ocr-extract \ --runtime nodejs20 \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point processImage \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Node.js 버전의 런타임 ID를 지정합니다.Python
gcloud functions deploy ocr-extract \ --runtime python312 \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point process_image \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Python 버전의 런타임 ID를 지정합니다.Go
gcloud functions deploy ocr-extract \ --runtime go121 \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point ProcessImage \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Go 버전의 런타임 ID를 지정합니다.자바
gcloud functions deploy ocr-extract \ --entry-point functions.OcrProcessImage \ --runtime java17 \ --memory 512MB \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Java 버전의 런타임 ID를 지정합니다.여기서
YOUR_IMAGE_BUCKET_NAME
은 이미지를 업로드할 Cloud Storage 버킷 이름입니다.Pub/Sub 트리거를 사용하여 텍스트 번역 함수를 배포하려면 샘플 코드(또는 Java의 경우
pom.xml
파일)가 포함된 디렉터리에서 다음 명령어를 실행합니다.Node.js
gcloud functions deploy ocr-translate \ --runtime nodejs20 \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point translateText \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Node.js 버전의 런타임 ID를 지정합니다.Python
gcloud functions deploy ocr-translate \ --runtime python312 \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point translate_text \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Python 버전의 런타임 ID를 지정합니다.Go
gcloud functions deploy ocr-translate \ --runtime go121 \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point TranslateText \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Go 버전의 런타임 ID를 지정합니다.자바
gcloud functions deploy ocr-translate \ --entry-point functions.OcrTranslateText \ --runtime java17 \ --memory 512MB \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Java 버전의 런타임 ID를 지정합니다.Cloud Pub/Sub 트리거를 사용하여 결과를 Cloud Storage에 저장하는 함수를 배포하려면 샘플 코드(또는 Java의 경우
pom.xml
파일)가 있는 디렉터리에서 다음 명령어를 실행합니다.Node.js
gcloud functions deploy ocr-save \ --runtime nodejs20 \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point saveResult \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Node.js 버전의 런타임 ID를 지정합니다.Python
gcloud functions deploy ocr-save \ --runtime python312 \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point save_result \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Python 버전의 런타임 ID를 지정합니다.Go
gcloud functions deploy ocr-save \ --runtime go121 \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point SaveResult \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Go 버전의 런타임 ID를 지정합니다.자바
gcloud functions deploy ocr-save \ --entry-point functions.OcrSaveResult \ --runtime java17 \ --memory 512MB \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Java 버전의 런타임 ID를 지정합니다.
이미지 업로드
이미지를 이미지 Cloud Storage 버킷에 업로드합니다.
gcloud storage cp
PATH_TO_IMAGE
gs://YOUR_IMAGE_BUCKET_NAME
각 항목의 의미는 다음과 같습니다.
PATH_TO_IMAGE
는 로컬 시스템의 이미지 파일(텍스트 포함) 경로입니다.YOUR_IMAGE_BUCKET_NAME
은 이미지를 업로드할 버킷의 이름입니다.
샘플 프로젝트에서 이미지 중 하나를 다운로드할 수 있습니다.
로그를 확인하여 실행이 완료되었는지 확인합니다.
gcloud functions logs read --limit 100
YOUR_RESULT_BUCKET_NAME
에 사용한 Cloud Storage 버킷에서 저장된 번역을 볼 수 있습니다.
삭제
이 튜토리얼에서 사용된 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 리소스가 포함된 프로젝트를 삭제하거나 프로젝트를 유지하고 개별 리소스를 삭제하세요.
프로젝트 삭제
비용이 청구되지 않도록 하는 가장 쉬운 방법은 튜토리얼에서 만든 프로젝트를 삭제하는 것입니다.
프로젝트를 삭제하는 방법은 다음과 같습니다.
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
함수 삭제
Cloud Run 함수를 삭제해도 Cloud Storage에 저장된 리소스는 삭제되지 않습니다.
이 튜토리얼에서 만든 Cloud Run Functions를 삭제하려면 다음 명령어를 실행합니다.
gcloud functions delete ocr-extract gcloud functions delete ocr-translate gcloud functions delete ocr-save
Google Cloud 콘솔에서 Cloud Run 함수를 삭제할 수도 있습니다.