Google Cloud Platform에서 광 문자 인식(OCR)을 수행하는 방법을 알아보세요. 이 튜토리얼에서는 Cloud Storage에 이미지 파일을 업로드하거나, Cloud Vision을 사용하여 이미지에서 텍스트를 추출하거나, Cloud Translation API를 사용하여 텍스트를 번역하거나, 번역을 Cloud Storage에 다시 저장하는 방법을 보여줍니다. Pub/Sub를 사용하여 여러 태스크를 큐에 추가하고 이를 실행하기 위한 적절한 Cloud Functions를 트리거할 수 있습니다.
텍스트 인식(OCR) 요청 전송에 대한 자세한 내용은 이미지에서 텍스트 인식, 이미지에서 필기 입력 인식, 파일에서 텍스트 인식(PDF/TIFF)을 참조하세요.
목표
- 여러 이벤트 기반 함수를 작성하고 배포합니다.
- Cloud Storage에 이미지를 업로드합니다.
- 업로드된 이미지에서 텍스트를 추출, 번역, 저장합니다.
비용
이 문서에서는 비용이 청구될 수 있는 다음과 같은 Google Cloud 구성요소를 사용합니다.
- Cloud Functions
- Cloud Build
- Pub/Sub
- Artifact Registry
- Eventarc
- Cloud Run
- Cloud Logging
- Cloud Storage
- Cloud Translation API
- Cloud Vision
프로젝트 사용량을 기준으로 예상 비용을 산출하려면 가격 계산기를 사용하세요.
시작하기 전에
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Cloud Functions, Cloud Build, Cloud Run, Artifact Registry, Eventarc, Logging, Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Cloud Functions, Cloud Build, Cloud Run, Artifact Registry, Eventarc, Logging, Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
- 개발 환경을 준비합니다.
gcloud CLI가 이미 설치되어 있으면 다음 명령어를 실행하여 업데이트합니다.
gcloud components update
데이터 흐름 시각화
OCR 튜토리얼 애플리케이션의 데이터 흐름 단계는 다음과 같습니다.
- 언어에 상관없이 텍스트를 포함하는 이미지가 Cloud Storage에 업로드됩니다.
- Vision API를 사용하여 텍스트를 추출하고 출발어를 감지하는 Cloud 함수가 트리거됩니다.
- 텍스트는 Pub/Sub 주제에 메시지를 게시하여 번역 큐에 추가됩니다. 번역은 출발어와 다른 각 도착어 큐에 추가됩니다.
- 도착어가 출발어와 일치하면 번역 큐를 건너뛰고 텍스트가 다른 Pub/Sub 주제인 결과 큐로 전송됩니다.
- Cloud 함수는 Translation API를 사용하여 번역 큐의 텍스트를 번역합니다. 번역 결과는 결과 큐로 전송됩니다.
- 다른 Cloud 함수가 결과 큐에 있는 번역된 텍스트를 Cloud Storage에 저장합니다.
- 결과는 Cloud Storage에서 각 번역의 텍스트 파일로 검색됩니다.
해당 단계를 시각화하면 다음과 같습니다.
애플리케이션 준비
이미지를 업로드할 Cloud Storage 버킷을 만듭니다.
YOUR_IMAGE_BUCKET_NAME
은 전역적으로 고유한 버킷 이름입니다.gsutil mb gs://
YOUR_IMAGE_BUCKET_NAME
텍스트 번역을 저장할 Cloud Storage 버킷을 만듭니다.
YOUR_RESULT_BUCKET_NAME
은 전역적으로 고유한 버킷 이름입니다.gsutil mb gs://
YOUR_RESULT_BUCKET_NAME
번역 요청을 게시할 Cloud Pub/Sub 주제를 만듭니다.
YOUR_TRANSLATE_TOPIC_NAME
은 번역 요청 주제의 이름입니다.gcloud pubsub topics create
YOUR_TRANSLATE_TOPIC_NAME
완료된 번역 결과를 게시할 Cloud Pub/Sub 주제를 만듭니다.
YOUR_RESULT_TOPIC_NAME
은 번역 결과 주제의 이름입니다.gcloud pubsub topics create
YOUR_RESULT_TOPIC_NAME
샘플 앱 저장소를 로컬 머신에 클론합니다.
Node.js
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git
또는 zip 파일로 샘플을 다운로드하고 압축을 풀 수 있습니다.
Python
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
또는 zip 파일로 샘플을 다운로드하고 압축을 풀 수 있습니다.
Go
git clone https://github.com/GoogleCloudPlatform/golang-samples.git
또는 zip 파일로 샘플을 다운로드하고 압축을 풀 수 있습니다.
Java
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
또는 zip 파일로 샘플을 다운로드하고 압축을 풀 수 있습니다.
Cloud Functions 샘플 코드가 있는 디렉터리로 변경합니다.
Node.js
cd nodejs-docs-samples/functions/v2/ocr/app/
Python
cd python-docs-samples/functions/v2/ocr/
Go
cd golang-samples/functions/functionsv2/ocr/app/
Java
cd java-docs-samples/functions/v2/ocr/ocr-process-image/
코드 이해하기
이 섹션에서는 OCR 샘플을 구성하는 종속 항목과 함수를 설명합니다.
종속 항목 가져오기
애플리케이션은 Google Cloud Platform 서비스와 통신하기 위해 몇 가지 종속성을 가져와야 합니다.
Node.js
Python
Go
Java
이미지 처리
다음 함수는 Cloud Storage에서 업로드된 이미지 파일을 읽고 이미지에 텍스트가 포함되어 있는지를 감지하는 함수를 호출합니다.
Node.js
Python
Go
Java
다음 함수는 Cloud Vision API를 사용하여 이미지에서 텍스트를 추출하고 번역을 위해 큐에 추가합니다.
Node.js
Python
Go
Java
텍스트 번역
다음 함수는 추출된 텍스트를 번역하고 이를 Cloud Storage에 다시 저장하기 위해 대기열에 추가합니다.
Node.js
Python
Go
Java
번역 저장
마지막으로 다음 함수는 번역된 텍스트를 받아 Cloud Storage에 다시 저장합니다.
Node.js
Python
Go
Java
함수 배포
Cloud Storage 트리거를 사용하여 이미지 처리 함수를 배포하려면 샘플 코드(또는 Java의 경우
pom.xml
파일)가 포함된 디렉터리에서 다음 명령어를 실행합니다.// LINT.IfChange(nodejs_version) // LINT.ThenChange(:nodejs_version_console_text) // LINT.IfChange(nodejs_version_console_text) // LINT.ThenChange(:nodejs_version) // LINT.IfChange(nodejs_version) // LINT.ThenChange(:nodejs_version_console_text) // LINT.IfChange(nodejs_version_console_text) // LINT.ThenChange(:nodejs_version)
Node.js
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=processImage \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Node.js 버전의 런타임 ID를 지정합니다.Python
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=process_image \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Python 버전의 런타임 ID를 지정합니다.Go
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=process-image \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Go 버전의 런타임 ID를 지정합니다.Java
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrProcessImage \ --memory=512MB \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Java 버전의 런타임 ID를 지정합니다.다음을 바꿉니다.
- REGION: 함수를 배포할 Google Cloud 리전의 이름(예:
us-west1
) - YOUR_IMAGE_BUCKET_NAME: 이미지를 업로드할 Cloud Storage 버킷 이름. 2세대 함수를 배포할 때는 선행
gs://
없이 버킷 이름만 지정합니다(예:--trigger-event-filters="bucket=my-bucket"
).
- REGION: 함수를 배포할 Google Cloud 리전의 이름(예:
Cloud Pub/Sub 트리거를 사용하여 텍스트 번역 함수를 배포하려면 샘플 코드(또는 Java의 경우
pom.xml
파일)가 포함된 디렉터리에서 다음 명령어를 실행합니다.// LINT.IfChange(nodejs_version) // LINT.ThenChange(:nodejs_version_console_text) // LINT.IfChange(nodejs_version_console_text) // LINT.ThenChange(:nodejs_version) // LINT.IfChange(nodejs_version) // LINT.ThenChange(:nodejs_version_console_text) // LINT.IfChange(nodejs_version_console_text) // LINT.ThenChange(:nodejs_version)
Node.js
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=translateText \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Node.js 버전의 런타임 ID를 지정합니다.Python
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=translate_text \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Python 버전의 런타임 ID를 지정합니다.Go
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=translate-text \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Go 버전의 런타임 ID를 지정합니다.Java
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrTranslateText \ --memory=512MB \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Java 버전의 런타임 ID를 지정합니다.Cloud Pub/Sub 트리거를 사용하여 결과를 Cloud Storage에 저장하는 함수를 배포하려면 샘플 코드(또는 Java의 경우
pom.xml
파일)가 있는 디렉터리에서 다음 명령어를 실행합니다.// LINT.IfChange(nodejs_version) // LINT.ThenChange(:nodejs_version_console_text) // LINT.IfChange(nodejs_version_console_text) // LINT.ThenChange(:nodejs_version) // LINT.IfChange(nodejs_version) // LINT.ThenChange(:nodejs_version_console_text) // LINT.IfChange(nodejs_version_console_text) // LINT.ThenChange(:nodejs_version)
Node.js
gcloud functions deploy ocr-save \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=saveResult \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Node.js 버전의 런타임 ID를 지정합니다.Python
gcloud functions deploy ocr-save \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=save_result \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Python 버전의 런타임 ID를 지정합니다.Go
gcloud functions deploy ocr-save \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=save-result \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Go 버전의 런타임 ID를 지정합니다.Java
gcloud functions deploy ocr-save \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrSaveResult \ --memory=512MB \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
플래그를 사용하여 함수를 실행할 지원되는 Java 버전의 런타임 ID를 지정합니다.
이미지 업로드
이미지를 이미지 Cloud Storage 버킷에 업로드합니다.
gsutil cp
PATH_TO_IMAGE
gs://YOUR_IMAGE_BUCKET_NAME
각 항목의 의미는 다음과 같습니다.
PATH_TO_IMAGE
는 로컬 시스템의 이미지 파일(텍스트 포함) 경로입니다.YOUR_IMAGE_BUCKET_NAME
은 이미지를 업로드할 버킷의 이름입니다.
샘플 프로젝트에서 이미지 중 하나를 다운로드할 수 있습니다.
로그를 확인하여 실행이 완료되었는지 확인합니다.
gcloud functions logs read --limit 100
YOUR_RESULT_BUCKET_NAME
에 사용한 Cloud Storage 버킷에서 저장된 번역을 볼 수 있습니다.
삭제
이 튜토리얼에서 사용된 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 리소스가 포함된 프로젝트를 삭제하거나 프로젝트를 유지하고 개별 리소스를 삭제하세요.
프로젝트 삭제
비용이 청구되지 않도록 하는 가장 쉬운 방법은 튜토리얼에서 만든 프로젝트를 삭제하는 것입니다.
프로젝트를 삭제하는 방법은 다음과 같습니다.
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Cloud Functions 삭제
Cloud Functions를 삭제해도 Cloud Storage에 저장된 리소스는 삭제되지 않습니다.
이 가이드에서 만든 Cloud Functions를 삭제하려면 다음 명령어를 실행합니다.
gcloud functions delete ocr-extract gcloud functions delete ocr-translate gcloud functions delete ocr-save
Google Cloud Console에서 Cloud Functions를 삭제할 수도 있습니다.