Google Cloud Platform での光学式文字認識(OCR)の実行方法について学びます。このチュートリアルでは、画像ファイルを Google Cloud Storage へアップロードする方法、Google Cloud Vision API を使って画像ファイルからテキストを抽出する方法、Google Cloud Translation API を使ってテキストを翻訳する方法、翻訳したテキストを Cloud Storage に保存する方法について説明します。Google Cloud Pub/Sub を使って、さまざまなタスクをキューに入れ、適切な Cloud Functions を使いこれらを実行していきます。
目標
- 複数のバックグラウンド Cloud Functions を書き込み、デプロイする。
- Cloud Storage に画像をアップロードする。
- アップロードした画像に含まれるテキストを抽出、変換、保存する。
料金
このチュートリアルでは、以下を含む、Cloud Platform の課金対象コンポーネントを使用しています。
- Google Cloud Functions
- Google Cloud Pub/Sub
- Google Cloud Storage
- Google Cloud Translation API
- Google Cloud Vision API
料金計算ツールを使うと、予想使用量に基づいて費用の見積もりを出すことができます。
新しい Cloud Platform ユーザーは無料トライアルをご利用いただけます。始める前に
- Google アカウントにログインします。
Google アカウントをまだお持ちでない場合は、新しいアカウントを登録します。
-
Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。
-
Cloud プロジェクトに対して課金が有効になっていることを確認します。プロジェクトに対して課金が有効になっていることを確認する方法を学習する。
- Cloud Functions, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision API を有効にします。
- Cloud SDK をインストールして初期化します。
- 開発環境を準備します。
Cloud SDK がすでにインストールされている場合は、次のコマンドを実行して更新します。
gcloud components update
データの流れ
OCR チュートリアル アプリケーションのデータの流れでは、次の手順が行われます。
- 任意の言語のテキストを含む画像が Cloud Storage にアップロードされます。
- Cloud Functions の関数がトリガーされ、Vision API を使用してテキストを抽出し、ソース言語を検出します。
- Pub/Sub トピックにメッセージが発行されることで、テキストが翻訳のためにキューに配置されます。翻訳は、ソース言語とは異なるターゲット言語ごとにキューに配置されます。
- ターゲット言語がソース言語と一致する場合、翻訳キューがスキップされ、テキストは結果キュー(別の Pub/Sub トピック)に送信されます。
- Cloud Functions の関数が、Translation API を使用して翻訳キューのテキストを翻訳します。翻訳結果は結果キューに送信されます。
- 別の Cloud Functions の関数が、翻訳されたテキストを結果キューから Cloud Storage に保存します。
- 結果は、翻訳ごとに
txt
ファイルとして Cloud Storage に保存されます。
次はこの手順を可視化した図です。
アプリケーションの準備
画像をアップロードする Cloud Storage バケットを作成します。
YOUR_IMAGE_BUCKET_NAME
は、グローバルに固有のバケット名です。gsutil mb gs://
YOUR_IMAGE_BUCKET_NAME
テキストの翻訳を保存する Cloud Storage バケットを作成します。
YOUR_RESULT_BUCKET_NAME
はグローバルに固有のバケット名です。gsutil mb gs://
YOUR_RESULT_BUCKET_NAME
翻訳リクエストを公開する Cloud Pub/Sub トピックを作成します。
YOUR_TRANSLATE_TOPIC_NAME
は翻訳リクエストのトピックの名前です。gcloud pubsub topics create
YOUR_TRANSLATE_TOPIC_NAME
完成した翻訳結果を公開する Cloud Pub/Sub トピックを作成します。
YOUR_RESULT_TOPIC_NAME
は翻訳結果のトピックの名前です。gcloud pubsub topics create
YOUR_RESULT_TOPIC_NAME
ローカルマシンにサンプルアプリのリポジトリのクローンを作成します。
Node.js
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git
または、zip 形式のサンプルをダウンロードし、ファイルを抽出してもかまいません。
Python
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
または、zip 形式のサンプルをダウンロードし、ファイルを抽出してもかまいません。
Go
git clone https://github.com/GoogleCloudPlatform/golang-samples.git
または、zip 形式のサンプルをダウンロードし、ファイルを抽出してもかまいません。
Java
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
または、zip 形式のサンプルをダウンロードし、ファイルを抽出してもかまいません。
Cloud Functions のサンプルコードが含まれているディレクトリに移動します。
Node.js
cd nodejs-docs-samples/functions/ocr/app/
Python
cd python-docs-samples/functions/ocr/app/
Go
cd golang-samples/functions/ocr/app/
Java
cd java-docs-samples/functions/ocr/ocr-process-image/
コードについて
依存関係をインポートする
アプリケーションが Google Cloud Platform サービスとやり取りするには、いくつかの依存関係をインポートする必要があります。
Node.js
Python
Go
Java
画像の処理
次の関数は Cloud Storage からアップロードされた画像を読み取り、画像にテキストが含まれているかどうかを検出する関数を呼び出します。
Node.js
Python
Go
Java
次の関数は Cloud Vision API を使い画像からテキストを抽出し、翻訳されるようにテキストをキューに入れます。
Node.js
Python
Go
Java
テキストの翻訳
次の関数は抽出されたテキストを翻訳し、翻訳されたテキストを Cloud Storage に保存するよう、キューに入れます。
Node.js
Python
Go
Java
翻訳されたテキストの保存
最後に、次の関数は翻訳されたテキストを受信し、Cloud Storage に保存します。
Node.js
Python
Go
Java
関数のデプロイ
このセクションでは、関数をデプロイする方法について説明します。
Cloud Storage トリガーを使用して画像処理関数をデプロイするには、サンプルコード(Java の場合は
pom.xml
ファイル)を含むディレクトリで次のコマンドを実行します。Node.js
gcloud functions deploy ocr-extract \ --runtime nodejs10 \
優先する Node.js のバージョンを指定するには、
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point processImage \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
フラグに次の値を使用します。nodejs10
nodejs12
nodejs14
(公開プレビュー)
Python
gcloud functions deploy ocr-extract \ --runtime python38 \
優先する Python バージョンを指定するには、
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point process_image \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
フラグに次の値を使用します。python37
python38
python39
(公開プレビュー)
Go
gcloud functions deploy ocr-extract \ --runtime go113 \
優先する Go バージョンを指定するには、
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point ProcessImage \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
フラグに次の値を使用します。go111
(サポート終了)go113
Java
gcloud functions deploy ocr-extract \ --entry-point functions.OcrProcessImage \ --runtime java11 \ --memory 512MB \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"YOUR_IMAGE_BUCKET_NAME
は、画像をアップロードする Cloud Storage バケットの名前です。Cloud Pub/Sub トリガーを使用してテキスト翻訳関数をデプロイするには、サンプルコード(Java の場合は
pom.xml
ファイル)を含むディレクトリで次のコマンドを実行します。Node.js
gcloud functions deploy ocr-translate \ --runtime nodejs10 \
優先する Node.js のバージョンを指定するには、
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point translateText \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
フラグに次の値を使用します。nodejs10
nodejs12
nodejs14
(公開プレビュー)
Python
gcloud functions deploy ocr-translate \ --runtime python38 \
優先する Python バージョンを指定するには、
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point translate_text \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
フラグに次の値を使用します。python37
python38
python39
(公開プレビュー)
Go
gcloud functions deploy ocr-translate \ --runtime go113 \
優先する Go バージョンを指定するには、
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point TranslateText \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
フラグに次の値を使用します。go111
(サポート終了)go113
Java
gcloud functions deploy ocr-translate \ --entry-point functions.OcrTranslateText \ --runtime java11 \ --memory 512MB \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Cloud Pub/Sub トリガーを使用して結果を Cloud Storage に保存する関数をデプロイするには、サンプルコード(Java の場合は
pom.xml
ファイル)を含むディレクトリで次のコマンドを実行します。Node.js
gcloud functions deploy ocr-save \ --runtime nodejs10 \
優先する Node.js のバージョンを指定するには、
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point saveResult \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
フラグに次の値を使用します。nodejs10
nodejs12
nodejs14
(公開プレビュー)
Python
gcloud functions deploy ocr-save \ --runtime python38 \
優先する Python バージョンを指定するには、
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point save_result \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
フラグに次の値を使用します。python37
python38
python39
(公開プレビュー)
Go
gcloud functions deploy ocr-save \ --runtime go113 \
優先する Go バージョンを指定するには、
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point SaveResult \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
フラグに次の値を使用します。go111
(サポート終了)go113
Java
gcloud functions deploy ocr-save \ --entry-point functions.OcrSaveResult \ --runtime java11 \ --memory 512MB \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"
画像のアップロード
画像を Cloud Storage バケットにアップロードします。
gsutil cp
PATH_TO_IMAGE
gs://YOUR_IMAGE_BUCKET_NAME
ここで
PATH_TO_IMAGE
はお使いのローカル システムにある画像ファイル(テキストを含む)へのパスです。YOUR_IMAGE_BUCKET_NAME
は画像のアップロード先となるバケットの名前です。
サンプル オブジェクトから画像をダウンロードできます。
実行した内容が完了していることをログで確認します。
gcloud functions logs read --limit 100
保存した翻訳は、
YOUR_RESULT_BUCKET_NAME
に使用した Cloud Storage バケットで確認できます。
クリーンアップ
このチュートリアルで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、リソースを含むプロジェクトを削除するか、プロジェクトを維持して個々のリソースを削除します。
プロジェクトの削除
課金をなくす最も簡単な方法は、チュートリアル用に作成したプロジェクトを削除することです。
プロジェクトを削除するには:
- Cloud Console で [リソースの管理] ページに移動します。
- プロジェクト リストで、削除するプロジェクトを選択し、[削除] をクリックします。
- ダイアログでプロジェクト ID を入力し、[シャットダウン] をクリックしてプロジェクトを削除します。
Cloud Functions の関数の削除
Cloud Functions の関数を削除しても、Cloud Storage に保存されたリソースは削除されません。
このチュートリアルで作成した Cloud Functions の関数を削除するには、次のコマンドを実行します。
gcloud functions delete ocr-extract gcloud functions delete ocr-translate gcloud functions delete ocr-save
Google Cloud Console から Cloud Functions を削除することもできます。