Pelajari cara melakukan pengenalan karakter optik (OCR) di Google Cloud. Tutorial ini menunjukkan cara mengupload file gambar ke Cloud Storage, mengekstrak teks dari gambar menggunakan Cloud Vision API, menerjemahkan teks menggunakan Google Cloud Translation API, dan menyimpan kembali terjemahan Anda ke Cloud Storage. Pub/Sub digunakan untuk mengantrekan berbagai tugas dan memicu fungsi Cloud Run yang tepat untuk menjalankannya.
Untuk informasi selengkapnya tentang cara mengirim permintaan deteksi teks (OCR), lihat Mendeteksi teks dalam gambar, Mendeteksi tulis tangan dalam gambar, atau Mendeteksi teks dalam file (PDF/TIFF).
Tujuan
- Menulis dan men-deploy beberapa Fungsi Cloud Run Latar Belakang.
- Mengupload gambar ke Cloud Storage.
- Mengekstrak, menerjemahkan, dan menyimpan teks yang ada dalam gambar yang diupload.
Biaya
Dalam dokumen ini, Anda akan menggunakan komponen Google Cloud yang dapat ditagih berikut:
- Cloud Run functions
- Pub/Sub
- Cloud Storage
- Cloud Translation API
- Cloud Vision
Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda,
gunakan kalkulator harga.
Sebelum memulai
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Functions, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Functions, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
- Siapkan lingkungan pengembangan Anda.
Jika Anda sudah menginstal gcloud CLI, update dengan menjalankan perintah berikut:
gcloud components update
Memvisualisasikan aliran data.
Aliran data dalam aplikasi tutorial OCR melibatkan beberapa langkah:
- Gambar yang berisi teks dalam bahasa apa pun akan diupload ke Cloud Storage.
- Fungsi Cloud Run dipicu, yang menggunakan Vision API untuk mengekstrak teks dan mendeteksi bahasa sumber.
- Teks dimasukkan ke dalam antrean untuk diterjemahkan dengan memublikasikan pesan ke topik Pub/Sub. Terjemahan dimasukkan ke dalam antrean untuk setiap bahasa target yang berbeda dengan bahasa sumber.
- Jika bahasa target cocok dengan bahasa sumber, antrean terjemahan akan dilewati, dan teks akan dikirim ke antrean hasil, yang merupakan topik Pub/Sub yang berbeda.
- Fungsi Cloud Run menggunakan Translation API untuk menerjemahkan teks dalam antrean terjemahan. Hasil terjemahan dikirim ke antrean hasil.
- Fungsi Cloud Run lainnya menyimpan teks terjemahan dari antrean hasil ke Cloud Storage.
- Hasilnya ditemukan di Cloud Storage sebagai file teks untuk setiap terjemahan.
Anda dapat memvisualisasikan langkah-langkahnya:
Menyiapkan aplikasi
Buat bucket Cloud Storage untuk mengupload gambar, dengan
YOUR_IMAGE_BUCKET_NAME
sebagai nama bucket yang unik secara global:gcloud storage buckets create gs://
YOUR_IMAGE_BUCKET_NAME
Buat bucket Cloud Storage untuk menyimpan terjemahan teks, dengan
YOUR_RESULT_BUCKET_NAME
sebagai nama bucket yang unik secara global:gcloud storage buckets create gs://
YOUR_RESULT_BUCKET_NAME
Buat topik Pub/Sub untuk menjadi tujuan publikasi permintaan terjemahan, dengan
YOUR_TRANSLATE_TOPIC_NAME
sebagai nama topik permintaan terjemahan Anda:gcloud pubsub topics create
YOUR_TRANSLATE_TOPIC_NAME
Buat topik Pub/Sub untuk menjadi tujuan publikasi hasil terjemahan yang sudah selesai, dengan
YOUR_RESULT_TOPIC_NAME
sebagai nama topik hasil terjemahan Anda:gcloud pubsub topics create
YOUR_RESULT_TOPIC_NAME
Clone repositori aplikasi contoh ke komputer lokal Anda:
Node.js
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Python
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Go
git clone https://github.com/GoogleCloudPlatform/golang-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Java
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Ubah ke direktori yang berisi kode contoh fungsi Cloud Run:
Node.js
cd nodejs-docs-samples/functions/ocr/app/
Python
cd python-docs-samples/functions/ocr/app/
Go
cd golang-samples/functions/ocr/app/
Java
cd java-docs-samples/functions/ocr/ocr-process-image/
Memahami kode
Mengimpor dependensi
Aplikasi harus mengimpor beberapa dependensi untuk berkomunikasi dengan layanan Google Cloud Platform:
Node.js
Python
Go
Java
Memproses gambar
Fungsi berikut membaca file gambar yang diupload dari Cloud Storage dan memanggil fungsi untuk mendeteksi apakah gambar berisi teks:
Node.js
Python
Go
Java
Fungsi berikut mengekstrak teks dari gambar menggunakan Vision API dan mengantrekan teks tersebut untuk diterjemahkan:
Node.js
Python
Go
Java
Menerjemahkan teks
Fungsi berikut menerjemahkan teks yang diekstrak dan mengantrekan teks terjemahan untuk disimpan kembali ke Cloud Storage:
Node.js
Python
Go
Java
Menyimpan terjemahan
Terakhir, fungsi berikut menerima teks terjemahan dan menyimpannya kembali ke Cloud Storage:
Node.js
Python
Go
Java
Men-deploy fungsi
Untuk men-deploy fungsi pemrosesan image dengan pemicu Cloud Storage, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-extract \ --runtime nodejs22 \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point processImage \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-extract \ --runtime python312 \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point process_image \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-extract \ --runtime go122 \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point ProcessImage \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-extract \ --entry-point functions.OcrProcessImage \ --runtime java21 \ --memory 512MB \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.dengan
YOUR_IMAGE_BUCKET_NAME
adalah nama bucket Cloud Storage tempat Anda akan mengupload gambar.Untuk men-deploy fungsi terjemahan teks dengan pemicu Pub/Sub, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-translate \ --runtime nodejs22 \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point translateText \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-translate \ --runtime python312 \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point translate_text \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-translate \ --runtime go122 \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point TranslateText \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-translate \ --entry-point functions.OcrTranslateText \ --runtime java21 \ --memory 512MB \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.Untuk men-deploy fungsi yang menyimpan hasil ke Cloud Storage dengan pemicu Cloud Pub/Sub, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-save \ --runtime nodejs22 \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point saveResult \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-save \ --runtime python312 \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point save_result \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-save \ --runtime go122 \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point SaveResult \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-save \ --entry-point functions.OcrSaveResult \ --runtime java21 \ --memory 512MB \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.
Mengupload gambar
Upload gambar ke bucket Cloud Storage gambar Anda:
gcloud storage cp
PATH_TO_IMAGE
gs://YOUR_IMAGE_BUCKET_NAME
dengan
PATH_TO_IMAGE
adalah jalur ke file gambar (yang berisi teks) di sistem lokal Anda.YOUR_IMAGE_BUCKET_NAME
adalah nama bucket tempat Anda mengupload gambar.
Anda dapat mendownload salah satu gambar dari project contoh.
Perhatikan log untuk memastikan eksekusi telah selesai:
gcloud functions logs read --limit 100
Anda dapat melihat terjemahan yang disimpan di bucket Cloud Storage yang Anda gunakan untuk
YOUR_RESULT_BUCKET_NAME
.
Pembersihan
Agar tidak dikenakan biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, hapus project yang berisi resource tersebut, atau simpan project dan hapus setiap resource-nya.
Menghapus project
Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk tutorial.
Untuk menghapus project:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Menghapus fungsi
Menghapus fungsi Cloud Run tidak akan menghapus resource apa pun yang tersimpan di Cloud Storage.
Untuk menghapus fungsi Cloud Run yang Anda buat dalam tutorial ini, jalankan perintah berikut:
gcloud functions delete ocr-extract gcloud functions delete ocr-translate gcloud functions delete ocr-save
Anda juga dapat menghapus fungsi Cloud Run dari Konsol Google Cloud.