Pelajari cara melakukan pengenalan karakter optik (OCR) di Google Cloud Platform. Tutorial ini menunjukkan cara mengupload file gambar ke Cloud Storage, mengekstrak teks dari gambar menggunakan Cloud Vision, menerjemahkan teks menggunakan Cloud Translation API, lalu menyimpan kembali terjemahan Anda ke Cloud Storage. Pub/Sub digunakan untuk mengantrekan berbagai tugas dan memicu fungsi Cloud Run yang tepat untuk menjalankannya.
Untuk informasi selengkapnya tentang cara mengirim permintaan deteksi teks (OCR), lihat Mendeteksi teks dalam gambar, Mendeteksi tulis tangan dalam gambar, atau Mendeteksi teks dalam file (PDF/TIFF).
Tujuan
- Menulis dan men-deploy beberapa fungsi berbasis peristiwa.
- Mengupload gambar ke Cloud Storage.
- Mengekstrak, menerjemahkan, dan menyimpan teks yang ada dalam gambar yang diupload.
Biaya
Dalam dokumen ini, Anda akan menggunakan komponen Google Cloud yang dapat ditagih berikut:
- Cloud Run functions
- Cloud Build
- Pub/Sub
- Artifact Registry
- Eventarc
- Cloud Run
- Cloud Logging
- Cloud Storage
- Cloud Translation API
- Cloud Vision
Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda,
gunakan kalkulator harga.
Sebelum memulai
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Functions, Cloud Build, Cloud Run, Artifact Registry, Eventarc, Logging, Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Functions, Cloud Build, Cloud Run, Artifact Registry, Eventarc, Logging, Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
- Siapkan lingkungan pengembangan Anda.
Jika Anda sudah menginstal gcloud CLI, update dengan menjalankan perintah berikut:
gcloud components update
Memvisualisasikan aliran data
Alur data dalam aplikasi tutorial OCR melibatkan beberapa langkah:
- Gambar yang berisi teks dalam bahasa apa pun akan diupload ke Cloud Storage.
- Fungsi Cloud Run dipicu, yang menggunakan Vision API untuk mengekstrak teks dan mendeteksi bahasa sumber.
- Teks dimasukkan ke dalam antrean untuk diterjemahkan dengan memublikasikan pesan ke topik Pub/Sub. Terjemahan dimasukkan ke dalam antrean untuk setiap bahasa target yang berbeda dengan bahasa sumber.
- Jika bahasa target cocok dengan bahasa sumber, antrean terjemahan akan dilewati, dan teks akan dikirim ke antrean hasil, yang merupakan topik Pub/Sub yang berbeda.
- Fungsi Cloud Run menggunakan Cloud Translation API untuk menerjemahkan teks dalam antrean terjemahan. Hasil terjemahan dikirim ke antrean hasil.
- Fungsi Cloud Run lainnya menyimpan teks terjemahan dari antrean hasil ke Cloud Storage.
- Hasilnya ditemukan di Cloud Storage sebagai file teks untuk setiap terjemahan.
Anda dapat memvisualisasikan langkah-langkahnya:
Menyiapkan aplikasi
Buat bucket Cloud Storage untuk mengupload gambar, dengan
YOUR_IMAGE_BUCKET_NAME
sebagai nama bucket yang unik secara global:gcloud storage buckets create gs://
YOUR_IMAGE_BUCKET_NAME
Buat bucket Cloud Storage untuk menyimpan terjemahan teks, dengan
YOUR_RESULT_BUCKET_NAME
sebagai nama bucket yang unik secara global:gcloud storage buckets create gs://
YOUR_RESULT_BUCKET_NAME
Buat topik Pub/Sub untuk menjadi tujuan publikasi permintaan terjemahan, dengan
YOUR_TRANSLATE_TOPIC_NAME
sebagai nama topik permintaan terjemahan Anda:gcloud pubsub topics create
YOUR_TRANSLATE_TOPIC_NAME
Buat topik Pub/Sub untuk menjadi tujuan publikasi hasil terjemahan yang sudah selesai, dengan
YOUR_RESULT_TOPIC_NAME
sebagai nama topik hasil terjemahan Anda:gcloud pubsub topics create
YOUR_RESULT_TOPIC_NAME
Clone repositori aplikasi contoh ke komputer lokal Anda:
Node.js
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Python
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Go
git clone https://github.com/GoogleCloudPlatform/golang-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Java
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Ubah ke direktori yang berisi kode contoh fungsi Cloud Run:
Node.js
cd nodejs-docs-samples/functions/v2/ocr/app/
Python
cd python-docs-samples/functions/v2/ocr/
Go
cd golang-samples/functions/functionsv2/ocr/app/
Java
cd java-docs-samples/functions/v2/ocr/ocr-process-image/
Memahami kode
Bagian ini menjelaskan dependensi dan fungsi yang membentuk sampel OCR.
Mengimpor dependensi
Aplikasi harus mengimpor beberapa dependensi untuk berkomunikasi dengan layanan Google Cloud Platform:
Node.js
Python
Go
Java
Memproses gambar
Fungsi berikut membaca file gambar yang diupload dari Cloud Storage dan memanggil fungsi untuk mendeteksi apakah gambar berisi teks:
Node.js
Python
Go
Java
Fungsi berikut mengekstrak teks dari gambar menggunakan Vision API dan mengantrekan teks tersebut untuk diterjemahkan:
Node.js
Python
Go
Java
Menerjemahkan teks
Fungsi berikut menerjemahkan teks yang diekstrak dan mengantrekan teks terjemahan untuk disimpan kembali ke Cloud Storage:
Node.js
Python
Go
Java
Simpan terjemahan
Terakhir, fungsi berikut menerima teks terjemahan dan menyimpannya kembali ke Cloud Storage:
Node.js
Python
Go
Java
Men-deploy fungsi-fungsinya
Untuk men-deploy fungsi pemrosesan image dengan pemicu Cloud Storage, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=nodejs22 \ --region=
REGION
\ --source=. \ --entry-point=processImage \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=process_image \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=go122 \ --region=
REGION
\ --source=. \ --entry-point=process-image \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=java21 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrProcessImage \ --memory=512MB \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.Ganti kode berikut:
- REGION: Nama region Google Cloud tempat Anda ingin men-deploy fungsi (misalnya,
us-west1
). - YOUR_IMAGE_BUCKET_NAME: Nama bucket Cloud Storage tempat Anda akan mengupload gambar. Saat men-deploy fungsi Cloud Run, tentukan nama bucket saja tanpa awalan
gs://
; misalnya,--trigger-event-filters="bucket=my-bucket"
.
- REGION: Nama region Google Cloud tempat Anda ingin men-deploy fungsi (misalnya,
Untuk men-deploy fungsi terjemahan teks dengan pemicu Pub/Sub, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=nodejs22 \ --region=
REGION
\ --source=. \ --entry-point=translateText \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=translate_text \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=go122 \ --region=
REGION
\ --source=. \ --entry-point=translate-text \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=java21 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrTranslateText \ --memory=512MB \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.Untuk men-deploy fungsi yang menyimpan hasil ke Cloud Storage dengan pemicu Pub/Sub, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-save \ --gen2 \ --runtime=nodejs22 \ --region=
REGION
\ --source=. \ --entry-point=saveResult \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-save \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=save_result \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-save \ --gen2 \ --runtime=go122 \ --region=
REGION
\ --source=. \ --entry-point=save-result \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-save \ --gen2 \ --runtime=java21 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrSaveResult \ --memory=512MB \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.
Upload gambar
Upload gambar ke bucket Cloud Storage gambar Anda:
gcloud storage cp
PATH_TO_IMAGE
gs://YOUR_IMAGE_BUCKET_NAME
dengan
PATH_TO_IMAGE
adalah jalur ke file gambar (yang berisi teks) di sistem lokal Anda.YOUR_IMAGE_BUCKET_NAME
adalah nama bucket tempat Anda mengupload gambar.
Anda dapat mendownload salah satu gambar dari project contoh.
Perhatikan log untuk memastikan eksekusi telah selesai:
gcloud functions logs read --limit 100
Anda dapat melihat terjemahan yang disimpan di bucket Cloud Storage yang Anda gunakan untuk
YOUR_RESULT_BUCKET_NAME
.
Pembersihan
Agar tidak perlu membayar biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, hapus project yang berisi resource tersebut, atau simpan project dan hapus setiap resource.
Menghapus project
Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk tutorial.
Untuk menghapus project:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Hapus fungsi
Menghapus fungsi Cloud Run tidak akan menghapus resource apa pun yang tersimpan di Cloud Storage.
Untuk menghapus fungsi Cloud Run yang Anda buat dalam tutorial ini, jalankan perintah berikut:
gcloud functions delete ocr-extract gcloud functions delete ocr-translate gcloud functions delete ocr-save
Anda juga dapat menghapus fungsi Cloud Run dari Konsol Google Cloud.