Pelajari cara melakukan pengenalan karakter optik (OCR) di Google Cloud. Ini ini menunjukkan cara mengunggah file gambar ke Cloud Storage, ekstrak teks dari gambar menggunakan Cloud Vision API, terjemahkan teks menggunakan Google Cloud Translation API, dan simpan kembali terjemahan Anda ke yang sesuai di Cloud Storage. Pub/Sub digunakan untuk mengantrekan berbagai tugas dan memicu fungsi Cloud Run yang tepat untuk melaksanakannya.
Untuk informasi selengkapnya tentang cara mengirim permintaan deteksi teks (OCR), lihat Mendeteksi teks dalam gambar, Mendeteksi tulis tangan dalam gambar, atau Mendeteksi teks dalam file (PDF/TIFF).
Tujuan
- Tulis dan deploy beberapa fungsi Cloud Run Latar Belakang.
- Mengupload gambar ke Cloud Storage.
- Mengekstrak, menerjemahkan, dan menyimpan teks yang ada dalam gambar yang diupload.
Biaya
Dalam dokumen ini, Anda menggunakan komponen Google Cloud yang dapat ditagih berikut:
- Cloud Run functions
- Pub/Sub
- Cloud Storage
- Cloud Translation API
- Cloud Vision
Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda,
gunakan kalkulator harga.
Sebelum memulai
- Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
-
Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.
-
Aktifkan API Cloud Functions, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision.
- Menginstal Google Cloud CLI.
-
Untuk initialize gcloud CLI, jalankan perintah berikut:
gcloud init
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
-
Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.
-
Aktifkan API Cloud Functions, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision.
- Menginstal Google Cloud CLI.
-
Untuk initialize gcloud CLI, jalankan perintah berikut:
gcloud init
- Siapkan lingkungan pengembangan Anda.
Jika Anda sudah menginstal gcloud CLI, update dengan menjalankan perintah berikut:
gcloud components update
Memvisualisasikan aliran data.
Aliran data dalam aplikasi tutorial OCR melibatkan beberapa langkah:
- Gambar yang berisi teks dalam bahasa apa pun akan diupload ke Cloud Storage.
- Fungsi Cloud Run dipicu, yang menggunakan Vision API untuk mengekstrak teks dan mendeteksi bahasa sumber.
- Teks dimasukkan ke dalam antrean untuk diterjemahkan dengan memublikasikan pesan ke topik Pub/Sub. Terjemahan dimasukkan ke dalam antrean untuk setiap bahasa target yang berbeda dengan bahasa sumber.
- Jika bahasa target cocok dengan bahasa sumber, antrean terjemahan akan dilewati, dan teks akan dikirim ke antrean hasil, yang merupakan topik Pub/Sub yang berbeda.
- Fungsi Cloud Run menggunakan Translation API untuk menerjemahkan teks dalam antrean terjemahan. Hasil terjemahan dikirim ke antrean hasil.
- Fungsi Cloud Run lain menyimpan teks terjemahan dari hasil ke Cloud Storage.
- Hasilnya ditemukan di Cloud Storage sebagai file teks untuk setiap terjemahan.
Anda dapat memvisualisasikan langkah-langkahnya:
Menyiapkan aplikasi
Buat bucket Cloud Storage untuk mengupload gambar, dengan
YOUR_IMAGE_BUCKET_NAME
sebagai nama bucket yang unik secara global:gcloud storage buckets create gs://
YOUR_IMAGE_BUCKET_NAME
Buat bucket Cloud Storage untuk menyimpan terjemahan teks, dengan
YOUR_RESULT_BUCKET_NAME
sebagai nama bucket yang unik secara global:gcloud storage buckets create gs://
YOUR_RESULT_BUCKET_NAME
Buat topik Pub/Sub untuk memublikasikan permintaan terjemahan, dengan
YOUR_TRANSLATE_TOPIC_NAME
adalah nama topik permintaan terjemahan:gcloud pubsub topics create
YOUR_TRANSLATE_TOPIC_NAME
Buat topik Pub/Sub untuk memublikasikan hasil terjemahan yang sudah selesai, dengan
YOUR_RESULT_TOPIC_NAME
adalah nama topik hasil terjemahan:gcloud pubsub topics create
YOUR_RESULT_TOPIC_NAME
Clone repositori aplikasi contoh ke komputer lokal Anda:
Node.js
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Python
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Go
git clone https://github.com/GoogleCloudPlatform/golang-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Java
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
Atau, Anda dapat mendownload contoh dalam file ZIP dan mengekstraknya.
Ubah ke direktori yang berisi contoh fungsi Cloud Run kode:
Node.js
cd nodejs-docs-samples/functions/ocr/app/
Python
cd python-docs-samples/functions/ocr/app/
Go
cd golang-samples/functions/ocr/app/
Java
cd java-docs-samples/functions/ocr/ocr-process-image/
Memahami kode
Mengimpor dependensi
Aplikasi harus mengimpor beberapa dependensi untuk berkomunikasi dengan layanan Google Cloud Platform:
Node.js
Python
Go
Java
Memproses gambar
Fungsi berikut membaca file gambar yang diupload dari Cloud Storage dan memanggil fungsi untuk mendeteksi apakah gambar berisi teks:
Node.js
Python
Go
Java
Fungsi berikut mengekstrak teks dari gambar menggunakan Vision API dan mengantrekan teks untuk diterjemahkan:
Node.js
Python
Go
Java
Menerjemahkan teks
Fungsi berikut menerjemahkan teks yang diekstrak dan mengantrekan teks terjemahan untuk disimpan kembali ke Cloud Storage:
Node.js
Python
Go
Java
Menyimpan terjemahan
Terakhir, fungsi berikut menerima teks terjemahan dan menyimpannya kembali ke Cloud Storage:
Node.js
Python
Go
Java
Men-deploy fungsi
Untuk men-deploy fungsi pemrosesan image dengan pemicu Cloud Storage, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-extract \ --runtime nodejs20 \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point processImage \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-extract \ --runtime python312 \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point process_image \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-extract \ --runtime go121 \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point ProcessImage \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-extract \ --entry-point functions.OcrProcessImage \ --runtime java17 \ --memory 512MB \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.dengan
YOUR_IMAGE_BUCKET_NAME
adalah nama bucket Cloud Storage tempat Anda akan mengupload gambar.Untuk men-deploy fungsi terjemahan teks dengan pemicu Pub/Sub, jalankan perintah berikut di direktori yang berisi kode sampel (atau dalam kasus Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-translate \ --runtime nodejs20 \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point translateText \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-translate \ --runtime python312 \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point translate_text \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-translate \ --runtime go121 \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point TranslateText \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-translate \ --entry-point functions.OcrTranslateText \ --runtime java17 \ --memory 512MB \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.Untuk men-deploy fungsi yang menyimpan hasil ke Cloud Storage dengan pemicu Cloud Pub/Sub, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-save \ --runtime nodejs20 \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point saveResult \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-save \ --runtime python312 \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point save_result \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-save \ --runtime go121 \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point SaveResult \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-save \ --entry-point functions.OcrSaveResult \ --runtime java17 \ --memory 512MB \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.
Mengupload gambar
Upload gambar ke bucket Cloud Storage gambar Anda:
gcloud storage cp
PATH_TO_IMAGE
gs://YOUR_IMAGE_BUCKET_NAME
dengan
PATH_TO_IMAGE
adalah jalur ke file gambar (yang berisi teks) di sistem lokal Anda.YOUR_IMAGE_BUCKET_NAME
adalah nama bucket tempat Anda mengupload gambar.
Anda dapat mendownload salah satu gambar dari project contoh.
Perhatikan log untuk memastikan eksekusi telah selesai:
gcloud functions logs read --limit 100
Anda dapat melihat terjemahan yang disimpan di bucket Cloud Storage yang Anda gunakan untuk
YOUR_RESULT_BUCKET_NAME
.
Pembersihan
Agar tidak dikenakan biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, hapus project yang berisi resource tersebut, atau simpan project dan hapus setiap resource-nya.
Menghapus project
Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk tutorial.
Untuk menghapus project:
- Di konsol Google Cloud, buka halaman Manage resource.
- Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
- Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.
Menghapus fungsi
Menghapus fungsi Cloud Run tidak menghapus resource apa pun yang disimpan di Cloud Storage.
Untuk menghapus fungsi Cloud Run yang Anda buat dalam tutorial ini, jalankan perintah berikut:
gcloud functions delete ocr-extract gcloud functions delete ocr-translate gcloud functions delete ocr-save
Anda juga dapat menghapus fungsi Cloud Run dari Konsol Google Cloud.