Scopri come eseguire il riconoscimento ottico dei caratteri (OCR) su Google Cloud Platform. Questo tutorial mostra come caricare i file immagine in Cloud Storage, estrarre il testo dalle immagini utilizzando Cloud Vision, tradurre il testo utilizzando l'API Cloud Translation e salvare le traduzioni in Cloud Storage. Pub/Sub viene utilizzato per mettere in coda varie attività e attivare le funzioni Cloud Functions appropriate per eseguirle.
Per ulteriori informazioni sull'invio di una richiesta di rilevamento del testo (OCR), vedi Rilevamento del testo nelle immagini, Rilevamento della scrittura a mano libera nelle immagini o Rileva testo nei file (PDF/TIFF).
Obiettivi
- Scrivere ed eseguire il deployment di diverse funzioni basate su eventi.
- Carica le immagini su Cloud Storage.
- Estrai, traduci e salva il testo contenuto nelle immagini caricate.
Costi
In questo documento utilizzi i seguenti componenti fatturabili di Google Cloud:
- Cloud Functions
- Cloud Build
- Pub/Sub
- Artifact Registry
- Eventarc
- Cloud Run
- Cloud Logging
- Cloud Storage
- API Cloud Translation
- Cloud Vision
Per generare una stima dei costi in base all'utilizzo previsto,
utilizza il Calcolatore prezzi.
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Functions, Cloud Build, Cloud Run, Artifact Registry, Eventarc, Logging, Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Functions, Cloud Build, Cloud Run, Artifact Registry, Eventarc, Logging, Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision APIs.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
- Preparare l'ambiente di sviluppo.
Se hai già installato gcloud CLI, aggiornalo eseguendo questo comando:
gcloud components update
Visualizza il flusso di dati
Il flusso di dati nell'applicazione del tutorial su OCR prevede diversi passaggi:
- In Cloud Storage viene caricata un'immagine che contiene testo in qualsiasi lingua.
- Viene attivata una Cloud Function, che utilizza l'API Vision per estrarre il testo e rilevare la lingua di origine.
- Il testo viene messo in coda per la traduzione pubblicando un messaggio in un argomento Pub/Sub. Viene messa in coda una traduzione per ogni lingua di destinazione diversa da quella di origine.
- Se una lingua di destinazione corrisponde alla lingua di origine, la coda di traduzione viene saltata e il testo viene inviato alla coda dei risultati, che rappresenta un argomento Pub/Sub diverso.
- Una Cloud Function usa l'API Translation per tradurre il testo nella coda di traduzione. Il risultato tradotto viene inviato alla coda dei risultati.
- Un'altra funzione Cloud Functions salva il testo tradotto dalla coda dei risultati su Cloud Storage.
- I risultati vengono trovati in Cloud Storage come file di testo per ogni traduzione.
Potrebbe essere utile visualizzare i passaggi:
prepara l'applicazione
Crea un bucket Cloud Storage in cui caricare le immagini, dove
YOUR_IMAGE_BUCKET_NAME
è un nome di bucket univoco a livello globale:gsutil mb gs://
YOUR_IMAGE_BUCKET_NAME
Crea un bucket Cloud Storage in cui salvare le traduzioni del testo, dove
YOUR_RESULT_BUCKET_NAME
è un nome di bucket univoco a livello globale:gsutil mb gs://
YOUR_RESULT_BUCKET_NAME
Crea un argomento Cloud Pub/Sub in cui pubblicare richieste di traduzione, dove
YOUR_TRANSLATE_TOPIC_NAME
è il nome dell'argomento della richiesta di traduzione:gcloud pubsub topics create
YOUR_TRANSLATE_TOPIC_NAME
Crea un argomento Cloud Pub/Sub in cui pubblicare i risultati della traduzione completati, dove
YOUR_RESULT_TOPIC_NAME
è il nome dell'argomento dei risultati di traduzione:gcloud pubsub topics create
YOUR_RESULT_TOPIC_NAME
Clona il repository dell'app di esempio sulla tua macchina locale:
Node.js
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git
In alternativa, puoi scaricare l'esempio come file ZIP ed estrarlo.
Python
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
In alternativa, puoi scaricare l'esempio come file ZIP ed estrarlo.
Go
git clone https://github.com/GoogleCloudPlatform/golang-samples.git
In alternativa, puoi scaricare l'esempio come file ZIP ed estrarlo.
Java
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
In alternativa, puoi scaricare l'esempio come file ZIP ed estrarlo.
Passa alla directory che contiene il codice di esempio di Cloud Functions:
Node.js
cd nodejs-docs-samples/functions/v2/ocr/app/
Python
cd python-docs-samples/functions/v2/ocr/
Go
cd golang-samples/functions/functionsv2/ocr/app/
Java
cd java-docs-samples/functions/v2/ocr/ocr-process-image/
comprendi il codice
Questa sezione descrive le dipendenze e le funzioni che compongono il campione OCR.
Importa dipendenze
L'applicazione deve importare diverse dipendenze per comunicare con i servizi Google Cloud Platform:
Node.js
Python
Go
Java
Elabora le immagini
La seguente funzione legge un file immagine caricato da Cloud Storage e chiama una funzione per rilevare se l'immagine contiene testo:
Node.js
Python
Go
Java
La funzione seguente estrae il testo dall'immagine utilizzando l'API Cloud Vision e lo mette in coda per la traduzione:
Node.js
Python
Go
Java
Traduci testo
La seguente funzione traduce il testo estratto e mette in coda il testo tradotto da salvare di nuovo in Cloud Storage:
Node.js
Python
Go
Java
Salva le traduzioni
Infine, la funzione seguente riceve il testo tradotto e lo salva nuovamente in Cloud Storage:
Node.js
Python
Go
Java
esegui il deployment delle funzioni
Per eseguire il deployment della funzione di elaborazione delle immagini con un trigger di Cloud Storage, esegui questo comando nella directory che contiene il codice campione (o, nel caso di Java, il file
pom.xml
):Node.js
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=processImage \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione di Node.js supportata per eseguire la funzione.Python
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=process_image \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione Python supportata per eseguire la funzione.Go
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=process-image \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione Go supportata per eseguire la funzione.Java
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrProcessImage \ --memory=512MB \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione Java supportata per eseguire la funzione.Sostituisci quanto segue:
- REGION: il nome della regione Google Cloud in cui vuoi eseguire il deployment della funzione (ad esempio
us-west1
). - YOUR_IMAGE_BUCKET_NAME: il nome del bucket Cloud Storage in cui caricherai le immagini. Quando esegui il deployment di funzioni di 2ª generazione, specifica solo il nome del bucket senza il carattere
gs://
iniziale, ad esempio--trigger-event-filters="bucket=my-bucket"
.
- REGION: il nome della regione Google Cloud in cui vuoi eseguire il deployment della funzione (ad esempio
Per eseguire il deployment della funzione di traduzione del testo con un trigger di Cloud Pub/Sub, esegui questo comando nella directory che contiene il codice campione (o, nel caso di Java, il file
pom.xml
):Node.js
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=translateText \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione di Node.js supportata per eseguire la funzione.Python
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=translate_text \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione Python supportata per eseguire la funzione.Go
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=translate-text \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione Go supportata per eseguire la funzione.Java
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrTranslateText \ --memory=512MB \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione Java supportata per eseguire la funzione.Per eseguire il deployment della funzione che salva i risultati in Cloud Storage con un trigger di Cloud Pub/Sub, esegui questo comando nella directory che contiene il codice campione (o, nel caso di Java, il file
pom.xml
):Node.js
gcloud functions deploy ocr-save \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=saveResult \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione di Node.js supportata per eseguire la funzione.Python
gcloud functions deploy ocr-save \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=save_result \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione Python supportata per eseguire la funzione.Go
gcloud functions deploy ocr-save \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=save-result \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione Go supportata per eseguire la funzione.Java
gcloud functions deploy ocr-save \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrSaveResult \ --memory=512MB \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Utilizza il flag
--runtime
per specificare l'ID runtime di una versione Java supportata per eseguire la funzione.
Carica un'immagine
Carica un'immagine nel tuo bucket Cloud Storage immagine:
gsutil cp
PATH_TO_IMAGE
gs://YOUR_IMAGE_BUCKET_NAME
dove
PATH_TO_IMAGE
è un percorso a un file immagine (che contiene testo) sul tuo sistema locale.YOUR_IMAGE_BUCKET_NAME
è il nome del bucket in cui stai caricando le immagini.
Puoi scaricare una delle immagini dal progetto di esempio.
Controlla i log per assicurarti che le esecuzioni siano state completate:
gcloud functions logs read --limit 100
Puoi visualizzare le traduzioni salvate nel bucket Cloud Storage che hai utilizzato per
YOUR_RESULT_BUCKET_NAME
.
Esegui la pulizia
Per evitare che al tuo Account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
Elimina il progetto
Il modo più semplice per eliminare la fatturazione è eliminare il progetto che hai creato per il tutorial.
Per eliminare il progetto:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Elimina Cloud Functions
L'eliminazione di Cloud Functions non rimuove le risorse archiviate in Cloud Storage.
Per eliminare le funzioni Cloud Functions create in questo tutorial, esegui questi comandi:
gcloud functions delete ocr-extract gcloud functions delete ocr-translate gcloud functions delete ocr-save
Puoi anche eliminare Cloud Functions dalla console Google Cloud.