Scopri come eseguire il riconoscimento ottico dei caratteri (OCR) su Google Cloud Platform. Questo tutorial mostra come caricare file immagine in Google Cloud Storage, estrarre il testo dalle immagini utilizzando l'API Google Cloud Vision, tradurre il testo utilizzando l'API Google Cloud Translation e salvare le traduzioni in Cloud Storage. Google Cloud Pub/Sub viene utilizzato per inserire in coda diverse attività e attivare le funzioni Cloud Functions appropriate per eseguirle.
Obiettivi
- Scrivi ed esegui il deployment di diverse Cloud Functions in background.
- Carica immagini in Cloud Storage.
- Consente di estrarre, tradurre e salvare il testo contenuto nelle immagini caricate.
Costi
Questo tutorial utilizza i seguenti componenti fatturabili di Google Cloud:
- Cloud Functions
- Pub/Sub
- Cloud Storage
- API Cloud Translation
- Cloud Vision
Per generare una stima dei costi in base all'utilizzo previsto,
utilizza il Calcolatore prezzi.
Prima di iniziare
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.
-
Abilita le API Cloud Functions, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision.
- Installa e inizializza l'interfaccia a riga di comando di Google Cloud.
-
Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.
-
Abilita le API Cloud Functions, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision.
- Installa e inizializza l'interfaccia a riga di comando di Google Cloud.
- Prepara l'ambiente di sviluppo.
Se hai già installato l'interfaccia a riga di comando gcloud, aggiornala eseguendo il comando seguente:
gcloud components update
Visualizzazione del flusso di dati
Il flusso di dati nell'applicazione tutorial OCR prevede diversi passaggi:
- Un'immagine contenente testo in qualsiasi lingua viene caricata in Cloud Storage.
- Viene attivata una Funzione Cloud, che utilizza l'API Vision per estrarre il testo e rilevare la lingua di origine.
- Il testo è in coda per la traduzione pubblicando un messaggio in un argomento Pub/Sub. Una traduzione è in coda per ogni lingua di destinazione, diversa dalla lingua di origine.
- Se una lingua di destinazione corrisponde alla lingua di origine, la coda di traduzione viene ignorata e il testo viene inviato alla coda dei risultati, un altro argomento Pub/Sub.
- Una Funzione Cloud utilizza l'API Translation per tradurre il testo nella coda di traduzione. Il risultato tradotto viene inviato alla coda dei risultati.
- Un'altra funzione Cloud salva il testo tradotto dalla coda dei risultati a Cloud Storage.
- In Cloud Storage, i risultati sono disponibili come file
txt
per ogni traduzione.
Potrebbe essere utile visualizzare i passaggi:
Preparazione dell'applicazione
Crea un bucket Cloud Storage in cui caricare le immagini, dove
YOUR_IMAGE_BUCKET_NAME
è un nome univoco per un bucket globale:gsutil mb gs://
YOUR_IMAGE_BUCKET_NAME
Crea un bucket di Cloud Storage in cui salvare le traduzioni di testo, dove
YOUR_RESULT_BUCKET_NAME
è un nome di bucket univoco a livello globale:gsutil mb gs://
YOUR_RESULT_BUCKET_NAME
Crea un argomento Cloud Pub/Sub a cui pubblicare le richieste di traduzione, dove
YOUR_TRANSLATE_TOPIC_NAME
è il nome dell'argomento della tua richiesta di traduzione:gcloud pubsub topics create
YOUR_TRANSLATE_TOPIC_NAME
Crea un argomento Cloud Pub/Sub in cui pubblicare i risultati della traduzione completa, dove
YOUR_RESULT_TOPIC_NAME
è il nome dell'argomento dei risultati della traduzione:gcloud pubsub topics create
YOUR_RESULT_TOPIC_NAME
Clonare il repository dell'app di esempio sul computer locale:
Node.js
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git
In alternativa, puoi scaricare l'esempio come file ZIP ed estrarlo.
Python
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
In alternativa, puoi scaricare l'esempio come file ZIP ed estrarlo.
Go
git clone https://github.com/GoogleCloudPlatform/golang-samples.git
In alternativa, puoi scaricare l'esempio come file ZIP ed estrarlo.
Java
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
In alternativa, puoi scaricare l'esempio come file ZIP ed estrarlo.
Passa alla directory che contiene il codice di esempio di Cloud Functions:
Node.js
cd nodejs-docs-samples/functions/ocr/app/
Python
cd python-docs-samples/functions/ocr/app/
Go
cd golang-samples/functions/ocr/app/
Java
cd java-docs-samples/functions/ocr/ocr-process-image/
Nozioni di base sul codice
Importazione delle dipendenze
L'applicazione deve importare diverse dipendenze per comunicare con i servizi di Google Cloud Platform:
Node.js
Python
Go
Java
Elaborazione delle immagini
La seguente funzione legge un file immagine caricato da Cloud Storage e richiama una funzione per rilevare se l'immagine contiene testo:
Node.js
Python
Go
Java
La seguente funzione estrae il testo dall'immagine utilizzando l'API Cloud Vision e mette in coda il testo per la traduzione:
Node.js
Python
Go
Java
Traduzione di testo
La seguente funzione traduce il testo estratto e inserisce in coda il testo tradotto per salvarlo in Cloud Storage:
Node.js
Python
Go
Java
Salvataggio delle traduzioni
Infine, la seguente funzione riceve il testo tradotto e lo salva in Cloud Storage:
Node.js
Python
Go
Java
Deployment delle funzioni
Questa sezione descrive come eseguire il deployment delle funzioni.
Per eseguire il deployment della funzione di elaborazione delle immagini con un trigger di Cloud Storage, esegui il seguente comando nella directory che contiene il codice di esempio (o, nel caso di Java, il file
pom.xml
):Node.js
gcloud functions deploy ocr-extract \ --runtime nodejs16 \
Puoi utilizzare i seguenti valori per il flag
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point processImage \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
per specificare la versione Node.js preferita:nodejs16
(consigliato)nodejs14
nodejs12
nodejs10
Python
gcloud functions deploy ocr-extract \ --runtime python39 \
Puoi utilizzare i seguenti valori per il flag
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point process_image \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
per specificare la versione Python preferita:python39
(consigliato)python38
python37
Go
gcloud functions deploy ocr-extract \ --runtime go116 \
Puoi utilizzare i seguenti valori per il flag
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--entry-point ProcessImage \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
per specificare la versione Go preferita:go116
(consigliato)go113
go111
Java
gcloud functions deploy ocr-extract \ --entry-point functions.OcrProcessImage \ --runtime java11 \ --memory 512MB \
Puoi utilizzare i seguenti valori per il flag
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"--runtime
per specificare la tua versione di Java preferita:java17
(anteprima)java11
(consigliato)
dove
YOUR_IMAGE_BUCKET_NAME
è il nome del tuo bucket di Cloud Storage in cui caricherai le immagini.Per eseguire il deployment della funzione di traduzione del testo con un trigger di Cloud Pub/Sub, esegui il seguente comando nella directory che contiene il codice di esempio (o, nel caso di Java, il file
pom.xml
):Node.js
gcloud functions deploy ocr-translate \ --runtime nodejs16 \
Puoi utilizzare i seguenti valori per il flag
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point translateText \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
per specificare la versione Node.js preferita:nodejs16
(consigliato)nodejs14
nodejs12
nodejs10
Python
gcloud functions deploy ocr-translate \ --runtime python39 \
Puoi utilizzare i seguenti valori per il flag
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point translate_text \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
per specificare la versione Python preferita:python39
(consigliato)python38
python37
Go
gcloud functions deploy ocr-translate \ --runtime go116 \
Puoi utilizzare i seguenti valori per il flag
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--entry-point TranslateText \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
per specificare la versione Go preferita:go116
(consigliato)go113
go111
Java
gcloud functions deploy ocr-translate \ --entry-point functions.OcrTranslateText \ --runtime java11 \ --memory 512MB \
Puoi utilizzare i seguenti valori per il flag
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"--runtime
per specificare la tua versione di Java preferita:java17
(anteprima)java11
(consigliato)
Per eseguire il deployment della funzione che salva i risultati in Cloud Storage con un trigger di Cloud Pub/Sub, esegui il comando seguente nella directory che contiene il codice di esempio (o, nel caso di Java, il file
pom.xml
):Node.js
gcloud functions deploy ocr-save \ --runtime nodejs16 \
Puoi utilizzare i seguenti valori per il flag
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point saveResult \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
per specificare la versione Node.js preferita:nodejs16
(consigliato)nodejs14
nodejs12
nodejs10
Python
gcloud functions deploy ocr-save \ --runtime python39 \
Puoi utilizzare i seguenti valori per il flag
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point save_result \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
per specificare la versione Python preferita:python39
(consigliato)python38
python37
Go
gcloud functions deploy ocr-save \ --runtime go116 \
Puoi utilizzare i seguenti valori per il flag
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--entry-point SaveResult \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
per specificare la versione Go preferita:go116
(consigliato)go113
go111
Java
gcloud functions deploy ocr-save \ --entry-point functions.OcrSaveResult \ --runtime java11 \ --memory 512MB \
Puoi utilizzare i seguenti valori per il flag
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"--runtime
per specificare la tua versione di Java preferita:java17
(anteprima)java11
(consigliato)
Caricamento di un'immagine
Carica un'immagine nel bucket di Cloud Storage dell'immagine:
gsutil cp
PATH_TO_IMAGE
gs://YOUR_IMAGE_BUCKET_NAME
dove
PATH_TO_IMAGE
è un percorso a un file immagine (che contiene testo) sul tuo sistema locale.YOUR_IMAGE_BUCKET_NAME
è il nome del bucket in cui stai caricando le immagini.
Puoi scaricare una delle immagini dal progetto di esempio.
Controlla i log per assicurarti che le esecuzioni siano state completate:
gcloud functions logs read --limit 100
Puoi visualizzare le traduzioni salvate nel bucket di Cloud Storage che hai utilizzato per
YOUR_RESULT_BUCKET_NAME
.
Esegui la pulizia
Per evitare che al tuo Account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
Elimina il progetto
Il modo più semplice per eliminare la fatturazione è eliminare il progetto che hai creato per il tutorial.
Per eliminare il progetto:
- In Cloud Console, vai alla pagina Gestisci risorse.
- Nell'elenco dei progetti, seleziona il progetto da eliminare, quindi fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.
Eliminazione di Cloud Functions
L'eliminazione di Cloud Functions non rimuove le risorse archiviate in Cloud Storage.
Per eliminare le funzioni di Cloud Functions create in questo tutorial, esegui i comandi seguenti:
gcloud functions delete ocr-extract gcloud functions delete ocr-translate gcloud functions delete ocr-save
Puoi anche eliminare Cloud Functions da Google Cloud Console.