Scopri come eseguire il riconoscimento ottico dei caratteri (OCR) su Google Cloud Piattaforma. Questo tutorial mostra come caricare file immagine Cloud Storage, estrai il testo dalle immagini utilizzando Cloud Vision, traduci il testo utilizzando API Cloud Translation e salva le traduzioni su di archiviazione ideale in Cloud Storage. Pub/Sub viene utilizzato per inserire in coda varie attività attivare le funzioni Cloud Functions adatte per eseguirle.
Per ulteriori informazioni sull'invio di una richiesta di rilevamento del testo (OCR), vedi Rileva testo nelle immagini, Rileva la scrittura a mano libera nelle immagini oppure Rileva il testo nei file (PDF/TIFF).
Obiettivi
- Scrivere ed eseguire il deployment di diverse funzioni basate su eventi.
- Carica le immagini su Cloud Storage.
- Estrai, traduci e salva il testo contenuto nelle immagini caricate.
Costi
In questo documento vengono utilizzati i seguenti componenti fatturabili di Google Cloud:
- Cloud Functions
- Cloud Build
- Pub/Sub
- Artifact Registry
- Eventarc
- Cloud Run
- Cloud Logging
- Cloud Storage
- Cloud Translation API
- Cloud Vision
Per generare una stima dei costi basata sull'utilizzo previsto,
utilizza il Calcolatore prezzi.
Prima di iniziare
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Abilita le API Cloud Functions, Cloud Build, Cloud Run, Artifact Registry, Eventarc, Logging, Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Abilita le API Cloud Functions, Cloud Build, Cloud Run, Artifact Registry, Eventarc, Logging, Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
- Prepara l'ambiente di sviluppo.
Se hai già installato gcloud CLI, aggiornalo eseguendo il seguente comando:
gcloud components update
Visualizza il flusso di dati
Il flusso di dati nell'applicazione tutorial sulle OCR prevede diversi passaggi:
- Viene caricata un'immagine che contiene testo in qualsiasi lingua di archiviazione ideale in Cloud Storage.
- Viene attivata una Cloud Function, che utilizza l'API Vision per estrarre il testo e rilevare la lingua di origine.
- Il testo è in coda per la traduzione da pubblicare un messaggio in un argomento Pub/Sub. Una traduzione viene messa in coda per ogni lingua di destinazione diversa da quella di origine lingua.
- Se una lingua di destinazione corrisponde alla lingua di origine, la coda di traduzione viene ignorato e il testo viene inviato alla coda dei risultati, un'altra Pub/Sub.
- Una funzione Cloud Function utilizza l'API Translation per tradurre il testo nella coda di traduzione. Il risultato tradotto viene inviato alla coda dei risultati.
- Un'altra funzione Cloud Functions salva il testo tradotto dal risultato in Cloud Storage.
- I risultati si trovano in Cloud Storage come file di testo per ogni una traduzione automatica.
Può essere utile visualizzare i passaggi:
prepara l'applicazione
Creare un bucket Cloud Storage in cui caricare le immagini, dove
YOUR_IMAGE_BUCKET_NAME
è un nome di bucket univoco a livello globale:gcloud storage buckets create gs://
YOUR_IMAGE_BUCKET_NAME
Crea un bucket Cloud Storage in cui salvare le traduzioni dei testi, dove
YOUR_RESULT_BUCKET_NAME
è un nome di bucket univoco a livello globale:gcloud storage buckets create gs://
YOUR_RESULT_BUCKET_NAME
Creare un argomento Cloud Pub/Sub in cui pubblicare richieste di traduzione, dove
YOUR_TRANSLATE_TOPIC_NAME
è il nome del tuo di una richiesta di traduzione:gcloud pubsub topics create
YOUR_TRANSLATE_TOPIC_NAME
Crea un argomento Cloud Pub/Sub in cui pubblicare i risultati della traduzione completata, dove
YOUR_RESULT_TOPIC_NAME
è il nome del tuo risultato della traduzione:gcloud pubsub topics create
YOUR_RESULT_TOPIC_NAME
Clona il repository dell'app di esempio nella tua macchina locale:
Node.js
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git
In alternativa, puoi scarica l'esempio come file ZIP ed estrarlo.
Python
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
In alternativa, puoi scarica l'esempio come file ZIP ed estrarlo.
Vai
git clone https://github.com/GoogleCloudPlatform/golang-samples.git
In alternativa, puoi scarica l'esempio come file ZIP ed estrarlo.
Java
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
In alternativa, puoi scarica l'esempio come file ZIP ed estrarlo.
Passa alla directory che contiene l'esempio di Cloud Functions codice:
Node.js
cd nodejs-docs-samples/functions/v2/ocr/app/
Python
cd python-docs-samples/functions/v2/ocr/
Vai
cd golang-samples/functions/functionsv2/ocr/app/
Java
cd java-docs-samples/functions/v2/ocr/ocr-process-image/
comprendi il codice
Questa sezione descrive le dipendenze e le funzioni che costituiscono l'OCR campione.
Importa dipendenze
L'applicazione deve importare diverse dipendenze per poter comunicare con Servizi Google Cloud Platform:
Node.js
Python
Vai
Java
Elabora le immagini
La funzione seguente legge un file immagine caricato da Cloud Storage e richiama una funzione per rilevare se l'immagine contiene testo:
Node.js
Python
Vai
Java
La funzione seguente estrae il testo dall'immagine utilizzando l'API Cloud Vision e accoda il testo per la traduzione:
Node.js
Python
Vai
Java
Traduci testo
La seguente funzione traduce il testo estratto e mette in coda la traduzione testo da salvare nuovamente in Cloud Storage:
Node.js
Python
Vai
Java
Salva le traduzioni
Infine, la seguente funzione riceve il testo tradotto e lo salva di nuovo in Cloud Storage:
Node.js
Python
Vai
Java
Esegui il deployment delle funzioni
Per eseguire il deployment della funzione di elaborazione delle immagini con un trigger di Cloud Storage, esegui questo comando nella directory il codice campione (o, nel caso di Java, il file
pom.xml
):Node.js
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=processImage \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Utilizza la
--runtime
per specificare l'ID runtime di un versione Node.js supportata per l'esecuzione la tua funzione.Python
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=process_image \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Utilizza la
--runtime
per specificare l'ID runtime di un versione Python supportata per l'esecuzione la tua funzione.Vai
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=process-image \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Utilizza la
--runtime
per specificare l'ID runtime di un versione Go supportata per l'esecuzione la tua funzione.Java
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrProcessImage \ --memory=512MB \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Utilizza la
--runtime
per specificare l'ID runtime di un versione Java supportata per l'esecuzione la tua funzione.Sostituisci quanto segue:
- REGION: il nome della regione Google Cloud in cui vuoi eseguire il deployment della funzione
(ad es.
us-west1
). - YOUR_IMAGE_BUCKET_NAME: il nome del tuo
Bucket Cloud Storage in cui caricherai le immagini. Durante il deployment
le funzioni di 2ª generazione, specifica solo il nome del bucket senza il carattere
gs://
iniziale; ad esempio--trigger-event-filters="bucket=my-bucket"
.
- REGION: il nome della regione Google Cloud in cui vuoi eseguire il deployment della funzione
(ad es.
Per eseguire il deployment della funzione di traduzione del testo con un trigger Cloud Pub/Sub, esegui il comando seguente nella directory che contiene il codice campione (o nella nel caso di Java, il file
pom.xml
):Node.js
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=translateText \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Utilizza la
--runtime
per specificare l'ID runtime di un versione Node.js supportata per l'esecuzione la tua funzione.Python
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=translate_text \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Utilizza la
--runtime
per specificare l'ID runtime di un versione Python supportata per l'esecuzione la tua funzione.Vai
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=translate-text \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Utilizza la
--runtime
per specificare l'ID runtime di un versione Go supportata per l'esecuzione la tua funzione.Java
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrTranslateText \ --memory=512MB \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Utilizza la
--runtime
per specificare l'ID runtime di un versione Java supportata per l'esecuzione la tua funzione.a eseguire il deployment della funzione che salva i risultati in Cloud Storage con Pub/Sub, esegui questo comando nella directory che contiene il codice campione (o, nel caso di Java, il file
pom.xml
):Node.js
gcloud functions deploy ocr-save \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=saveResult \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Utilizza la
--runtime
per specificare l'ID runtime di un versione Node.js supportata per l'esecuzione la tua funzione.Python
gcloud functions deploy ocr-save \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=save_result \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Utilizza la
--runtime
per specificare l'ID runtime di un versione Python supportata per l'esecuzione la tua funzione.Vai
gcloud functions deploy ocr-save \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=save-result \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Utilizza la
--runtime
per specificare l'ID runtime di un versione Go supportata per l'esecuzione la tua funzione.Java
gcloud functions deploy ocr-save \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrSaveResult \ --memory=512MB \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Utilizza la
--runtime
per specificare l'ID runtime di un versione Java supportata per l'esecuzione la tua funzione.
Carica un'immagine
Carica un'immagine nel bucket Cloud Storage delle immagini:
gcloud storage cp
PATH_TO_IMAGE
gs://YOUR_IMAGE_BUCKET_NAME
dove
PATH_TO_IMAGE
è un percorso di un file immagine (contenente testo) in nel tuo sistema locale.YOUR_IMAGE_BUCKET_NAME
è il nome del bucket in cui ti trovi caricare immagini.
Puoi scaricare una delle immagini dal progetto di esempio.
Controlla i log per assicurarti che le esecuzioni siano state completate:
gcloud functions logs read --limit 100
Puoi visualizzare le traduzioni salvate nel bucket Cloud Storage utilizzato per
YOUR_RESULT_BUCKET_NAME
.
Esegui la pulizia
Per evitare che al tuo Account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
Elimina il progetto
Il modo più semplice per eliminare la fatturazione creato per il tutorial.
Per eliminare il progetto:
- Nella console Google Cloud, vai alla pagina Gestisci risorse.
- Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.
Elimina le funzioni Cloud Functions
L'eliminazione di Cloud Functions non rimuove le risorse archiviate in Cloud Storage.
Per eliminare le funzioni Cloud Functions che hai creato in questo tutorial, esegui questi comandi:
gcloud functions delete ocr-extract gcloud functions delete ocr-translate gcloud functions delete ocr-save
Puoi eliminare Cloud Functions anche dalla console Google Cloud.