La funzionalità Rilevamento del testo esegue il riconoscimento ottico dei caratteri (OCR), che rileva e estrae il testo all'interno di un video di input.
Il rilevamento del testo è disponibile per tutte le lingue supportate dall'API Cloud Vision.
Richiedere il rilevamento del testo per un video su Cloud Storage
I seguenti esempi dimostrano il rilevamento del testo su un file che si trova in di archiviazione ideale in Cloud Storage.
REST
Inviare una richiesta di annotazione video
Di seguito è riportato un esempio di come inviare una richiesta POST al metodo videos:annotate
. L'esempio utilizza Google Cloud CLI per creare un token di accesso. Per
istruzioni sull'installazione di gcloud CLI, consulta
Guida rapida dell'API Video Intelligence.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- INPUT_URI: un bucket Cloud Storage contenente
il file da annotare, incluso il nome del file. Deve
iniziano con
gs://
.
Ad esempio:"inputUri": "gs://cloud-videointelligence-demo/assistant.mp4",
- LANGUAGE_CODE: [facoltativo] ad esempio "en-US"
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Corpo JSON della richiesta:
{ "inputUri": "INPUT_URI", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Se la risposta ha esito positivo, l'API Video Intelligence restituisce name
per
operativa. Di seguito è riportato un esempio di questa risposta, in cui:
project-number
è il numero del progetto e operation-id
è l'ID dell'operazione di lunga durata creata per la richiesta.
- PROJECT_NUMBER: il numero del tuo progetto
- LOCATION_ID: la regione Cloud in cui deve essere eseguita l'annotazione
posto. Le regioni cloud supportate sono:
us-east1
,us-west1
,europe-west1
,asia-east1
. Se non viene specificata alcuna regione, verrà determinata una regione in base alla posizione del file video. - OPERATION_ID: l'ID dell'operazione a lunga esecuzione creata
della richiesta e fornito nella risposta quando hai avviato
operativa, ad esempio
12345...
Ottieni i risultati delle annotazioni
Per recuperare il risultato dell'operazione, effettua una richiesta GET, utilizzando il nome dell'operazione restituito dalla chiamata a videos:annotate, come mostrato nell'esempio seguente.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- OPERATION_NAME: il nome dell'operazione come
restituiti dall'API Video Intelligence. Il nome dell'operazione ha il formato
projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Per inviare la richiesta, espandi una delle seguenti opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
Le annotazioni per il rilevamento del testo vengono restituite come elencotextAnnotations
.
Nota: il campo done viene restituito solo quando il relativo valore è True.
Non è incluso nelle risposte per le quali l'operazione non è stata completata.
Scarica i risultati delle annotazioni
Copia l'annotazione dall'origine al bucket di destinazione: (vedi Copiare file e oggetti)
gcloud storage cp gcs_uri gs://my-bucket
Nota: se l'URI GCS di output viene fornito dall'utente, l'annotazione viene archiviata in quell'URI GCS.
Go
Java
Per autenticarti a Video Intelligence, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per autenticarti a Video Intelligence, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per autenticarti a Video Intelligence, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione per C# riportate nella pagina delle librerie client e consulta la documentazione di riferimento di Video Intelligence per .NET.
PHP Segui le Istruzioni per la configurazione dei file PHP Nella pagina delle librerie client e poi visita Documentazione di riferimento di Video Intelligence per PHP.
Ruby: Segui le Istruzioni per la configurazione di Ruby Nella pagina delle librerie client e poi visita Documentazione di riferimento di Video Intelligence per Ruby.
Richiedere il rilevamento del testo per il video da un file locale
Gli esempi seguenti dimostrano il rilevamento del testo su un file archiviato localmente.
REST
Inviare una richiesta di annotazione video
Per eseguire l'annotazione su un file video locale, assicurati di codificare in base64 i contenuti del file video.
Includi i contenuti codificati in base64 nel campo inputContent
della richiesta.
Per informazioni su come
per codificare il contenuto di un file video in base64, consulta Codifica Base64.
Di seguito è riportato un esempio di come inviare una richiesta POST al metodo videos:annotate
.
L'esempio utilizza Google Cloud CLI per creare un token di accesso.
Per istruzioni su come installare Google Cloud CLI, consulta la guida rapida all'API Video Intelligence
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- "inputContent": BASE64_ENCODED_CONTENT
Ad esempio:
"UklGRg41AwBBVkkgTElTVAwBAABoZHJsYXZpaDgAAAA1ggAAxPMBAAAAAAAQCAA..."
- LANGUAGE_CODE: [Facoltativo] ad esempio "it-IT"
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Corpo JSON della richiesta:
{ "inputContent": "BASE64_ENCODED_CONTENT", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Se la risposta è positiva, l'API Video Intelligence restituisce il name
della tua operazione. Quanto sopra mostra un esempio di questa risposta, in cui
project-number
è il nome del progetto, mentre operation-id
è l'ID
un'operazione a lunga esecuzione creata per la richiesta.
- OPERATION_ID: fornito nella risposta quando hai avviato la
operativa, ad esempio
12345...
Recuperare i risultati dell'annotazione
Per recuperare il risultato dell'operazione, effettua una richiesta GET, utilizzando il nome dell'operazione restituito dalla chiamata a videos:annotate, come mostrato nell'esempio seguente.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Per inviare la richiesta, espandi una delle seguenti opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
Le annotazioni per il rilevamento del testo vengono restituite come elenco textAnnotations
.
Nota: il campo done viene restituito solo quando il valore è True.
Non è incluso nelle risposte per cui l'operazione non è stata completata.
Go
Java
Node.js
Per autenticarti a Video Intelligence, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione per C# nella pagina delle librerie client e poi consulta la documentazione di riferimento di Video Intelligence per .NET.
PHP: segui le istruzioni di configurazione di PHP riportate nella pagina delle librerie client e consulta la documentazione di riferimento di Video Intelligence per PHP.
Ruby: segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi consulta la documentazione di riferimento di Video Intelligence per Ruby.