La funzionalità Rilevamento del testo esegue il riconoscimento ottico dei caratteri (OCR), che rileva e estrae il testo all'interno di un video di input.
Il rilevamento del testo è disponibile per tutte le lingue supportate dall'API Cloud Vision.
Richiedere il rilevamento del testo per un video su Cloud Storage
Gli esempi riportati di seguito mostrano il rilevamento del testo in un file archiviato in Cloud Storage.
REST
Inviare una richiesta di annotazione video
Di seguito è riportato un esempio di come inviare una richiesta POST al metodo videos:annotate
. L'esempio utilizza Google Cloud CLI per creare un token di accesso. Per istruzioni sull'installazione di gcloud CLI, consulta la Guida rapida all'API Video Intelligence.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- INPUT_URI: un bucket Cloud Storage contenente
il file da annotare, incluso il nome del file. Deve
iniziare con
gs://
.
Ad esempio:"inputUri": "gs://cloud-videointelligence-demo/assistant.mp4",
- LANGUAGE_CODE: [Facoltativo] ad esempio "it-IT"
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Corpo JSON della richiesta:
{ "inputUri": "INPUT_URI", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Se la risposta è positiva, l'API Video Intelligence restituisce il name
per l'operazione. Di seguito è riportato un esempio di questa risposta, in cui:
project-number
è il numero del progetto e operation-id
è l'ID dell'operazione di lunga durata creata per la richiesta.
- PROJECT_NUMBER: il numero del progetto
- LOCATION_ID: la regione Cloud in cui deve avvenire l'annotazione. Le regioni cloud supportate sono:
us-east1
,us-west1
,europe-west1
,asia-east1
. Se non viene specificata alcuna regione, verrà determinata una regione in base alla posizione del file video. - OPERATION_ID: l'ID dell'operazione a lunga esecuzione creata per la richiesta e fornito nella risposta quando hai avviato l'operazione, ad esempio
12345...
Recuperare i risultati delle annotazioni
Per recuperare il risultato dell'operazione, effettua una richiesta GET, utilizzando il nome dell'operazione restituito dalla chiamata a videos:annotate, come mostrato nell'esempio seguente.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- OPERATION_NAME: il nome dell'operazione come fornito dall'API Video Intelligence. Il nome dell'operazione ha il formato
projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
Le annotazioni per il rilevamento del testo vengono restituite come elencotextAnnotations
.
Nota: il campo done viene restituito solo se il relativo valore è True.
Non è incluso nelle risposte per le quali l'operazione non è stata completata.
Scaricare i risultati dell'annotazione
Copia l'annotazione dal bucket di origine a quello di destinazione: (vedi Copiare file e oggetti)
gcloud storage cp gcs_uri gs://my-bucket
Nota: se l'URI GCS di output viene fornito dall'utente, l'annotazione viene archiviata in quell'URI GCS.
Go
Java
Per autenticarti a Video Intelligence, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per autenticarti a Video Intelligence, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per autenticarti a Video Intelligence, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione per C# nella pagina delle librerie client e poi consulta la documentazione di riferimento di Video Intelligence per .NET.
PHP: segui le istruzioni di configurazione di PHP riportate nella pagina delle librerie client e consulta la documentazione di riferimento di Video Intelligence per PHP.
Ruby: segui le istruzioni di configurazione di Ruby riportate nella pagina delle librerie client e consulta la documentazione di riferimento di Video Intelligence per Ruby.
Richiedere il rilevamento del testo per il video da un file locale
Gli esempi riportati di seguito mostrano il rilevamento del testo in un file archiviato localmente.
REST
Inviare una richiesta di annotazione video
Per eseguire l'annotazione su un file video locale, assicurati di codificare in base64 i contenuti del file video.
Includi i contenuti codificati in base64 nel campo inputContent
della richiesta.
Per informazioni su come codificare in Base64 i contenuti di un file video, consulta Codifica Base64.
Di seguito è riportato un esempio di come inviare una richiesta POST al metodo videos:annotate
.
L'esempio utilizza Google Cloud CLI per creare un token di accesso.
Per istruzioni su come installare Google Cloud CLI, consulta la guida rapida all'API Video Intelligence.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- "inputContent": BASE64_ENCODED_CONTENT
Ad esempio:
"UklGRg41AwBBVkkgTElTVAwBAABoZHJsYXZpaDgAAAA1ggAAxPMBAAAAAAAQCAA..."
- LANGUAGE_CODE: [Facoltativo] ad esempio "it-IT"
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Corpo JSON della richiesta:
{ "inputContent": "BASE64_ENCODED_CONTENT", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Se la risposta è positiva, l'API Video Intelligence restituisce il name
dell'operazione. Di seguito è riportato un esempio di questa risposta, dove
project-number
è il nome del progetto e operation-id
è l'ID dell'operazione
in esecuzione prolungata creata per la richiesta.
- OPERATION_ID: fornito nella risposta quando hai avviato l'operazione, ad esempio
12345...
Recuperare i risultati dell'annotazione
Per recuperare il risultato dell'operazione, effettua una richiesta GET, utilizzando il nome dell'operazione restituito dalla chiamata a videos:annotate, come mostrato nell'esempio seguente.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
Le annotazioni per il rilevamento del testo vengono restituite come elenco textAnnotations
.
Nota: il campo done viene restituito solo se il relativo valore è True.
Non è incluso nelle risposte per le quali l'operazione non è stata completata.
Go
Java
Node.js
Per autenticarti a Video Intelligence, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione per C# nella pagina delle librerie client e poi consulta la documentazione di riferimento di Video Intelligence per .NET.
PHP: segui le istruzioni di configurazione di PHP riportate nella pagina delle librerie client e consulta la documentazione di riferimento di Video Intelligence per PHP.
Ruby: segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi consulta la documentazione di riferimento di Video Intelligence per Ruby.