Il rilevamento del testo esegue il riconoscimento ottico dei caratteri (OCR), che rileva ed estrae il testo all'interno di un video di input.
Il rilevamento del testo è disponibile per tutte le lingue supportate dall'API Cloud Vision.
Richiedere il rilevamento del testo per un video su Cloud Storage
Gli esempi seguenti dimostrano il rilevamento del testo su un file che si trova in Cloud Storage.
REST
Invia una richiesta di annotazione video
Di seguito viene mostrato come inviare una richiesta POST al metodo videos:annotate
. L'esempio utilizza Google Cloud CLI per creare un token di accesso. Per istruzioni sull'installazione di gcloud CLI, consulta la guida rapida dell'API Video Intelligence.
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- INPUT_URI: un bucket Cloud Storage che contiene il file da annotare, incluso il nome del file. Deve
iniziare con
gs://
.
Ad esempio:"inputUri": "gs://cloud-videointelligence-demo/assistant.mp4",
- LANGUAGE_CODE: [facoltativo] ad esempio "en-US"
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Corpo JSON della richiesta:
{ "inputUri": "INPUT_URI", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Per inviare la richiesta, espandi una delle seguenti opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Se la risposta ha esito positivo, l'API Video Intelligence restituisce name
per l'operazione. Quanto sopra mostra un esempio di risposta di questo tipo, dove:
project-number
è il numero del tuo progetto e operation-id
è l'ID dell'
operazione a lunga esecuzione creata per la richiesta.
- PROJECT_NUMBER: il numero del tuo progetto
- LOCATION_ID: la regione Cloud in cui deve essere eseguita l'annotazione. Le regioni cloud supportate sono:
us-east1
,us-west1
,europe-west1
easia-east1
. Se non viene specificata alcuna regione, ne verrà determinata una in base alla posizione del file video. - OPERATION_ID: l'ID dell'operazione a lunga esecuzione creata
per la richiesta e fornito nella risposta quando hai avviato
l'operazione, ad esempio
12345...
Ottieni i risultati delle annotazioni
Per recuperare il risultato dell'operazione, effettua una richiesta GET utilizzando il nome dell'operazione restituito dalla chiamata a videos:annotate, come mostrato nell'esempio seguente.
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- OPERATION_NAME: il nome dell'operazione
restituita dall'API Video Intelligence. Il nome dell'operazione ha il formato
projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Per inviare la richiesta, espandi una delle seguenti opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
Le annotazioni di rilevamento del testo vengono restituite come un elencotextAnnotations
.
Nota: il campo done viene restituito solo quando il valore è True.
Non è incluso nelle risposte per cui l'operazione non è stata completata.
Scarica i risultati delle annotazioni
Copia l'annotazione dall'origine al bucket di destinazione: (vedi Copiare file e oggetti)
gsutil cp gcs_uri gs://my-bucket
Nota: se l'URI GCS di output è fornito dall'utente, l'annotazione viene archiviata nell'URI GCS.
Go
Java
Per autenticarti a Video Intelligence, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per autenticarti a Video Intelligence, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per autenticarti a Video Intelligence, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: segui le istruzioni per la configurazione di C# nella pagina delle librerie client e poi consulta la documentazione di riferimento di Video Intelligence per .NET.
PHP: segui le istruzioni per la configurazione di PHP nella pagina delle librerie client e poi consulta la documentazione di riferimento di Video Intelligence per PHP.
Ruby: segui le istruzioni per la configurazione di Ruby nella pagina delle librerie client e poi visita la documentazione di riferimento di Video Intelligence per Ruby.
Richiedere il rilevamento del testo per un video da un file locale
Gli esempi seguenti dimostrano il rilevamento del testo su un file archiviato localmente.
REST
Invia una richiesta di annotazione video
Per eseguire l'annotazione su un file video locale, assicurati di codificare in base64 i contenuti del file video.
Includi i contenuti con codifica Base64 nel campo inputContent
della richiesta.
Per informazioni su come
codificare i contenuti di un file video in base64, vedi Codifica Base64.
Di seguito viene mostrato come inviare una richiesta POST al metodo videos:annotate
.
L'esempio utilizza Google Cloud CLI per creare un token di accesso.
Per istruzioni sull'installazione di Google Cloud CLI, consulta la guida rapida dell'API Video Intelligence
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- "inputContent": BASE64_ENCODED_CONTENT
Ad esempio:
"UklGRg41AwBBVkkgTElTVAwBAABoZHJsYXZpaDgAAAA1ggAAxPMBAAAAAAAQCAA..."
- LANGUAGE_CODE: [facoltativo] ad esempio "en-US"
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Corpo JSON della richiesta:
{ "inputContent": "BASE64_ENCODED_CONTENT", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Per inviare la richiesta, espandi una delle seguenti opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Se la risposta ha esito positivo, l'API Video Intelligence restituisce name
dell'operazione. Quanto sopra mostra un esempio di risposta di questo tipo, dove
project-number
è il nome del progetto e operation-id
è l'ID
dell'operazione a lunga esecuzione creata per la richiesta.
- OPERATION_ID: fornito nella risposta quando hai avviato l'operazione, ad esempio
12345...
Ottieni i risultati delle annotazioni
Per recuperare il risultato dell'operazione, effettua una richiesta GET utilizzando il nome dell'operazione restituito dalla chiamata a videos:annotate, come mostrato nell'esempio seguente.
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_NUMBER: l'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Per inviare la richiesta, espandi una delle seguenti opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
Le annotazioni per il rilevamento del testo vengono restituite come elenco textAnnotations
.
Nota: il campo done viene restituito solo quando il valore è True.
Non è incluso nelle risposte per cui l'operazione non è stata completata.
Go
Java
Node.js
Per autenticarti a Video Intelligence, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Linguaggi aggiuntivi
C#: segui le istruzioni per la configurazione di C# nella pagina delle librerie client e poi consulta la documentazione di riferimento di Video Intelligence per .NET.
PHP: segui le istruzioni per la configurazione di PHP nella pagina delle librerie client e poi consulta la documentazione di riferimento di Video Intelligence per PHP.
Ruby: segui le istruzioni per la configurazione di Ruby nella pagina delle librerie client e poi visita la documentazione di riferimento di Video Intelligence per Ruby.