Media Translation traduce un file audio o un flusso di discorsi vocali in testo in un'altra lingua. Questa pagina fornisce esempi di codice che mostrano come tradurre in testo l'audio in streaming utilizzando le librerie client di Media Translation.
Configura il progetto
Prima di poter utilizzare Media Translation, devi configurare un progetto Google Cloud e abilitare l'API Media Translation per il progetto.
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Attiva l'API Media Translation.
-
Create a service account:
-
In the Google Cloud console, go to the Create service account page.
Go to Create service account - Select your project.
-
In the Service account name field, enter a name. The Google Cloud console fills in the Service account ID field based on this name.
In the Service account description field, enter a description. For example,
Service account for quickstart
. - Click Create and continue.
-
Grant the Project > Owner role to the service account.
To grant the role, find the Select a role list, then select Project > Owner.
- Click Continue.
-
Click Done to finish creating the service account.
Do not close your browser window. You will use it in the next step.
-
-
Create a service account key:
- In the Google Cloud console, click the email address for the service account that you created.
- Click Keys.
- Click Add key, and then click Create new key.
- Click Create. A JSON key file is downloaded to your computer.
- Click Close.
-
Imposta la variabile di ambiente
GOOGLE_APPLICATION_CREDENTIALS
sul percorso del file JSON che contiene le tue credenziali. Questa variabile si applica solo alla sessione di shell attuale. Pertanto, se apri una nuova sessione, imposta di nuovo la variabile. - Installa Google Cloud CLI.
-
Per initialize gcloud CLI, esegui questo comando:
gcloud init
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Attiva l'API Media Translation.
-
Create a service account:
-
In the Google Cloud console, go to the Create service account page.
Go to Create service account - Select your project.
-
In the Service account name field, enter a name. The Google Cloud console fills in the Service account ID field based on this name.
In the Service account description field, enter a description. For example,
Service account for quickstart
. - Click Create and continue.
-
Grant the Project > Owner role to the service account.
To grant the role, find the Select a role list, then select Project > Owner.
- Click Continue.
-
Click Done to finish creating the service account.
Do not close your browser window. You will use it in the next step.
-
-
Create a service account key:
- In the Google Cloud console, click the email address for the service account that you created.
- Click Keys.
- Click Add key, and then click Create new key.
- Click Create. A JSON key file is downloaded to your computer.
- Click Close.
-
Imposta la variabile di ambiente
GOOGLE_APPLICATION_CREDENTIALS
sul percorso del file JSON che contiene le tue credenziali. Questa variabile si applica solo alla sessione di shell attuale. Pertanto, se apri una nuova sessione, imposta di nuovo la variabile. - Installa Google Cloud CLI.
-
Per initialize gcloud CLI, esegui questo comando:
gcloud init
- Installa la libreria client per la lingua che preferisci.
Traduci parlato
Gli esempi di codice riportati di seguito mostrano come tradurre contenuti vocali da un file contenente fino a cinque minuti di audio o da un microfono dal vivo. Consulta le best practice per consigli su come fornire dati vocali per la migliore precisione del riconoscimento.
I passaggi principali sono gli stessi indipendentemente dalla sorgente audio:
Inizializza un client
SpeechTranslationServiceClient
da utilizzare per inviare richieste a Media Translation.Puoi riutilizzare lo stesso client per più richieste.
Crea un oggetto di richiesta
StreamingTranslateSpeechConfig
che specifichi come elaborare l'audio.L'oggetto
StreamingTranslateSpeechConfig
è costituito da un oggettoTranslateSpeechConfig
che fornisce informazioni sul file di origine audio e da una proprietàsingle_utterance
che specifica se Media Translation continua la traduzione quando l'oratore mette in pausa.L'oggetto
TranslateSpeechConfig
fornisce specifiche tecniche per la sorgente audio (come codifica e frequenza di campionamento), imposta le lingue di origine e di destinazione per la traduzione (mediante i relativi codici BCP-47) e definisce il modello di traduzione utilizzato da Media Translation per la trascrizione.Inviare una sequenza di oggetti di richiesta
StreamingTranslateSpeechRequest
.Invii una sequenza di richieste per ogni file audio che vuoi tradurre. La prima richiesta fornisce l'oggetto
StreamingTranslateSpeechConfig
per la richiesta, mentre le richieste successive forniscono il contenuto audio nello streaming.Ricevere l'oggetto risposta
StreamingTranslateSpeechResult
.Mentre viene ricevuta qualsiasi risposta con un valore
text_translation_result.is_final
pari afalse
, l'ultimo risultato tradotto sovrascrive il risultato precedente.Quando Media Translation ha un risultato finale, il campo
text_translation_result.is_final
è impostato sutrue
e qualsiasi risultato di traduzione ricevuto successivamente viene aggiunto al risultato precedente. In questo caso, il risultato precedente non viene sovrascritto. Puoi estrarre la traduzione completata e iniziare con una nuova sezione per la parte successiva della trascrizione e l'audio corrispondente.Quando l'altoparlante si arresta, se il campo
single_utterance
è impostato su true nell'oggetto della richiestaStreamingTranslateSpeechConfig
, Media Translation restituirà un eventoEND_OF_SINGLE_UTTERANCE
perspeech_event_type
nella risposta. Il client smetterà di inviare richieste, ma continuerà a ricevere risposte fino al termine della traduzione.Lo streaming ha un limite di 5 minuti. Il superamento di questo limite restituirà un errore OUT_OF_RANGE.
Esempi di codice
Traduzione di contenuti vocali da un file audio
Java
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Java.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Node.js.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Python.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Traduzione di un parlato da un microfono
Java
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Java.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Node.js.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Python.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.