Media Translation traduce un file audio o un flusso di discorsi vocali in testo in un'altra lingua. Questa pagina fornisce esempi di codice che mostrano come tradurre in testo l'audio in streaming utilizzando le librerie client di Media Translation.
Configura il progetto
Prima di poter utilizzare Media Translation, devi configurare un progetto Google Cloud e abilitare l'API Media Translation per il progetto.
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Attiva l'API Media Translation.
-
Crea un account di servizio:
-
Nella console Google Cloud, vai alla pagina Crea account di servizio.
Vai a Crea account di servizio - Seleziona il progetto.
-
Nel campo Nome account di servizio, inserisci un nome. La console Google Cloud compila il campo ID account di servizio in base a questo nome.
Nel campo Descrizione account di servizio, inserisci una descrizione. Ad esempio,
Service account for quickstart
. - Fai clic su Crea e continua.
-
Concedi il ruolo Project > Owner all'account di servizio.
Per concedere il ruolo, trova l'elenco Seleziona un ruolo e scegli Project > Owner.
- Fai clic su Continua.
-
Fai clic su Fine per completare la creazione dell'account di servizio.
Non chiudere la finestra del browser. La utilizzerai nel passaggio successivo.
-
-
Crea una chiave dell'account di servizio:
- Nella console Google Cloud, fai clic sull'indirizzo email dell'account di servizio che hai creato.
- Fai clic su Chiavi.
- Fai clic su Aggiungi chiave, quindi su Crea nuova chiave.
- Fai clic su Crea. Un file della chiave JSON viene scaricato sul computer.
- Fai clic su Chiudi.
-
Imposta la variabile di ambiente
GOOGLE_APPLICATION_CREDENTIALS
sul percorso del file JSON che contiene le tue credenziali. Questa variabile si applica solo alla sessione di shell attuale. Pertanto, se apri una nuova sessione, imposta di nuovo la variabile. - Installa Google Cloud CLI.
-
Per initialize gcloud CLI, esegui questo comando:
gcloud init
-
Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Attiva l'API Media Translation.
-
Crea un account di servizio:
-
Nella console Google Cloud, vai alla pagina Crea account di servizio.
Vai a Crea account di servizio - Seleziona il progetto.
-
Nel campo Nome account di servizio, inserisci un nome. La console Google Cloud compila il campo ID account di servizio in base a questo nome.
Nel campo Descrizione account di servizio, inserisci una descrizione. Ad esempio,
Service account for quickstart
. - Fai clic su Crea e continua.
-
Concedi il ruolo Project > Owner all'account di servizio.
Per concedere il ruolo, trova l'elenco Seleziona un ruolo e scegli Project > Owner.
- Fai clic su Continua.
-
Fai clic su Fine per completare la creazione dell'account di servizio.
Non chiudere la finestra del browser. La utilizzerai nel passaggio successivo.
-
-
Crea una chiave dell'account di servizio:
- Nella console Google Cloud, fai clic sull'indirizzo email dell'account di servizio che hai creato.
- Fai clic su Chiavi.
- Fai clic su Aggiungi chiave, quindi su Crea nuova chiave.
- Fai clic su Crea. Un file della chiave JSON viene scaricato sul computer.
- Fai clic su Chiudi.
-
Imposta la variabile di ambiente
GOOGLE_APPLICATION_CREDENTIALS
sul percorso del file JSON che contiene le tue credenziali. Questa variabile si applica solo alla sessione di shell attuale. Pertanto, se apri una nuova sessione, imposta di nuovo la variabile. - Installa Google Cloud CLI.
-
Per initialize gcloud CLI, esegui questo comando:
gcloud init
- Installa la libreria client per la lingua che preferisci.
Traduci parlato
Gli esempi di codice riportati di seguito mostrano come tradurre contenuti vocali da un file contenente fino a cinque minuti di audio o da un microfono dal vivo. Consulta le best practice per consigli su come fornire dati vocali per la migliore precisione del riconoscimento.
I passaggi principali sono gli stessi indipendentemente dalla sorgente audio:
Inizializza un client
SpeechTranslationServiceClient
da utilizzare per inviare richieste a Media Translation.Puoi riutilizzare lo stesso client per più richieste.
Crea un oggetto di richiesta
StreamingTranslateSpeechConfig
che specifichi come elaborare l'audio.L'oggetto
StreamingTranslateSpeechConfig
è costituito da un oggettoTranslateSpeechConfig
che fornisce informazioni sul file di origine audio e da una proprietàsingle_utterance
che specifica se Media Translation continua la traduzione quando l'oratore mette in pausa.L'oggetto
TranslateSpeechConfig
fornisce specifiche tecniche per la sorgente audio (come codifica e frequenza di campionamento), imposta le lingue di origine e di destinazione per la traduzione (mediante i relativi codici BCP-47) e definisce il modello di traduzione utilizzato da Media Translation per la trascrizione.Inviare una sequenza di oggetti di richiesta
StreamingTranslateSpeechRequest
.Invii una sequenza di richieste per ogni file audio che vuoi tradurre. La prima richiesta fornisce l'oggetto
StreamingTranslateSpeechConfig
per la richiesta, mentre le richieste successive forniscono il contenuto audio nello streaming.Ricevere l'oggetto risposta
StreamingTranslateSpeechResult
.Mentre viene ricevuta qualsiasi risposta con un valore
text_translation_result.is_final
pari afalse
, l'ultimo risultato tradotto sovrascrive il risultato precedente.Quando Media Translation ha un risultato finale, il campo
text_translation_result.is_final
è impostato sutrue
e qualsiasi risultato di traduzione ricevuto successivamente viene aggiunto al risultato precedente. In questo caso, il risultato precedente non viene sovrascritto. Puoi estrarre la traduzione completata e iniziare con una nuova sezione per la parte successiva della trascrizione e l'audio corrispondente.Quando l'altoparlante si arresta, se il campo
single_utterance
è impostato su true nell'oggetto della richiestaStreamingTranslateSpeechConfig
, Media Translation restituirà un eventoEND_OF_SINGLE_UTTERANCE
perspeech_event_type
nella risposta. Il client smetterà di inviare richieste, ma continuerà a ricevere risposte fino al termine della traduzione.Lo streaming ha un limite di 5 minuti. Il superamento di questo limite restituirà un errore OUT_OF_RANGE.
Esempi di codice
Traduzione di contenuti vocali da un file audio
Java
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Java.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Node.js.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Python.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Traduzione di un parlato da un microfono
Java
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Java.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Node.js.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per informazioni su come installare e utilizzare la libreria client per Media Translation, consulta la pagina Librerie client di Media Translation. Per saperne di più, consulta la documentazione di riferimento dell'API Media Translation Python.
Per eseguire l'autenticazione con Media Translation, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.