Media Translation traduce un file audio o un flusso di parlato nel testo in un'altra lingua. Questa pagina fornisce esempi di codice che dimostrano come tradurre in testo l'audio in streaming utilizzando le librerie client di Media Translation.
Configura il progetto
Prima di poter utilizzare Media Translation, devi configurare un progetto Google Cloud e abilitare l'API Media Translation per tale progetto.
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.
-
Attiva l'API Media Translation.
-
Crea un account di servizio:
-
In Cloud Console, vai alla pagina Crea account di servizio.
Vai a Crea account di servizio - Seleziona il progetto.
-
Inserisci un nome nel campo Nome account di servizio. Cloud Console compila il campo ID account di servizio in base a questo nome.
Nel campo Descrizione account di servizio, inserisci una descrizione. Ad esempio,
Service account for quickstart
. - Fai clic su Crea e continua.
-
Per fornire l'accesso al tuo progetto, concedi i seguenti ruoli al tuo account di servizio: Progetto > proprietario.
Nell'elenco Seleziona un ruolo, scegli un ruolo.
Per ulteriori ruoli, fai clic su
Aggiungi un altro ruolo e aggiungi ogni ruolo aggiuntivo. - Fai clic su Continua.
-
Fai clic su Fine per completare la creazione dell'account di servizio.
Non chiudere la finestra del browser. La utilizzerai nel passaggio successivo.
-
-
Crea una chiave dell'account di servizio:
- In Cloud Console, fai clic sull'indirizzo email dell'account di servizio che hai creato.
- Fai clic su Chiavi.
- Fai clic su Aggiungi chiave, quindi su Crea nuova chiave.
- Fai clic su Crea. Il file di una chiave JSON viene scaricato sul computer.
- Fai clic su Chiudi.
-
Imposta la variabile di ambiente
GOOGLE_APPLICATION_CREDENTIALS
sul percorso del file JSON che contiene la chiave dell'account di servizio. Questa variabile si applica solo alla sessione shell corrente, quindi se apri una nuova sessione, impostala di nuovo. - Installa e inizializza l'interfaccia a riga di comando di Google Cloud.
-
Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.
-
Attiva l'API Media Translation.
-
Crea un account di servizio:
-
In Cloud Console, vai alla pagina Crea account di servizio.
Vai a Crea account di servizio - Seleziona il progetto.
-
Inserisci un nome nel campo Nome account di servizio. Cloud Console compila il campo ID account di servizio in base a questo nome.
Nel campo Descrizione account di servizio, inserisci una descrizione. Ad esempio,
Service account for quickstart
. - Fai clic su Crea e continua.
-
Per fornire l'accesso al tuo progetto, concedi i seguenti ruoli al tuo account di servizio: Progetto > proprietario.
Nell'elenco Seleziona un ruolo, scegli un ruolo.
Per ulteriori ruoli, fai clic su
Aggiungi un altro ruolo e aggiungi ogni ruolo aggiuntivo. - Fai clic su Continua.
-
Fai clic su Fine per completare la creazione dell'account di servizio.
Non chiudere la finestra del browser. La utilizzerai nel passaggio successivo.
-
-
Crea una chiave dell'account di servizio:
- In Cloud Console, fai clic sull'indirizzo email dell'account di servizio che hai creato.
- Fai clic su Chiavi.
- Fai clic su Aggiungi chiave, quindi su Crea nuova chiave.
- Fai clic su Crea. Il file di una chiave JSON viene scaricato sul computer.
- Fai clic su Chiudi.
-
Imposta la variabile di ambiente
GOOGLE_APPLICATION_CREDENTIALS
sul percorso del file JSON che contiene la chiave dell'account di servizio. Questa variabile si applica solo alla sessione shell corrente, quindi se apri una nuova sessione, impostala di nuovo. - Installa e inizializza l'interfaccia a riga di comando di Google Cloud.
- Installa la libreria client per la tua lingua preferita.
Traduci voce
I codici di esempio seguenti mostrano come tradurre un discorso da un file contenente fino a cinque minuti di audio o da un microfono in tempo reale. Per suggerimenti su come fornire dati vocali per la migliore precisione di riconoscimento, consulta le best practice.
I passaggi principali sono gli stessi indipendentemente dalla sorgente audio:
Inizializza un client
SpeechTranslationServiceClient
da utilizzare per inviare richieste a Media Translation.Puoi riutilizzare lo stesso client per più richieste.
Crea un oggetto
StreamingTranslateSpeechConfig
della richiesta che specifichi come elaborare l'audio.L'oggetto
StreamingTranslateSpeechConfig
è costituito da un oggettoTranslateSpeechConfig
che fornisce informazioni sul file di origine audio e da una proprietàsingle_utterance
che specifica se Media Translation continua la traduzione quando l'oratore si mette in pausa.L'oggetto
TranslateSpeechConfig
fornisce specifiche tecniche per la sorgente audio (come codifica e frequenza di campionamento), imposta le lingue di origine e di destinazione per la traduzione (utilizzando i codici di lingua BCP-47) e definisce il modello di traduzione utilizzato da Media Translation per la trascrizione.Invia una sequenza di oggetti della richiesta
StreamingTranslateSpeechRequest
.Invii una sequenza di richieste per ogni file audio che vuoi tradurre. La prima richiesta fornisce l'oggetto
StreamingTranslateSpeechConfig
per la richiesta, mentre le seguenti richieste forniscono i contenuti audio in streaming.Ricevi l'oggetto della risposta
StreamingTranslateSpeechResult
.Sebbene venga ricevuta qualsiasi risposta con un valore
text_translation_result.is_final
pari afalse
, l'ultimo risultato tradotto sovrascrive il risultato precedente.Quando Media Translation ha un risultato finale, il campo
text_translation_result.is_final
è impostato sutrue
e qualsiasi risultato di traduzione ricevuto viene aggiunto al risultato precedente. In questo caso, il risultato precedente non viene sovrascritto. Puoi restituire la traduzione completata e iniziare con una nuova sezione per la parte successiva della trascrizione e l'audio corrispondente.Quando il relatore si è interrotto, se il campo
single_utterance
è impostato su true nell'oggetto della richiestaStreamingTranslateSpeechConfig
, Media Translation restituisce un eventoEND_OF_SINGLE_UTTERANCE
perspeech_event_type
nella risposta. Il client smetterà di inviare richieste, ma continuerà a ricevere risposte fino al completamento della traduzione.Lo streaming ha un limite di cinque minuti. Il superamento di questo limite restituisce un errore OUT_OF_RANGE.
Esempi di codice
Traduzione di parlato da un file audio
Java
Node.js
Python
Traduzione di un discorso da un microfono
Java
Node.js
Python