La traducción de medios traduce un archivo de audio o una transmisión de voz a texto de otro idioma. En esta página, se proporcionan muestras de código en las que se demuestra cómo traducir audio de transmisión a texto mediante las bibliotecas cliente de la traducción de medios.
Configura tu proyecto
Antes de poder usar la traducción de medios, debes configurar un proyecto de Google Cloud y habilitar la API de traducción de medios para ese proyecto.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Media Translation API.
-
Create a service account:
-
In the Google Cloud console, go to the Create service account page.
Go to Create service account - Select your project.
-
In the Service account name field, enter a name. The Google Cloud console fills in the Service account ID field based on this name.
In the Service account description field, enter a description. For example,
Service account for quickstart
. - Click Create and continue.
-
Grant the Project > Owner role to the service account.
To grant the role, find the Select a role list, then select Project > Owner.
- Click Continue.
-
Click Done to finish creating the service account.
Do not close your browser window. You will use it in the next step.
-
-
Create a service account key:
- In the Google Cloud console, click the email address for the service account that you created.
- Click Keys.
- Click Add key, and then click Create new key.
- Click Create. A JSON key file is downloaded to your computer.
- Click Close.
-
Set the environment variable
GOOGLE_APPLICATION_CREDENTIALS
to the path of the JSON file that contains your credentials. This variable applies only to your current shell session, so if you open a new session, set the variable again. - Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Media Translation API.
-
Create a service account:
-
In the Google Cloud console, go to the Create service account page.
Go to Create service account - Select your project.
-
In the Service account name field, enter a name. The Google Cloud console fills in the Service account ID field based on this name.
In the Service account description field, enter a description. For example,
Service account for quickstart
. - Click Create and continue.
-
Grant the Project > Owner role to the service account.
To grant the role, find the Select a role list, then select Project > Owner.
- Click Continue.
-
Click Done to finish creating the service account.
Do not close your browser window. You will use it in the next step.
-
-
Create a service account key:
- In the Google Cloud console, click the email address for the service account that you created.
- Click Keys.
- Click Add key, and then click Create new key.
- Click Create. A JSON key file is downloaded to your computer.
- Click Close.
-
Set the environment variable
GOOGLE_APPLICATION_CREDENTIALS
to the path of the JSON file that contains your credentials. This variable applies only to your current shell session, so if you open a new session, set the variable again. - Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
- Instala la biblioteca cliente para tu lenguaje de preferencia.
Traduce la voz
En las siguientes muestras de código, se demuestra cómo traducir la voz de un archivo que contiene hasta cinco minutos de audio o de un micrófono en vivo. Consulta las prácticas recomendadas para obtener recomendaciones sobre cómo proporcionar datos de voz a fin de obtener la mayor exactitud en el reconocimiento.
Los pasos principales son los mismos independientemente de la fuente de audio:
Inicializa un cliente
SpeechTranslationServiceClient
a fin de usarlo para enviar solicitudes a la traducción de medios.Puedes volver a usar el mismo cliente para varias solicitudes.
Crea un objeto de solicitud
StreamingTranslateSpeechConfig
que especifique cómo procesar el audio.El objeto
StreamingTranslateSpeechConfig
consta de un objetoTranslateSpeechConfig
que proporciona información sobre el archivo fuente de audio y una propiedadsingle_utterance
que especifica si la traducción de medios continúa traduciendo cuando el interlocutor se detiene.El objeto
TranslateSpeechConfig
proporciona especificaciones técnicas de la fuente de audio (como la codificación y la tasa de muestreo), establece los idiomas de origen y de destino de la traducción (mediante sus códigos de idioma BCP-47) y define qué modelo de traducción se usa en la traducción de medios para la transcripción.Envía una secuencia de objetos de solicitud
StreamingTranslateSpeechRequest
.Debes enviar una secuencia de solicitudes para cada archivo de audio que deseas traducir. La primera solicitud proporciona el objeto
StreamingTranslateSpeechConfig
para la solicitud y las siguientes solicitudes proporcionan el contenido de audio en la transmisión.Recibe el objeto de respuesta
StreamingTranslateSpeechResult
.Mientras se recibe cualquier respuesta con un valor
text_translation_result.is_final
defalse
, el último resultado traducido reemplaza el resultado anterior.Cuando la traducción de medios tiene un resultado final, el campo
text_translation_result.is_final
se establece entrue
y cualquier resultado de traducción que se reciba después se agrega al resultado anterior. (En esta instancia, el resultado anterior no se reemplaza). Puedes generar la traducción completa y comenzar con una sección nueva para la siguiente parte de la transcripción y el audio correspondiente.Cuando se detenga el interlocutor, si el campo
single_utterance
se configura como verdadero en el objeto de solicitudStreamingTranslateSpeechConfig
, la traducción de medios mostrará un eventoEND_OF_SINGLE_UTTERANCE
paraspeech_event_type
en la respuesta El cliente dejará de enviar solicitudes, pero seguirá recibiendo respuestas hasta que finalice la traducción.La transmisión tiene un límite de 5 minutos. Si superas este límite, se mostrará el error OUT_OF_RANGE.
Muestras de código
Traduce la voz de un archivo de audio
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Media Translation, consulta las bibliotecas cliente de Media Translation. Si deseas obtener más información, consulta la documentación de referencia de la API de Media Translation Java.
Para autenticarte en Media Translation, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Media Translation, consulta las bibliotecas cliente de Media Translation. Si deseas obtener más información, consulta la documentación de referencia de la API de Media Translation Node.js.
Para autenticarte en Media Translation, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Media Translation, consulta las bibliotecas cliente de Media Translation. Si deseas obtener más información, consulta la documentación de referencia de la API de Media Translation Python.
Para autenticarte en Media Translation, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Traduce la voz desde un micrófono
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Media Translation, consulta las bibliotecas cliente de Media Translation. Si deseas obtener más información, consulta la documentación de referencia de la API de Media Translation Java.
Para autenticarte en Media Translation, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Media Translation, consulta las bibliotecas cliente de Media Translation. Si deseas obtener más información, consulta la documentación de referencia de la API de Media Translation Node.js.
Para autenticarte en Media Translation, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Media Translation, consulta las bibliotecas cliente de Media Translation. Si deseas obtener más información, consulta la documentación de referencia de la API de Media Translation Python.
Para autenticarte en Media Translation, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.