Detectar idioma automáticamente

En esta página, se describe cómo configurar un reconocedor para que reconozca automáticamente el idioma que se habla en un archivo de audio, a partir de una lista predeterminada de posibles idiomas.

En algunas situaciones, no sabes con certeza qué idioma contienen tus grabaciones de audio. Por ejemplo, si publicas tu servicio, aplicación o producto en un país con varios idiomas oficiales, puedes recibir entradas de audio de los usuarios en diferentes idiomas. Esto puede hacer que la especificación de un código de idioma único para las solicitudes de transcripción sea mucho más difícil.

Reconocimiento de varios idiomas

Speech-to-Text ofrece una manera de especificar un conjunto de idiomas que tus datos de audio podrían contener. Cuando crees un archivo Recognizer o envíes una solicitud de reconocimiento, puedes proporcionar uno o más idiomas que los datos de audio podrían incluir en el campolanguage_codes. En una solicitud con varios idiomas, Speech-to-Text intenta transcribir el audio con el idioma más adecuado de la lista de alternativas que proporcionaste. Luego, Speech-to-Text etiqueta los resultados de la transcripción con el código de idioma previsto.

Esta característica es ideal para las aplicaciones que necesitan transcribir declaraciones cortas, como comandos de voz o de búsqueda. Puedes enumerar hasta tres idiomas para el reconocimiento automático de idiomas.

Antes de comenzar

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Note: If you don't plan to keep the resources that you create in this procedure, create a project instead of selecting an existing project. After you finish these steps, you can delete the project, removing all resources associated with the project.

Go to project selector

Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

Habilita las API de Speech-to-Text.
Habilita las API

Make sure that you have the following role or roles on the project: Cloud Speech Administrator
Check for the roles
1. In the Google Cloud console, go to the IAM page.
  Go to IAM
2. Select the project.
3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.
Grant the roles
1. In the Google Cloud console, go to the IAM page.
  Ir a IAM
2. Selecciona el proyecto.
3. Haz clic en Grant access.
4. En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.
5. En la lista Seleccionar un rol, elige un rol.
6. Para otorgar funciones adicionales, haz clic en Agregar otro rol y agrega cada rol adicional.
7. Haz clic en Guardar.
8. Install the Google Cloud CLI.
9. To initialize the gcloud CLI, run the following command:
```
gcloud init
```
  Note: If you installed the gcloud CLI previously, make sure you have the latest version by running gcloud components update.
10. Create local authentication credentials for your user account:
```
gcloud auth application-default login
```
También asegúrate de haber instalado la biblioteca cliente.

Habilita el reconocimiento de idioma en las solicitudes de transcripción de audio

El siguiente es un ejemplo de cómo realizar un reconocimiento de voz síncrono en un archivo de audio local con varios idiomas.
Python
from typing import List from google.cloud.speech_v2 import SpeechClient from google.cloud.speech_v2.types import cloud_speech def transcribe_multiple_languages_v2( project_id: str, language_codes: List[str], audio_file: str, ) -> cloud_speech.RecognizeResponse: """Transcribe an audio file.""" # Instantiates a client client = SpeechClient() # Reads a file as bytes with open(audio_file, "rb") as f: content = f.read() config = cloud_speech.RecognitionConfig( auto_decoding_config=cloud_speech.AutoDetectDecodingConfig(), language_codes=language_codes, model="latest_long", ) request = cloud_speech.RecognizeRequest( recognizer=f"projects/{project_id}/locations/global/recognizers/_", config=config, content=content, ) # Transcribes the audio into text response = client.recognize(request=request) for result in response.results: print(f"Transcript: {result.alternatives[0].transcript}") return response
Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.
1. Opcional: Revoca las credenciales de autenticación que creaste y borra el archivo local de credenciales.
```
gcloud auth application-default revoke
```
2. Opcional: Revoca credenciales desde gcloud CLI.
```
gcloud auth revoke
```
Consola
Precaución: Borrar un proyecto tiene estas consecuencias:

Se borra todo en el proyecto. Si usaste un proyecto existente para las tareas de este documento, cuando lo borres, también se borrará cualquier otro trabajo que hayas realizado en el proyecto.

Se pierden los ID personalizados de proyectos. Cuando creaste este proyecto, es posible que hayas creado un ID del proyecto personalizado que desees utilizar en el futuro. Para conservar las URL que utilizan el ID del proyecto, como una URL appspot.com, borra los recursos seleccionados dentro del proyecto en lugar de borrar todo el proyecto.

Si planeas explorar varias infraestructuras, instructivos y guías de inicio rápido la reutilización de proyectos puede ayudarte a evitar exceder los límites de las cuotas del proyecto.
En la consola de Google Cloud, ve a la página Administrar recursos.
Ir a Administrar recursos

En la lista de proyectos, elige el proyecto que quieres borrar y haz clic en Borrar.

En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.
gcloud
Precaución: Borrar un proyecto tiene estas consecuencias:

Se borra todo en el proyecto. Si usaste un proyecto existente para las tareas de este documento, cuando lo borres, también se borrará cualquier otro trabajo que hayas realizado en el proyecto.

Se pierden los ID personalizados de proyectos. Cuando creaste este proyecto, es posible que hayas creado un ID del proyecto personalizado que desees utilizar en el futuro. Para conservar las URL que utilizan el ID del proyecto, como una URL appspot.com, borra los recursos seleccionados dentro del proyecto en lugar de borrar todo el proyecto.

Si planeas explorar varias infraestructuras, instructivos y guías de inicio rápido la reutilización de proyectos puede ayudarte a evitar exceder los límites de las cuotas del proyecto.
Borra un proyecto de Google Cloud:
```
gcloud projects delete PROJECT_ID
```
¿Qué sigue?
- Practica transcribir archivos de audio cortos.
- Obtén más información sobre cómo transcribir audio con transmisión continua.
- Obtén información sobre cómo transcribir archivos de audio largos.
- Para mejorar el rendimiento y la exactitud, así como ver otras sugerencias, consulta la documentación de prácticas recomendadas.

Detectar idioma automáticamente

Reconocimiento de varios idiomas

Antes de comenzar

Check for the roles

Grant the roles

Habilita el reconocimiento de idioma en las solicitudes de transcripción de audio

Python

Limpia

Consola

gcloud

¿Qué sigue?