Transcribe voz a texto con la consola de Google Cloud
En esta guía de inicio rápido, se presenta la consola de Cloud Speech-to-Text. En esta guía de inicio rápido, crearás y definirás mejor una transcripción y aprenderás a usar esta configuración con la API de Speech-to-Text para tus propias aplicaciones.
Para obtener información sobre cómo enviar solicitudes y recibir respuestas mediante la API de REST en lugar de la Consola, consulta la página Antes de comenzar.
Antes de comenzar
Antes de comenzar a usar la consola de Speech-to-Text, debes habilitar la API en Google Cloud Platform Console. Los siguientes pasos te guiarán a través de las siguientes acciones:
- Habilitar Speech-to-Text en un proyecto
- Asegúrate de que la facturación esté habilitada para Speech-to-Text.
Configura el proyecto de Google Cloud
Ir a la página Selector de proyectos
Puedes elegir un proyecto existente o crear uno nuevo. Si deseas obtener más detalles para crear un proyecto, consulta la documentación de Google Cloud Platform.
Si creas un proyecto nuevo, se te pedirá que vincules una cuenta de facturación a este proyecto. Si usas un proyecto existente, asegúrate de que la facturación esté habilitada.
Descubre cómo confirmar que tienes habilitada la facturación en un proyecto.
Una vez que seleccionaste un proyecto y lo vinculaste a una cuenta de facturación, puedes habilitar la API de Speech-to-Text. Ve a la barra Buscar productos y recursos en la parte superior de la página y escribe “speech”.
Selecciona la API de Cloud Speech-to-Text en la lista de resultados.
Para probar Speech-to-Text sin vincularlo a tu proyecto, elige la opción PROBAR ESTA API. Si deseas habilitar la API de Speech-to-Text para usarla en tu proyecto, haz clic en HABILITAR.
Crea una transcripción
Usa la consola de Google Cloud para crear una transcripción nueva:
Configuración de audio
Haz clic en Crear transcripción.
- Si es la primera vez que usas la consola, se te pedirá que elijas dónde almacenar las opciones de configuración y las transcripciones en Cloud Storage.
En la página Crear transcripción, sube un archivo de audio de origen. Puedes elegir un archivo guardado en Cloud Storage o subir uno nuevo al destino de Cloud Storage especificado.
Selecciona el tipo de codificación del archivo de audio que se subió.
Especifica la tasa de muestreo.
Haga clic en Continuar. Se te dirigirá a Opciones de transcripción.
Opciones de transcripción
Selecciona el código de idioma del audio de origen. Este es el idioma que se está reproduciendo en la grabación.
Elige el modelo de transcripción que deseas usar en el archivo. La opción predeterminada está preseleccionada y, por lo general, no es necesario realizar cambios, pero hacer coincidir el modelo con el tipo de audio puede generar una mayor exactitud. Ten en cuenta que los costos del modelo varían.
Haga clic en Continuar. Se te dirigirá a la Adaptación del modelo.
Adaptación de modelos (opcional)
Si el audio de origen contiene palabras poco frecuentes, nombres propios o términos de propiedad, y tienes problemas con el reconocimiento, la adaptación del modelo puede ser útil.
Marca Turn on model adaptation.
Elige One-time adaptation resource.
Agrega frases relevantes y asígnales un valor de mejora.
En la columna izquierda, haz clic en Enviar para crear la transcripción.
Revisa tu transcripción
Según el tamaño de tu archivo de audio, la transcripción puede tardar desde minutos hasta horas en crearse. Una vez que se haya creado la transcripción, estará lista para su revisión. Si ordenas la tabla por marca de tiempo, puedes encontrar con facilidad tus transcripciones recientes.
Haz clic en el Nombre de la transcripción que quieres revisar.
Compara el texto de Transcripción con el archivo de audio.
Si deseas realizar cambios, haz clic en Reuse configuration. Esto te llevará al flujo Crear transcripción con las mismas opciones preseleccionadas, lo que te permitirá cambiar algunos elementos, crear una transcripción nueva y comparar los resultados.
¿Qué sigue?
- Practica transcribir archivos de audio cortos.
- Aprende a agrupar archivos de audio largos para reconocimiento de voz.
- Aprende a transcribir audio con transmisión continua como, por ejemplo, desde un micrófono.
- Comienza a usar Speech-to-Text en el idioma de tu preferencia mediante una biblioteca cliente de Speech-to-Text.
- Trabaja con las aplicaciones de muestra.
- Para mejorar el rendimiento y la exactitud, así como ver otras sugerencias, consulta la documentación de prácticas recomendadas.