En esta página, se muestra cómo enviar una solicitud de reconocimiento de voz a Speech-to-Text en el lenguaje de programación que prefieras mediante las bibliotecas cliente de Google Cloud.
Con Speech-to-Text, se puede realizar una integración sencilla de las tecnologías de reconocimiento de voz de Google en las aplicaciones de los desarrolladores. Puedes enviar datos de audio a la API de Speech-to-Text que, a su vez, muestra una transcripción de texto de ese archivo de audio. Para obtener más información sobre el servicio, consulta Conceptos básicos de Speech-to-Text.
Antes de comenzar
- Accede a tu Cuenta de Google.
Si todavía no tienes una cuenta, regístrate para obtener una nueva.
- Configura un proyecto de Cloud Console.
Haz clic para realizar alguna de las siguientes acciones:
- Crea o selecciona un proyecto.
- Habilita la API de Cloud Speech-to-Text para ese proyecto.
- Crea una cuenta de servicio.
- Descargar una clave privada como JSON
Puedes ver y administrar estos recursos en cualquier momento desde Cloud Console.
-
Configura la variable de entorno
GOOGLE_APPLICATION_CREDENTIALS
en la ruta del archivo JSON que contiene la clave de tu cuenta de servicio. Esta variable solo se aplica a la sesión actual de shell. Por lo tanto, si abres una sesión nueva, deberás volver a configurar la variable. - Instala e inicializa el SDK de Cloud.
Instala la biblioteca cliente
C#
Install-Package Google.Cloud.Speech.V1 -Pre
Go
go get -u cloud.google.com/go/speech/apiv1
Java
Si usas Maven, agrega lo siguiente al archivo pom.xml
. Para obtener más información sobre las BOM, consulta Las bibliotecas de BOM de Google Cloud Platform.
Si usas Gradle, agrega lo siguiente a las dependencias:
Si usas sbt, agrega lo siguiente a las dependencias:
Si usas IntelliJ o Eclipse, puedes agregar bibliotecas cliente a tu proyecto mediante los siguientes complementos de IDE:
Los complementos brindan funcionalidades adicionales, como administración de claves para las cuentas de servicio. Consulta la documentación de cada complemento para obtener más detalles.
Node.js
Antes de instalar la biblioteca, asegúrate de haber preparado tu entorno para el desarrollo en Node.js.
npm install --save @google-cloud/speech
PHP
composer require google/cloud-speech
Python
Antes de instalar la biblioteca, asegúrate de haber preparado tu entorno para el desarrollo en Python.
pip install --upgrade google-cloud-speech
Ruby
gem install google-cloud-speech
Realiza una solicitud de transcripción de audio
Ahora puedes usar Speech-to-Text para transcribir un archivo de audio a texto. Usa el siguiente código para enviar una solicitud de recognize
a la API de Speech-to-Text.
C#
Go
Java
Node.js
Antes de ejecutar el ejemplo, asegúrate de haber preparado tu entorno para el desarrollo en Node.js.
PHP
Python
Antes de ejecutar el ejemplo, asegúrate de haber preparado tu entorno para el desarrollo en Python.
Ruby
¡Felicitaciones! Enviaste tu primera solicitud a Speech-to-Text.
Si recibes un error o una respuesta vacía de Speech-to-Text, consulta los pasos de Solución de problemas y Mensajes de error.
Limpia
Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta guía de inicio rápido.
- Usa Cloud Console para borrar tu proyecto si no lo necesitas.
¿Qué sigue?
- Practica transcribir archivos de audio cortos.
- Aprende a agrupar archivos de audio largos para reconocimiento de voz.
- Aprende a transcribir audio con transmisión continua como, por ejemplo, desde un micrófono.
- Comienza a usar Speech-to-Text en el idioma de tu preferencia mediante una biblioteca cliente de Speech-to-Text.
- Trabaja con las aplicaciones de muestra.
- Para mejorar el rendimiento y la exactitud, así como ver otras sugerencias, consulta la documentación de prácticas recomendadas.