Esta sección muestra cómo transcribir audio de transmisión, como la entrada de un micrófono a texto.
El reconocimiento de voz de transmisión te permite transmitir audio a Speech-to-Text y recibir resultados de reconocimiento de voz de transmisión en tiempo real a medida que se procesa el audio. También puedes consultar los límites de audio para solicitudes de reconocimiento de voz de transmisión. El reconocimiento de voz de transmisión solo está disponible a través de gRPC.
Realiza reconocimiento de voz de transmisión en un archivo local
El siguiente es un ejemplo de cómo realizar el reconocimiento de voz de transmisión en un archivo de audio local. Existe un límite de 10 MB para todas las solicitudes de transmisión enviadas a la API. Este límite se aplica a la solicitud StreamingRecognize
inicial y al tamaño de cada mensaje individual en la transmisión. Si se supera este límite, se arroja un error.
Go
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text. Para obtener más información, consulta la documentación de referencia de la API de Speech-to-Text de Go.
Para autenticar en Speech-to-Text, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text. Para obtener más información, consulta la documentación de referencia de la API de Speech-to-Text de Java.
Para autenticar en Speech-to-Text, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text. Para obtener más información, consulta la documentación de referencia de la API de Speech-to-Text de Node.js.
Para autenticar en Speech-to-Text, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text. Para obtener más información, consulta la documentación de referencia de la API de Speech-to-Text de Python.
Para autenticar en Speech-to-Text, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Idiomas adicionales
C#: Sigue las instrucciones de configuración de C# en la página de bibliotecas cliente y, luego, visita la documentación de referencia de Speech-to-Text para .NET
PHP: Sigue las instrucciones de configuración de PHP en la página de bibliotecas cliente y, luego, visita la documentación de referencia de Speech-to-Text para PHP.
Ruby: Sigue las instrucciones de configuración de Ruby en la página Bibliotecas cliente y, luego, visita la documentación de referencia de Speech-to-Text para Ruby.
Si bien puedes transmitir un archivo de audio local a la API de Speech-to-Text, se recomienda que realices un reconocimiento de audio síncrono o asíncrono para resultados en lote.
Realiza reconocimiento de voz de transmisión en una transmisión de audio
Con Speech-to-Text, también se puede realizar el reconocimiento de transmisiones de audio en tiempo real.
El siguiente es un ejemplo de cómo realizar el reconocimiento de voz en una transmisión de audio recibida desde un micrófono:
Go
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text. Para obtener más información, consulta la documentación de referencia de la API de Speech-to-Text de Go.
Para autenticar en Speech-to-Text, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text. Para obtener más información, consulta la documentación de referencia de la API de Speech-to-Text de Python.
Para autenticar en Speech-to-Text, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text. Para obtener más información, consulta la documentación de referencia de la API de Speech-to-Text de Java.
Para autenticar en Speech-to-Text, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Esta muestra requiere que instales SoX y que esté disponible en tu $PATH
.
- Para MacOS:
brew install sox
- Para la mayoría de las distribuciones de Linux:
sudo apt-get install sox libsox-fmt-all
. - Para Windows: Descarga los objetos binarios.
Para obtener más información sobre la instalación y la creación de un cliente Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text.
Idiomas adicionales
C#: Sigue las instrucciones de configuración de C# en la página de bibliotecas cliente y, luego, visita la documentación de referencia de Speech-to-Text para .NET
PHP: Sigue las instrucciones de configuración de PHP en la página de bibliotecas cliente y, luego, visita la documentación de referencia de Speech-to-Text para PHP.
Ruby: Sigue las instrucciones de configuración de Ruby en la página Bibliotecas cliente y, luego, visita la documentación de referencia de Speech-to-Text para Ruby.
Realiza reconocimiento de voz de transmisión continua
El siguiente es un ejemplo de cómo realizar el reconocimiento de voz en una transmisión ilimitada de audio recibida desde un micrófono:
Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text. Para obtener más información, consulta la documentación de referencia de la API de Speech-to-Text de Python.
Para autenticar en Speech-to-Text, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text. Para obtener más información, consulta la documentación de referencia de la API de Speech-to-Text de Java.
Para autenticar en Speech-to-Text, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para esta muestra, se requiere que instales SoX y que esté disponible en tu $PATH
.
- Para MacOS:
brew install sox
- Para la mayoría de las distribuciones de Linux:
sudo apt-get install sox libsox-fmt-all
. - Para Windows: Descarga los objetos binarios.
Para obtener más información sobre la instalación y la creación de un cliente Speech-to-Text, consulta las bibliotecas cliente de Speech-to-Text.
¿Qué sigue?
- Obtén información sobre cómo medir y mejorar la precisión.
Pruébalo tú mismo
Si es la primera vez que usas Google Cloud, crea una cuenta para evaluar el rendimiento de Speech-to-Text en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
Probar Speech-to-Text gratis