Los agentes de voz de Dialogflow usan Speech-to-Text para el reconocimiento de voz, que se incluye en los precios de Dialogflow. Dialogflow selecciona de forma automática un modelo de reconocimiento de voz, pero puedes especificarlo de manera opcional.
Modelos disponibles
Todos los modelos disponibles se enumeran en Modelos de Speech-to-Text. Selecciona el modelo que se adapte mejor a tu dominio y que admita las funciones de lenguaje y voz de tu agente.
Si un modelo no se especifica de forma explícita, Dialogflow selecciona automáticamente un modelo según la configuración de audio en las solicitudes a la API y la configuración del agente.
Por lo general, los siguientes modelos tienen el mejor rendimiento:
- Telephony_short (ideal para Dialogflow de telefonía)
- telefonía (ideal para Agent Assist) (también es útil para la telefonía de Dialogflow cuando está habilitada la sensibilidad de fin de voz avanzada basada en tiempo de espera)
- phone_call (ideal para Agent Assist y Dialogflow de telefonía)
- last_short (ideal para Dialogflow que no sea de telefonía)
- Command_and_search (ideal para idiomas en los que no hay otros modelos disponibles)
Especifica un modelo
Puedes proporcionar el modelo para un agente, un flujo o una página con la configuración de selección de modelo.También puedes proporcionar el modelo cuando llamas a los métodos Sessions.detectIntent
o Sessions.streamingDetectIntent
.
Selecciona un protocolo y una versión para la referencia de sesión:
Protocolo | V3 | V3beta1 |
---|---|---|
REST | Recurso de sesión | Recurso de sesión |
RPC | Interfaz de sesión | Interfaz de sesión |
C++ | SessionsClient | No disponible |
C# | SessionsClient | No disponible |
Go | SessionsClient | No disponible |
Java | SessionsClient | SessionsClient |
Node.js | SessionsClient | SessionsClient |
PHP | No disponible | No disponible |
Python | SessionsClient | SessionsClient |
Rita | No disponible | No disponible |
ConversationProfile
para Agent Assist.
Si especificas el modelo en un intent de detección o una llamada a la API de perfil de conversación, se anulará cualquier selección de modelo aplicada al agente, flujo o página, a menos que habilites la configuración Anular el modelo de voz a nivel de la solicitud.