Modelos de voz

Los agentes de voz de Dialogflow usan Speech-to-Text para el reconocimiento de voz, que se incluye en los precios de Dialogflow. Dialogflow selecciona de forma automática un modelo de reconocimiento de voz, pero puedes especificarlo de manera opcional.

Modelos disponibles

Todos los modelos disponibles se enumeran en Modelos de Speech-to-Text. Selecciona el modelo que se adapte mejor a tu dominio y que admita las funciones de lenguaje y voz de tu agente.

Si un modelo no se especifica de forma explícita, Dialogflow selecciona automáticamente un modelo según la configuración de audio en las solicitudes a la API y la configuración del agente.

Por lo general, los siguientes modelos tienen el mejor rendimiento:

  • Telephony_short (ideal para Dialogflow de telefonía)
  • telefonía (ideal para Agent Assist) (también es útil para la telefonía de Dialogflow cuando está habilitada la sensibilidad de fin de voz avanzada basada en tiempo de espera)
  • phone_call (ideal para Agent Assist y Dialogflow de telefonía)
  • last_short (ideal para Dialogflow que no sea de telefonía)
  • Command_and_search (ideal para idiomas en los que no hay otros modelos disponibles)

Especifica un modelo

Puedes proporcionar el modelo para un agente, un flujo o una página con la configuración de selección de modelo.

También puedes proporcionar el modelo cuando llamas a los métodos Sessions.detectIntent o Sessions.streamingDetectIntent.

Selecciona un protocolo y una versión para la referencia de sesión:

Protocolo V3 V3beta1
REST Recurso de sesión Recurso de sesión
RPC Interfaz de sesión Interfaz de sesión
C++ SessionsClient No disponible
C# SessionsClient No disponible
Go SessionsClient No disponible
Java SessionsClient SessionsClient
Node.js SessionsClient SessionsClient
PHP No disponible No disponible
Python SessionsClient SessionsClient
Rita No disponible No disponible
o cuando configuras ConversationProfile para Agent Assist. Si especificas el modelo en un intent de detección o una llamada a la API de perfil de conversación, se anulará cualquier selección de modelo aplicada al agente, flujo o página, a menos que habilites la configuración Anular el modelo de voz a nivel de la solicitud.