Modelos de voz

Los agentes de voz de Dialogflow usan Speech-to-Text para el reconocimiento de voz, que se incluye en los precios de Dialogflow. Dialogflow selecciona automáticamente un modelo de reconocimiento de voz, pero puedes especificar el modelo de forma opcional.

Modelos disponibles

Todos los modelos disponibles se enumeran en Modelos de Speech-to-Text. Selecciona el modelo que mejor se adapte a tu dominio y admita las funciones de idioma y voz de tu agente.

Si un modelo no se especifica de forma explícita, Dialogflow selecciona de forma automática un modelo en función de la configuración de audio en las solicitudes a la API y la configuración del agente.

Si el modelo de voz mejorado está habilitado para el agente y no existe una versión mejorada del modelo especificado para el idioma, la voz se reconoce mediante la versión estándar del modelo especificado.

Los siguientes modelos suelen tener el mejor rendimiento:

  • Telephony_short (ideal para telefonía Dialogflow)
  • telefonía (la mejor opción para Agent Assist)
  • phone_call (válido para Agent Assist y Telefonía Dialogflow)
  • last_short (ideal para Dialogflow sin telefonía)
  • command_and_search (ideal para idiomas en los que no hay otros modelos disponibles)

Especificar un modelo

Puedes proporcionar el modelo cuando llamas a los métodos detectIntent o streamingDetectIntent en el tipo Sessions, o cuando configuras ConversationProfile para Agent Assist.