Configuración avanzada de voz

En esta guía, se proporciona una configuración avanzada adicional para las funciones de voz. Puedes activa o desactiva esta configuración avanzada en Configuración del agente > IVR y voz > Speech-to-Text > Configuración de voz avanzada.

Esta configuración está disponible en la configuración del agente (se aplica a todo el agente). de flujo (se aplica a todas y anula la configuración del agente), configuración de la página (se aplica a las configuraciones de página y anula la configuración del flujo y del agente) configuración de entrega (se aplica a la entrega y anula la configuración de la página, el flujo y el agente). Un subconjunto disponibles en cada nivel según el parámetro para el nivel. *Antes de configurar estos ajustes en cualquier nivel primero debes marcar la casilla Habilitar configuración de voz avanzada en A nivel del agente (Configuración del agente > IVR y voz > Speech-to-Text > Voz avanzada ).*

La configuración actualizada a nivel del agente no se propaga al flujo, la página ni la entrega cuando se selecciona la opción Personalizar en los niveles inferiores. Si el botón La opción Personalizar abarca varios parámetros de configuración y solo quieres actualizar Algunas de ellas, quizás también debas actualizar otras opciones de configuración si quieres que ser la misma que la configuración a nivel del agente.

Disponibilidad de la configuración por nivel

La siguiente tabla indica en qué configuración de voz avanzada están disponibles cada nivel:

Nombre del parámetro de configuración Agente Flujo Página Fulfillment
Selección del modelo (Speech-to-Text)
Sensibilidad de fin de voz
Habilitar la sensibilidad avanzada de fin de voz basada en tiempo de espera
Habilitar el extremo inteligente
Sin tiempo de espera de voz
Embarcación
Permitir la cancelación de la reproducción de una respuesta parcial
Bucket de exportación de audio
DTMF

Selección del modelo (Speech-to-Text)

Se puede configurar a nivel del agente, el flujo y la página.

Establece el modelo de voz que se usa para el reconocimiento de voz. Este parámetro de configuración es específicos para cada idioma, de modo que puedas seleccionar modelos diferentes para distintos idiomas. También puedes marcar Anular el modelo de voz a nivel de la solicitud, ya que esto hará que se muestre un modelo seleccionado para usarlo incluso si una llamada a la API del entorno de ejecución especifica un valor un modelo de responsabilidad compartida.

Para Dialogflow CX Phone Gateway, consulta limitaciones. Para obtener más información, consulta Modelos de voz.

Sensibilidad de fin de voz

Se puede configurar a nivel del agente, el flujo y la página.

Controla la sensibilidad para reconocer el final de la voz en el audio del usuario final entrada. El valor varía de 0 (baja sensibilidad, menos probabilidad de finalizar la voz) a 100 (sensibilidad alta, es más probable que finalice la voz).

Habilitar la sensibilidad avanzada del fin de la voz basada en tiempo de espera

Solo se puede configurar a nivel del agente.

Si habilitas esta configuración, Sensibilidad de fin de voz El valor de configuración se usa como indicador para establecer un tiempo de espera de silencio relativo de audio. para determinar el final del discurso. Si se inhabilita este parámetro de configuración (predeterminado), El valor de configuración de sensibilidad del fin de voz se usa para determinar el final de por el modelo de AA proporcionado por Google Cloud Speech-to-Text.

El parámetro de configuración Sensibilidad del final de voz solo admite el parámetro phone_call modelo de voz para el idioma en-US etiqueta de forma predeterminada, la opción Habilitar la sensibilidad avanzada del fin de la voz basada en tiempo de espera permite configurar la sensibilidad de fin de la voz para todos los idiomas y modelos de voz compatibles con Dialogflow.

Habilitar el extremo inteligente

Solo se puede configurar a nivel del agente.

Si se habilita esta configuración, Dialogflow analizará la entrada parcial del usuario para determinar el final del discurso. Por ejemplo, si el usuario dice: “Me gustaría” y se pausará, Dialogflow esperará a que el usuario continúe con la oración.

Esto es particularmente útil para la recopilación de parámetros numéricos, en los que el usuario podría decir "1234" y detente antes de decir "5678". Para aplicar este parámetro de configuración, para un parámetro específico, debes configurar Extremos inteligentes en el formulario del parámetro.

Este parámetro de configuración solo está disponible para la etiqueta de idioma en-US y lo inhabilita en de forma predeterminada.

Sin tiempo de espera de voz

Se puede configurar a nivel del agente, el flujo y la página.

La duración en segundos durante la cual Dialogflow dejará de esperar al usuario final entrada de audio. El valor predeterminado es 5 segundos y el valor máximo es 60 segundos. Para este tiempo de espera, Dialogflow invoca un evento sin entrada.

Embarcación

Se puede configurar a nivel de agente, flujo, página y entrega.

Cuando está habilitado, un usuario final puede interrumpir el audio de respuesta de Dialogflow. Cuándo interrumpida, Dialogflow dejará de enviar audio y procesará el siguiente la entrada del usuario final.

Si hay varios mensajes en la fila de mensajes: y un mensaje se puso en cola por una entrega asociada a una página, un flujo o un agente que tenga habilitada la conexión, todos los siguientes mensajes de la cola también tienen habilitadas las interrupciones. En este caso, la integración dejará de reproducir audio durante todos los mensajes en cola con las interrupciones habilitadas.

Permitir la cancelación de la reproducción de una respuesta parcial

Solo se puede configurar a nivel de entrega.

Puedes habilitar este parámetro de configuración cuando el cuadro Habilitar configuración de voz avanzada esté marcado en Configuración del agente > IVR y voz y respuesta parcial está habilitado a nivel de entrega. Este parámetro de configuración permite cancelar una reproducción de respuesta parcial.

Si un mensaje está en la fila de mensajes una entrega que permite la cancelación, la reproducción del mensaje se se cancelará si se agrega otro mensaje a la cola. Esto es útil cuando quieres un mensaje inicial para comenzar la reproducción, pero para que esta se cancele si una un webhook en funcionamiento produce otro mensaje antes de la reproducción del mensaje inicial. de datos completados.

Bucket de exportación de audio

Se puede configurar a nivel de agente y flujo.

Si se proporcionan, todos los datos de audio asociados con una solicitud se guardarán en Bucket de Cloud Storage:

Se guardó el audio Solicitudes aplicables
Entrada de audio del usuario final DetectIntent, StreamingDetectIntent, AnalyzeContent y StreamingAnalyzeContent
Audio de Text-to-Speech (TTS) sintetizado para una respuesta AnalyzeContent y StreamingAnalyzeContent

Otorga el rol Creador de objetos de almacenamiento a las siguientes cuentas de servicio en tu proyecto:

  • A la cuenta de servicio con el formato one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com si usas una integración de telefonía incorporada para socios.

  • A la cuenta de servicio con el formato service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com si usas la integración de la Puerta de enlace telefónica de Dialogflow CX. Para encontrar esta cuenta de servicio en IAM, marca el campo Incluir Opción de asignaciones de roles proporcionadas por Google.

DTMF

Consulta la Documentación de DTMF (señalización de multifrecuencia de doble tono) para obtener más información sobre esta función.