Paramètres vocaux avancés

Ce guide fournit des paramètres avancés supplémentaires pour les fonctionnalités de reconnaissance vocale. Vous pouvez activez ou désactivez ces paramètres avancés en accédant à Paramètres de l'agent > Voix et réponse vocale interactive > Speech-to-Text > Paramètres vocaux avancés.

Ces paramètres sont disponibles dans les paramètres de l'agent (s'applique à l'ensemble de l'agent), paramètres de flux (s'applique à l'ensemble et remplace les paramètres de l'agent), paramètres de la page (s'applique aux paramètres de la page remplace les paramètres de flux et d'agent), et paramètres de traitement (s'applique aux paramètres de fulfillment et de remplacement de page, de flux et d'agent). Un sous-ensemble de ces paramètres est disponible à chaque niveau, en fonction de la pertinence du paramètre pour le niveau. * Avant de pouvoir configurer ces paramètres à un niveau inférieur, vous devez d'abord cocher la case Activer les paramètres avancés de synthèse vocale au niveau de l'agent (Paramètres de l'agent > Synthèse vocale et IVR > Transcription vocale > Paramètres avancés de synthèse vocale)*.

Les paramètres mis à jour au niveau de l'agent ne se propagent pas au niveau du flux, de la page et de l'exécution lorsque l'option Personnaliser est sélectionnée à ces niveaux inférieurs. Si l'option Personnaliser englobe plusieurs paramètres et que vous ne souhaitez en modifier que certains, vous devrez peut-être également modifier d'autres paramètres si vous souhaitez qu'ils soient identiques à ceux définis au niveau de l'agent.

Disponibilité des paramètres par niveau

Le tableau suivant indique les paramètres vocaux avancés disponibles à chaque niveau :

Nom du paramètre Agent Flux Page Fulfillment
Sélection du modèle (synthèse vocale)
Fin de la sensibilité vocale
Fonction avancée de fin de la sensibilité vocale basée sur un délai d'inactivité
Activer les points de terminaison intelligents
Pas de délai d'inactivité de la voix
Péniche
Autoriser l'annulation de la lecture d'une réponse partielle
Bucket d'exportation audio
DTMF

Sélection du modèle (Speech-to-Text)

Peut être défini au niveau de l'agent, du flux et de la page.

Définit le modèle de reconnaissance vocale utilisé pour la reconnaissance vocale. Ce paramètre est propres à la langue, ce qui vous permet de sélectionner des modèles différents pour chaque langue. Vous pouvez également cocher Ignorer le modèle de reconnaissance vocale au niveau de la requête, ce qui entraînera l'utilisation du modèle sélectionné même si un appel d'API d'exécution spécifie un modèle différent.

Pour la passerelle de téléphonie pour les agents conversationnels (Dialogflow CX), consultez Limites. Pour en savoir plus, consultez la page Modèles de synthèse vocale.

Sensibilité de la fin de voix

Peut être défini au niveau de l'agent, du flux et de la page.

Contrôle la sensibilité de la reconnaissance de fin de voix dans les entrées audio de l'utilisateur final. La valeur varie de 0 (faible sensibilité, probabilité plus faible de fin de voix) à 100 (haute sensibilité, probabilité plus élevée de fin de voix).

Sensibilité de la fin de voix avancée basée sur un délai avant expiration

Peut être défini au niveau de l'agent, et désactivé au niveau du flux et de la page.

Si ce paramètre est activé, la valeur du paramètre Sensibilité de fin de la parole est utilisée comme jauge pour établir un délai avant expiration du silence audio relatif afin de déterminer la fin de la parole. Si ce paramètre est désactivé (valeur par défaut), La valeur du paramètre Fin de la sensibilité vocale permet de déterminer la fin de la par le modèle de ML fourni par Google Cloud Speech-to-Text.

Le paramètre Fin de la sensibilité à la voix n'est compatible qu'avec phone_call. modèle de reconnaissance vocale pour le langage en-US par défaut, le paramètre Activer la fin de la sensibilité vocale basée sur un délai avancé permet de configurer la sensibilité de fin de la parole pour toutes les langues et modèles de reconnaissance vocale compatibles avec Dialogflow.

Activer la terminaison intelligente

Peut uniquement être défini au niveau de l'agent.

Si ce paramètre est activé, les agents conversationnels (Dialogflow CX) analysent l'entrée partielle de l'utilisateur pour déterminer la fin de la parole. Par exemple, si l'utilisateur dit "Je voudrais" et fait une pause, les agents conversationnels (Dialogflow CX) attendent que l'utilisateur termine la phrase.

Cela est particulièrement utile pour la collecte de paramètres numériques, où l'utilisateur pourrait dire "1234" et faites une pause avant de dire "5678". Pour appliquer ce paramètre à un paramètre spécifique, vous devez configurer le point de terminaison intelligent dans le formulaire du paramètre.

Ce paramètre n'est disponible que pour la balise de langue en-US et est désactivé par par défaut.

Pas de délai d'inactivité de la voix

Peut être défini au niveau de l'agent, du flux et de la page.

Durée en secondes pendant laquelle les agents conversationnels (Dialogflow CX) s'arrêtent d'attendre l'entrée audio de l'utilisateur final. La valeur par défaut est de 5 secondes, et la valeur maximale de 60 secondes. Pour après ce délai, les agents conversationnels (Dialogflow CX) invoquent un événement sans entrée.

Péniche

Peut être défini au niveau de l'agent, du flux et du traitement.

Lorsque ce paramètre est activé, un utilisateur final peut interrompre le contenu audio de la réponse des agents conversationnels (Dialogflow CX). Quand ? est interrompue, les agents conversationnels (Dialogflow CX) cesseront d'envoyer du contenu audio et traiteront les entrées utilisateur.

Si la file d'attente de messages comporte plusieurs messages, et qu'un message a été mis en file d'attente par un fulfillment associé à une page, à un flux ou à un agent sur lequel la désynchronisation (barge-in) est activée, alors tous les messages suivants de la file d'attente auront également la désynchronisation activée. Dans ce cas, l'intégration arrêtera la lecture de l'audio pendant tous les messages en file d'attente avec la fonctionnalité barge-in activée.

Autoriser l'annulation de la lecture d'une réponse partielle

Peut uniquement être défini au niveau du traitement.

Vous pouvez activer ce paramètre lorsque la case Activer les paramètres vocaux avancés est vérifié dans Paramètres de l'agent > Voix et réponse vocale interactive réponse partielle est activé au niveau du fulfillment. Ce paramètre permet d'annuler la lecture d'une réponse partielle.

Si un message se trouve dans la file d'attente des messages est créé par un fulfillment qui permet l'annulation, la lecture du message annulée si un autre message est ajouté à la file d'attente. Cette option est utile lorsque vous souhaitez qu'un message initial lance la lecture, mais que cette lecture soit annulée si un webhook opérationnel génère un autre message avant la fin de la lecture du message initial.

Bucket d'exportation audio

Peut être défini au niveau de l'agent et du flux.

Si elles sont fournies, toutes les données audio associées à une requête seront enregistrées dans le Bucket Cloud Storage:

Audio enregistré Demandes applicables
Entrée audio de l'utilisateur final DetectIntent, StreamingDetectIntent, AnalyzeContent, StreamingAnalyzeContent
Audio synthétisé par la synthèse vocale (TTS) pour une réponse AnalyzeContent, StreamingAnalyzeContent

Attribuez le rôle Créateur d'objets de stockage aux comptes de service suivants dans votre projet :

  • Au compte de service au format one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com si vous utilisez une intégration téléphonique intégrée de partenaires.

  • Au compte de service au format service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com si vous utilisez l'intégration de passerelle de téléphonie Dialogflow CX. Pour trouver ce compte de service dans IAM, cochez l'option Inclure les attributions de rôles fournies par Google.

DTMF

Pour en savoir plus sur cette fonctionnalité, consultez la documentation sur la signalisation DTMF (Dual-tone multi-frequency signaling).