Adaptation vocale automatique

Lorsque vous exécutez une requête de détection d'intent, vous pouvez éventuellement indiquer un contexte vocal pour fournir des indications au système de reconnaissance vocale. Ces indications peuvent faciliter la reconnaissance dans un état de conversation spécifique.

La fonctionnalité d'adaptation vocale automatique améliore la précision de la reconnaissance vocale de votre agent en utilisant automatiquement les entités, les phrases d'entraînement et l'état de la conversation de l'agent comme indications de contexte vocal pour toutes les requêtes de détection d'intent. Cette fonctionnalité est activée par défaut.

Activer ou désactiver l'adaptation vocale automatique

Pour activer ou désactiver l'adaptation vocale automatique, procédez comme suit :

  1. Accédez à la console Dialogflow ES.
  2. Sélectionnez votre agent dans la partie supérieure du menu de la barre latérale gauche.
  3. Cliquez sur le bouton des paramètres à côté du nom de l'agent.
  4. Sélectionnez l'onglet Voix.
  5. Faites défiler la page jusqu'à la section Améliorer la qualité de la reconnaissance vocale.
  6. Sélectionnez ou déselectionnez l'option Activer l'adaptation vocale automatique.

Exemples d'amélioration de la reconnaissance vocale

Lorsque l'adaptation vocale automatique est activée, vous pouvez créer votre agent de manière à en bénéficier. Les exemples suivants montrent comment améliorer la reconnaissance vocale en apportant certaines modifications à votre agent :

  1. Si vous définissez une phrase d'entraînement qui utilise l'entité système @sys.number et que l'utilisateur final dit le mot "deux", celui-ci peut être reconnu de différentes façons : "de", "d'œufs", "2" ou "deux". Si l'adaptation vocale automatique est activée, l'entité @sys.number sert d'indication à Dialogflow pendant la reconnaissance vocale, et le paramètre est reconnu comme correspondant à "deux" ou "2".

  2. Si vous définissez des phrases d'entraînement avec une expression telle que "un beau nez", un énoncé utilisateur phonétiquement semblable est reconnu comme correspondant à "un beau nez", et non à "un bonnet".

  3. Si vous définissez des entités pour les noms de produits ou de services proposés par votre entreprise et que l'utilisateur final mentionne ces termes dans un énoncé, ils sont plus susceptibles d'être reconnus.

  4. Les énoncés de l'utilisateur avec des entités de nombre consécutives, mais distinctes, peuvent être ambigus. Par exemple, "Je veux deux packs de seize" peut signifier 2 quantités de 16 paquets, soit 216 quantités de paquets. L'adaptation vocale peut aider à clarifier les cas suivants si vous configurez des entités avec des valeurs épelées :

    • Définissez une entité quantity avec des entrées :
      zero
      one
      ...
      twenty
    • Définissez une entité product ou size avec des entrées :
      sixteen pack
      two ounce
      ...
      five liter
    • Seuls les synonymes des entités sont utilisés dans l'adaptation vocale. Vous pouvez ainsi définir une entité avec la valeur de référence 1 et un simple synonyme one pour simplifier votre logique de fulfillment.
  5. Vous pouvez utiliser l'adaptation vocale automatique avec des entités d'expression régulière. Vous pouvez utiliser ces fonctionnalités pour capturer des séquences alphanumériques ou numériques.

    • Les caractères spéciaux et les signes de ponctuation tels que ` ~ ! @ # $ % ^ & * ( ) - _ = + , . < > / ? ; ' : " [ ] { } \ | ne sont pas acceptés.
    • Les appels \s* et \s? sont autorisés, mais ce n'est pas le cas de \s.
    • Vous pouvez ajouter d'autres entrées d'expressions régulières qui ne sont pas conformes à ces spécifications. Vous bénéficierez de l'adaptation automatique de la voix tant qu'au moins une de vos entrées sera conforme.

    Par exemple, vous pouvez utiliser des expressions régulières semblable à la suivante pour capturer des séquences alphanumériques :

    ^[A-Za-z0-9]{1,10}$
    ^WAC\d+$
    215[2-8]{3}[A-Z]+$
    [a-zA-Z]\s?[a-zA-Z]\s?[0-9]\s?[0-9]\s?[0-9]\s?[a-zA-Z]\s?[a-zA-Z]
    

    Les expressions régulières suivantes s'adapteront à des séquences de chiffres :

    \d{2,8}
    ^[0-9]+$
    2[0-9]{7}
    [2-9]\d{2}[0-8]{3}\d{4}
    

    Pensez également à utiliser @sys.number-sequence pour accepter n'importe quelle séquence de chiffres, et @sys.phone-number pour une reconnaissance de numéro de téléphone localisé.

Limites

Les limites suivantes s'appliquent :

  1. L'adaptation vocale automatique n'est pas compatible avec Actions on Google (Assistant Google), car la reconnaissance vocale est effectuée par Actions on Google avant que les données ne soient envoyées à Dialogflow.

  2. La prise en charge intégrée de l'adaptation automatique de la voix pour les entités système et les expressions régulières varie selon la langue. Vérifiez les jetons de classe vocale $OOV_CLASS_ALPHANUMERIC_SEQUENCE et $OOV_CLASS_DIGIT_SEQUENCE pour connaître les langues disponibles. Si votre langue n'est pas répertoriée, vous pouvez contourner cette limite. Par exemple, si vous souhaitez qu'un ID d'employé composé de trois lettres suivies de trois chiffres soit correctement reconnu, vous pouvez créer votre agent avec les entités et les paramètres suivants :

    • Définissez une entité digit contenant 10 entrées d'entités (avec des synonymes) :
      0, 0
      1, 1
      ...
      9, 9
    • Définissez une entité letter contenant 26 entrées d'entités (avec des synonymes) :
      A, A
      B, B
      ...
      Z, Z
    • Définissez une entité employee-id contenant une seule entrée d'entité (sans synonymes) :
      @letter @letter @letter @digit @digit @digit
    • Utilisez @employee-id comme paramètre dans une expression d'entraînement.