Créer un ensemble de données de conversation

Un ensemble de données de conversation contient des données de transcription de conversation. Ces données sont utilisées pour entraîner un modèle de réponse suggérée et pour recommander des réponses textuelles aux agents humains qui discutent avec un utilisateur final. Consultez la page de présentation des données pour en savoir plus sur les types de données que vous pouvez utiliser dans Agent Assist. Si vous souhaitez tester l'intégration d'une API ou une fonctionnalité sans importer vos propres données, vous pouvez utiliser les données de conversation fournies par Agent Assist.

Avant de commencer

  1. Suivez les instructions de la page Configuration de Dialogflow pour activer Dialogflow sur un projet Google Cloud Platform (GCP).
  2. Activez l'API Data Labeling pour votre projet.
  3. Nous vous recommandons de lire la page Principes de base d'Agent Assist avant de commencer ce tutoriel.
  4. (Facultatif) Consultez la documentation sur l'utilisation du modèle et des données de conversation accessibles au public si vous souhaitez tester la fonctionnalité Réponse suggérée sans fournir vos propres données. Si vous choisissez cette option, vous pouvez avancer et créer un profil de conversation à l'aide de l'ensemble de données de conversation accessible au public et du modèle pré-entraîné.
  5. Si vous mettez en œuvre la fonctionnalité Réponse suggérée en utilisant vos propres données de conversation, assurez-vous que vos transcriptions sont en JSON au Format spécifié et stockés dans unBucket Google Cloud Storage ... Un ensemble de données de conversation doit contenir au moins 30 000 conversations, sinon l'entraînement du modèle échouera. En règle générale, plus il y a de conversations, plus la qualité de votre modèle est élevée. Nous vous suggérons de supprimer toutes les conversations comportant moins de 20 messages ou 3 échanges de conversation (échange dans lesquels chaque participant s'exprime). Nous vous recommandons d'importer au moins trois mois de conversations pour couvrir un maximum de cas d'utilisation. Le nombre maximal de conversations dans un ensemble de données de conversation est de 1 000 000.

  6. Accédez à la console d'assistance de l'agent. Sélectionnez votre projet GCP, puis cliquez sur l'option de menu Data (Données) située tout à gauche de la page:

    Le menu Données affiche toutes vos données. Il existe deux onglets, un pour les ensembles de données de conversation et un pour les bases de connaissances:

  7. Cliquez sur l'onglet Ensembles de données de conversation, puis sur le bouton + Créer en haut à droite de la page des ensembles de données de conversation:

Créer un ensemble de données de conversation

  1. Lorsque vous créez un ensemble de données de conversation, la page suivante s'affiche:

  2. Saisissez un Nom et une Description facultative pour votre nouvel ensemble de données. Dans le champ Données de conversation, saisissez l'URI du bucket de stockage contenant vos transcriptions de conversations. Agent Assist est compatible avec l'utilisation du symbole * pour la correspondance des caractères génériques. L'URI doit respecter le format suivant:

    gs://<bucket name>/<object name>
    

    Exemple :

    gs://mydata/conversationjsons/conv0*.json
    gs://mydatabucket/test/conv.json
    
  3. Au bas de la page se trouve un menu déroulant Objectif:

    Si vous êtes sûr que votre ensemble de données sera utilisé pour entraîner un modèle de réponse suggérée, vous pouvez effectuer cette sélection maintenant. Sinon, vous pouvez créer un ensemble de données sans l'attribuer à un type de modèle. Effectuez votre sélection et cliquez sur Créer. Votre nouvel ensemble de données apparaît désormais dans la liste des ensembles de données de la page de menu Données, dans l'onglet Ensembles de données de conversation.

Étape suivante

Entraînez un modèle Réponse suggérée sur un ou plusieurs ensembles de données de conversation à l'aide de la console Agent Assist.