Un ensemble de données de conversation contient des données de transcription de conversation et est utilisé pour entraîner un modèle personnalisé de réponse suggérée ou de résumé. La réponse suggérée utilise les transcriptions de conversation pour recommander des réponses textuelles aux agents humains qui discutent avec un utilisateur final. Les modèles personnalisés de résumé sont entraînés sur des ensembles de données de conversation contenant à la fois des transcriptions et des données d'annotation. Ils utilisent les annotations pour générer des résumés de conversation destinés aux agents humains une fois la conversation terminée.
Vous pouvez créer un ensemble de données de deux manières: en utilisant les workflows de tutoriel de la console ou en créant manuellement un ensemble de données dans la console à l'aide de l'onglet Données -> Ensembles de données. Nous vous recommandons d'utiliser les tutoriels de la console en premier. Pour utiliser les tutoriels de la console, accédez à la console d'assistance de l'agent, puis cliquez sur le bouton Commencer sous la fonctionnalité que vous souhaitez tester.
Cette page explique comment créer manuellement un ensemble de données.
Avant de commencer
Suivez les instructions de la page Configuration de Dialogflow pour activer Dialogflow sur un projet Google Cloud Platform.
Nous vous recommandons de lire la page Principes de base d'Agent Assist avant de commencer ce tutoriel.
Si vous mettez en œuvre la fonctionnalité Réponse suggérée en utilisant vos propres données de transcription, assurez-vous que vos transcriptions sont en
JSON
au Format spécifié et stockés dans unBucket Google Cloud Storage. Un ensemble de données de conversation doit contenir au moins 30 000 conversations, sinon l'entraînement du modèle échouera. En règle générale, plus il y a de conversations, plus la qualité de votre modèle est élevée. Nous vous suggérons de supprimer toutes les conversations comportant moins de 20 messages ou 3 échanges de conversation (échange dans lesquels chaque participant s'exprime). Nous vous suggérons également de supprimer tous les messages de bot ou les messages générés automatiquement par les systèmes (par exemple, "Agent enters the chat room"). Nous vous recommandons d'importer au moins trois mois de conversations pour couvrir un maximum de cas d'utilisation. Le nombre maximal de conversations dans un ensemble de données de conversation est de 1 000 000.Si vous mettez en œuvre la fonctionnalité de résumé en utilisant vos propres données de transcription et d'annotation, assurez-vous que vos transcriptions sont au format spécifié et stockées dans un bucket Google Cloud Storage. Le nombre minimal recommandé d'annotations d'entraînement est de 1 000. Le nombre minimal appliqué est de 100.
Accédez à la console d'assistance de l'agent. Sélectionnez votre projet Google Cloud Platform, puis cliquez sur l'option de menu Data (Données) située tout à gauche de la page. Le menu Données affiche toutes vos données. Il existe deux onglets, un pour les ensembles de données de conversation et un pour les bases de connaissances.
Cliquez sur l'onglet Ensembles de données de conversation, puis sur le bouton + Créer en haut à droite de la page des ensembles de données de conversation.
Créer un ensemble de données de conversation
Saisissez un Nom et une Description facultative pour votre nouvel ensemble de données. Dans le champ Données de conversation, saisissez l'URI du bucket de stockage contenant vos transcriptions de conversations. Agent Assist est compatible avec l'utilisation du symbole
*
pour la correspondance des caractères génériques. L'URI doit respecter le format suivant:gs://<bucket name>/<object name>
Exemple :
gs://mydata/conversationjsons/conv0*.json gs://mydatabucket/test/conv.json
Cliquez sur Créer. Votre nouvel ensemble de données apparaît désormais dans la liste des ensembles de données de la page de menu Données, dans l'onglet Ensembles de données de conversation.
Étape suivante
Entraînez un modèle Réponse suggérée ou Synthèse sur un ou plusieurs ensembles de données de conversation à l'aide de la console Agent Assist.