Cette page a été traduite par l'API Cloud Translation.

Créer un ensemble de données de conversation

Un ensemble de données de conversation contient des données de transcription de conversation et est utilisé pour entraîner un modèle personnalisé de réponse suggérée ou de synthèse. La fonctionnalité Réponse suggérée utilise les transcriptions de conversations pour recommander des réponses textuelles aux agents humains qui discutent avec un utilisateur final. Les modèles personnalisés de synthèse sont entraînés sur des ensembles de données de conversation contenant à la fois des transcriptions et des données d'annotation. Ils utilisent les annotations pour générer des résumés de conversations pour les agents humains une fois la conversation terminée.

Il existe deux façons de créer un ensemble de données : en utilisant les workflows du tutoriel de la console ou en créant manuellement un ensemble de données dans la console à l'aide de l'onglet Données -> Ensembles de données. Nous vous recommandons d'utiliser les tutoriels de la console en premier lieu. Pour utiliser les tutoriels de la console, accédez à la console d'assistance de l'agent, puis cliquez sur le bouton Commencer sous la fonctionnalité que vous souhaitez tester.

Cette page explique comment créer manuellement un ensemble de données.

Avant de commencer

Suivez les instructions de la page Configuration de Dialogflow pour activer Dialogflow sur un projet Google Cloud Platform.
Nous vous recommandons de lire la page Principes de base d'Agent Assist avant de commencer ce tutoriel.
Si vous mettez en œuvre la fonctionnalité Réponse suggérée en utilisant vos propres données de transcription, assurez-vous que vos transcriptions sont en JSON au format spécifié et stockées dans un bucket Google Cloud Storage. Un ensemble de données de conversation doit contenir au moins 30 000 conversations, sinon l'entraînement du modèle échouera. En règle générale, plus il y a de conversations, plus la qualité de votre modèle est élevée. Nous vous suggérons de supprimer toutes les conversations comportant moins de 20 messages ou 3 échanges de conversation (échange dans lesquels chaque participant s'exprime). Nous vous suggérons également de supprimer les messages de robots ou les messages générés automatiquement par les systèmes (par exemple, "L'agent rejoint le salon de discussion"). Nous vous recommandons d'importer au moins trois mois de conversations pour couvrir un maximum de cas d'utilisation. Le nombre maximal de conversations dans un ensemble de données de conversation est de 1 000 000.
Si vous implémentez la Summarization en utilisant vos propres données de transcription et d'annotation, assurez-vous que vos transcriptions sont au format spécifié et stockées dans un bucket Google Cloud Storage. Le nombre minimal recommandé d'annotations d'entraînement est de 1 000. Le nombre minimal appliqué est de 100.
Accédez à la console d'assistance de l'agent. Sélectionnez votre projet Google Cloud Platform, puis cliquez sur l'option de menu Data (Données) située tout à gauche de la page. Le menu Données affiche toutes vos données. Il existe deux onglets, un pour les ensembles de données de conversation et un pour les bases de connaissances.
Cliquez sur l'onglet Ensembles de données de conversation, puis sur le bouton + Créer en haut à droite de la page des ensembles de données de conversation.