Un conjunto de datos de conversación contiene datos de transcripción de conversaciones y se usa para entrenar un modelo personalizado de respuesta inteligente o de resumen. Respuestas inteligentes usa las transcripciones de conversaciones para recomendar respuestas de texto a los agentes humanos que conversan con un usuario final. Los modelos personalizados de resumen se entrenan en conjuntos de datos de conversaciones que contienen transcripciones y datos de anotaciones. Usan las anotaciones para generar resúmenes de conversaciones para los agentes humanos después de que se completa una conversación.
Existen dos maneras de crear un conjunto de datos: con los flujos de trabajo de la Consola o de forma manual en la Consola, en la pestaña Datos -> Conjuntos de datos. Te recomendamos que uses los instructivos de la consola como primera opción. Para usar los instructivos de la consola, navega a la consola de Agent Assist y haz clic en el botón Comenzar debajo de la función que deseas probar.
En esta página, se muestra cómo crear un conjunto de datos de forma manual.
Antes de comenzar
Sigue las instrucciones de configuración de Dialogflow para habilitar Dialogflow en un proyecto de Google Cloud Platform.
Te recomendamos que leas la página de conceptos básicos de Agent Assist antes de comenzar este instructivo.
Si implementas la Respuesta inteligente con tus propios datos de transcripción, asegúrate de que tus transcripciones estén en
JSON
en el formato especificado y almacenadas en un bucket de Google Cloud Storage. Un conjunto de datos de conversación debe contener al menos 30,000 conversaciones; de lo contrario, fallará el entrenamiento de modelos. Como regla general, cuantas más conversaciones tengas, mejor será la calidad de tu modelo. Te sugerimos que quites las conversaciones con menos de 20 mensajes o 3 turnos de conversación (cambios en los que el participante hace una afirmación). También te sugerimos que quites los mensajes de bots o los mensajes que generan automáticamente los sistemas (por ejemplo, "El agente ingresa a la sala de chat"). Te recomendamos que subas al menos 3 meses de conversaciones para garantizar la cobertura de la mayor cantidad posible de casos de uso. La cantidad máxima de conversaciones en un conjunto de datos de conversaciones es de 1,000,000.Si implementas el resumen con tus propios datos de transcripción y anotación, asegúrate de que las transcripciones estén en el formato especificado y almacenadas en un bucket de Google Cloud Storage. La cantidad mínima recomendada de anotaciones de entrenamiento es de 1,000. La cantidad mínima obligatoria es de 100.
Navega a la consola de Agent Assist. Selecciona tu proyecto de Google Cloud Platform y, luego, haz clic en la opción de menú Data en el margen izquierdo de la página. En el menú Datos, se muestran todos tus datos. Hay dos pestañas, una para los conjuntos de datos de conversación y otra para las bases de conocimiento.
Haz clic en la pestaña conjuntos de datos de conversación y, luego, en el botón + Crear en la parte superior derecha de la página.
Crea un conjunto de datos de conversaciones
Ingresa un Nombre y una Descripción opcional para tu conjunto de datos nuevo. En el campo Datos de conversación, ingresa el URI del bucket de almacenamiento que contiene las transcripciones de tus conversaciones. Agent Assist admite el uso del símbolo
*
para la coincidencia de comodines. El URI debe tener el siguiente formato:gs://<bucket name>/<object name>
Por ejemplo:
gs://mydata/conversationjsons/conv0*.json gs://mydatabucket/test/conv.json
Haz clic en Crear. Tu nuevo conjunto de datos ahora aparecerá en la lista de conjuntos de datos de la página del menú Datos, en la pestaña Conjuntos de datos de conversaciones.
¿Qué sigue?
Entrena un modelo de Respuesta inteligente o Resúmenes en uno o más conjuntos de datos de conversación con la consola de Agent Assist.