Um conjunto de dados de conversa contém dados de transcrição de conversa e é usado para treinar um modelo personalizado de resposta inteligente ou resumo. A Resposta inteligente usa as transcrições de conversa para recomendar respostas de texto a agentes humanos que conversam com um usuário final. Os modelos personalizados de resumo são treinados em conjuntos de dados de conversa que contêm transcrições e dados de anotação. Elas usam as anotações para gerar resumos de conversa para agentes humanos após o término de uma conversa.
Há duas maneiras de criar um conjunto de dados: usando os fluxos de trabalho do tutorial do console ou criando manualmente um conjunto de dados no console usando a guia Dados -> Conjuntos de dados. Recomendamos que você use os tutoriais do console como primeira opção. Para usar os tutoriais do console, acesse o console do Assistente do agente e clique no botão Começar embaixo do recurso que você quer testar.
Esta página mostra como criar um conjunto de dados manualmente.
Antes de começar
Siga as instruções de configuração do Dialogflow para ativar o Dialogflow em um projeto do Google Cloud Platform.
Recomendamos que você leia a página Noções básicas do Assistente do agente antes de iniciar este tutorial.
Se você estiver implementando a Resposta inteligente usando seus próprios dados de transcrição, verifique se as transcrições estão em
JSON
no formato específico e armazenadas em um bucket do Google Cloud Storage. Um conjunto de dados de conversa precisa conter pelo menos 30.000 conversas. Caso contrário, o treinamento de modelo vai falhar. Como regra geral, quanto mais conversas você tiver, melhor será a qualidade do seu modelo. Sugerimos que você remova todas as conversas com menos de 20 mensagens ou três turnos de conversa (mudanças em que o participante está fazendo uma declaração). Também sugerimos que você remova todas as mensagens de bot ou mensagens geradas automaticamente por sistemas (por exemplo, "O agente entra na sala de chat"). Recomendamos que você faça o upload de pelo menos três meses de conversas para garantir a cobertura de quantos casos de uso for possível. O número máximo de conversas em um conjunto de dados de conversa é 1.000.000.Se você estiver implementando a resumificação usando seus próprios dados de transcrição e anotação, verifique se as transcrições estão no formato especificado e armazenadas em um bucket do Google Cloud Storage. O número mínimo recomendado de anotações de treinamento é 1.000. O número mínimo aplicado é 100.
Acesse o console do Agente Assist. Selecione seu projeto do Google Cloud Platform e clique na opção de menu Data na margem esquerda da página. O menu Dados mostra todos os seus dados. Há duas guias, uma para conjuntos de dados de conversa e outra para bases de conhecimento.
Clique na guia conjuntos de dados de conversa e, em seguida, no botão +Criar novo, no canto superior direito da página.
Criar um conjunto de dados de conversa
Insira um Nome e uma Descrição (opcional) para o novo conjunto de dados. No campo Dados da conversa, insira o URI do bucket de armazenamento que contém as transcrições das conversas. O Assistente do agente oferece suporte ao uso do símbolo
*
para correspondência de caracteres curinga. O URI precisa ter o seguinte formato:gs://<bucket name>/<object name>
Exemplo:
gs://mydata/conversationjsons/conv0*.json gs://mydatabucket/test/conv.json
Clique em Criar. O novo conjunto de dados vai aparecer na lista de conjuntos de dados na página de menu Dados, na guia Conjuntos de dados de conversa.
A seguir
Treine um modelo de resposta inteligente ou resumo em um ou mais conjuntos de dados de conversa usando o console do Assistente do agente.