Os dados de conversas são aceites como transcrições (Resposta inteligente) e transcrições, além de dados de anotações (Resumo). Opcionalmente, pode usar dados de conversas e modelos de demonstração fornecidos pelo Assistente do agente para testar a funcionalidade ou a integração sem ter de fornecer os seus próprios dados. Para usar a Resposta inteligente e o Resumo durante a execução, tem de fornecer os seus próprios dados de conversação.
Esta página explica os passos necessários para usar os conjuntos de dados públicos, bem como para formatar os seus próprios dados para carregamento para o Cloud Storage. Tem de fornecer os seus dados de conversas como ficheiros de texto formatados em JSON.
Formato de dados da Resposta inteligente
A Resposta inteligente pode ser usada em conjunto com qualquer funcionalidade do Agent Assist ou como uma funcionalidade autónoma. Para implementar a Resposta inteligente, tem de fornecer dados de conversas ao Agent Assist.
O Agent Assist fornece dados de conversas de exemplo que pode usar para preparar um modelo, além de um modelo de demonstração e uma lista de autorizações. Pode usar estes recursos para criar um perfil de conversa e testar a funcionalidade sem ter de fornecer os seus próprios dados. Se fornecer os seus próprios dados, estes têm de estar no formato especificado.
Use os dados de conversas de exemplo da Resposta inteligente
O conjunto de dados de conversas de exemplo é derivado de uma origem externa e é armazenado num contentor do Google Cloud Storage. Os dados contêm diálogos orientados para tarefas que abordam seis domínios: "Reserva", "restaurante", "hotel", "atração", "táxi" e "comboio". Para preparar o seu próprio modelo com este conjunto de dados, siga os passos para criar um conjunto de dados de conversas através da consola do Agent Assist. No campo Dados de conversas, introduza
gs://smart_messaging_integration_test_data/*.json
para usar o conjunto de dados de teste. Se estiver a fazer chamadas diretas à API em vez de usar a consola, pode criar um conjunto de dados de conversas direcionando a API para o contentor do Cloud Storage acima.
Use o modelo de Resposta inteligente de demonstração e a lista de autorizações
Para testar o modelo de Resposta inteligente de demonstração e a lista de autorizações através da consola (não precisa de um conjunto de dados), navegue para a consola do Agent Assist e clique no botão Começar na funcionalidade Resposta inteligente. Os tutoriais da consola oferecem-lhe opções para usar os seus próprios dados, dados fornecidos ou o modelo de demonstração.
Se estiver a fazer chamadas para a API diretamente em vez de usar a consola, pode encontrar o modelo e a lista de autorizações nas seguintes localizações:
- Modelo:
projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
- Lista de autorizações:
projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg
Para testar a funcionalidade das funcionalidades, sugerimos que comece por usar as seguintes mensagens do utilizador final para acionar uma resposta:
- "Podes encontrar um local caro para ficar que esteja localizado a leste?"
- "Estou à procura de um restaurante caro que sirva comida tailandesa, por favor."
- "Olá, preciso de um hotel com Wi-Fi grátis no norte de Cambridge."
Formato de dados de resumo
O resumo pode ser usado em conjunto com qualquer funcionalidade do Agent Assist ou como uma funcionalidade autónoma. Para implementar a funcionalidade de resumo, tem de fornecer ao Agent Assist dados de conversas que incluam anotações. Uma anotação é um resumo de uma transcrição de conversa associada. As anotações são usadas para formar um modelo que pode usar para gerar resumos para os seus agentes no final de cada conversa com um utilizador final.
Use os dados de conversas de resumo de exemplo e o modelo de demonstração
O Agent Assist também fornece dados de conversas anotados de exemplo que pode usar para preparar um modelo. Recomendamos que escolha esta opção se quiser
testar a funcionalidade de resumo antes de formatar o seu próprio conjunto de dados. O conjunto de dados de teste está localizado no seguinte contentor do Cloud Storage:
gs://summarization_integration_test_data/data
. Se usar os dados de amostra, pode formar um modelo de resumo através da consola ou da API. Introduza
gs://summarization_integration_test_data/data/*
no campo URI do conjunto de dados para
usar o conjunto de dados de amostra.
Para testar o modelo de resumo de demonstração (não é necessário um conjunto de dados), navegue para a consola do Agent Assist e clique no botão Começar na funcionalidade de resumo. Os tutoriais da consola oferecem-lhe opções para usar os seus próprios dados, dados fornecidos ou o modelo de demonstração.
Formate anotações
Os modelos personalizados de resumo do Agent Assist são preparados com conjuntos de dados de conversas. Um conjunto de dados de conversas contém os seus próprios dados de transcrição e anotação carregados.
Antes de poder começar a carregar dados, tem de se certificar de que cada transcrição de conversa está no formato JSON
, tem uma anotação associada e está armazenada num contentor do Google Cloud Storage.
Para criar anotações, adicione as strings key
e value
esperadas ao campo annotation
associado a cada conversa no seu conjunto de dados. Para ter os melhores resultados, os dados de preparação de anotações devem cumprir as seguintes diretrizes:
- O número mínimo recomendado de anotações de preparação é 1000. O número mínimo obrigatório é 100.
- Os dados de preparação não devem conter PII.
- As anotações não devem incluir informações sobre género, raça ou idade.
- As anotações não devem usar linguagem tóxica ou obscena.
- As anotações não devem conter informações que não possam ser inferidas a partir da transcrição da conversa correspondente.
- Cada anotação pode conter até 3 secções. Pode escolher os nomes das secções.
- As anotações devem ter ortografia e gramática corretas.
Segue-se um exemplo que demonstra o formato de uma transcrição de conversa com anotação associada:
{ "entries": [ { "text": "How can I help?", "role": "AGENT" }, { "text": "I cannot login", "role": "CUSTOMER" }, { "text": "Ok, let me confirm. Are you experiencing issues accessing your account", "role": "AGENT" }, { "text": "Yes", "role": "CUSTOMER" }, { "text": "Got it. Do you still have access to the registered email for the account", "role": "AGENT" }, { "text": "Yes", "role": "AGENT" }, { "text": "I have sent an email with reset steps. You can follow the instructions in the email to reset your login password", "role": "AGENT" }, { "text": "That's nice", "role": "CUSTOMER" }, { "text": "Is there anything else I can help", "role": "AGENT" }, { "text": "No that's all", "role": "CUSTOMER" }, { "text": "Thanks for calling. You have a nice day", "role": "AGENT" } ], "conversation_info": { "annotations": [ { "annotation": { "conversation_summarization_suggestion": { "text_sections": [ { "key": "Situation", "value": "Customer was unable to login to account" }, { "key": "Action", "value": "Agent sent an email with password reset instructions" }, { "key": "Outcome", "value": "Problem was resolved" } ] } } } ] } }
Dados de transcrição de conversas
Os dados de conversas de texto têm de ser fornecidos em ficheiros formatados em JSON, em que cada ficheiro contém dados de uma única conversa. A seguir, é descrito o formato JSON necessário.
Conversa
O objeto de nível superior para dados de conversas.
Campo | Tipo | Descrição |
---|---|---|
conversation_info | ConversationInfo { } | Opcional. Metadados da conversa. |
entradas | Entrada [ ] | Obrigatório. As mensagens da conversa por ordem cronológica. |
ConversationInfo
Os metadados de uma conversa.
Campo | Tipo | Descrição |
---|---|---|
categorias | Categoria [ ] | Opcional. Categorias personalizadas para os dados de conversas. |
Categoria
Categoria de dados de conversas. Se fornecer categorias com os dados das suas conversas, estas são usadas para identificar tópicos nas suas conversas. Se não fornecer categorias, o sistema categoriza automaticamente as conversas com base no conteúdo.
Campo | Tipo | Descrição |
---|---|---|
display_name | de string | Obrigatório. Um nome a apresentar para a categoria. |
Entrada
Dados de uma única mensagem de conversa.
Campo | Tipo | Descrição |
---|---|---|
texto | de string | Obrigatório. O texto desta mensagem de conversa. Todo o texto deve ter as maiúsculas e minúsculas adequadas. A qualidade do modelo pode ser significativamente afetada se todas as letras no texto estiverem em maiúsculas ou minúsculas. É devolvido um erro se este campo ficar vazio. |
user_id | número inteiro | Opcional. Um número que identifica o participante da conversa. Cada participante deve ter um único user_id , usado repetidamente se participar em várias conversas. |
função | de string | Obrigatório. A função do participante na conversa. Um dos seguintes: "AGENT", "CUSTOMER". |
start_timestamp_usec | número inteiro | Opcional se a conversa for usada apenas para assistência de Perguntas frequentes, sugestão de artigos e resumo. Caso contrário, é obrigatório. A data/hora do início desta interação da conversa em microssegundos. |
Exemplo
Segue-se um exemplo de um ficheiro de dados de conversas.
{ "conversation_info":{ "categories":[ { "display_name":"Category 1" } ] }, "entries": [ { "start_timestamp_usec": 1000000, "text": "Hello, I'm calling in regards to ...", "role": "CUSTOMER", "user_id": 1 }, { "start_timestamp_usec": 5000000, "text": "Yes, I can answer your question ...", "role": "AGENT", "user_id": 2 }, ... ] }
Carregue conversas para o Cloud Storage
Tem de fornecer os dados de conversas num contentor do Cloud Storage contido no seu projeto da Google Cloud Platform. Ao criar o contentor:
- Certifique-se de que selecionou o projeto da Google Cloud Platform que usa para o Dialogflow.
- Use a classe de armazenamento padrão.
- Defina a localização do contentor para uma localização mais próxima da sua localização.
Precisa do ID da localização (por exemplo,
us-west1
) quando fornecer os dados de conversa, por isso, tome nota da sua escolha. - Também precisa do nome do contentor quando fornece os dados de conversas.
Siga as instruções do início rápido do Cloud Storage para criar um contentor e carregar ficheiros.