Os dados da conversa são aceitos como transcrições (Resposta inteligente) e transcrições mais dados de anotação (resumo). Opcionalmente, você pode usar dados de conversa e modelos de demonstração fornecidos pelo Assistente para testar funcionalidades ou integrações sem precisar fornecer seus próprios dados. Para usar a Resposta inteligente e a resumo durante a execução, você precisa fornecer seus próprios dados de conversa.
Esta página orienta você nas etapas necessárias para usar os conjuntos de dados públicos e formatar seus próprios dados para fazer upload no Cloud Storage. Você precisa fornecer os dados da conversa como arquivos de texto formatados em JSON.
Formato de dados da Resposta inteligente
A Resposta inteligente pode ser usada com qualquer recurso do Assistente do agente ou como um recurso independente. Para implementar a Resposta inteligente, é necessário fornecer dados de conversa ao Agent Assist.
O Assistente do agente fornece dados de conversa de exemplo que podem ser usados para treinar um modelo, além de um modelo de demonstração e uma lista de permissões. Você pode usar esses recursos para criar um perfil de conversa e testar a funcionalidade sem precisar fornecer seus próprios dados. Se você fornecer seus próprios dados, eles precisam estar no formato especificado.
Usar os dados de amostra da Resposta inteligente
O conjunto de dados de exemplo da conversa é derivado de uma fonte externa e é armazenado em um bucket do Google Cloud Storage. Os dados contêm diálogos orientados a tarefas
que abordam seis domínios: "Booking", "restaurante", "hotel", "atração",
"táxi" e "trem". Para treinar seu próprio modelo usando esse conjunto de dados, siga as
etapas para
criar um conjunto de dados de conversa
usando o console do Assistente do agente. No campo Dados da conversa, digite
gs://smart_messaging_integration_test_data/*.json
para usar o conjunto de dados de teste. Se você estiver fazendo chamadas de API diretas em vez de usar o console, poderá criar um conjunto de dados de conversa direcionando a API para o bucket do Cloud Storage acima.
Usar o modelo de Resposta inteligente de demonstração e a lista de permissões
Para testar o modelo de Resposta inteligente de demonstração e a lista de permissões usando o console (sem a necessidade de um conjunto de dados), acesse o console do Assistente do agente e clique no botão Começar no recurso Resposta inteligente. Os tutoriais do console oferecem opções para usar seus próprios dados, dados fornecidos ou o modelo de demonstração.
Se você estiver fazendo chamadas para a API diretamente em vez de usar o console, o modelo e a lista de permissões podem ser encontrados nos seguintes locais:
- Modelo:
projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
- Lista de permissões:
projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg
Para testar a funcionalidade do recurso, sugerimos que você comece usando as seguintes mensagens do usuário final para acionar uma resposta:
- "Você pode encontrar um lugar caro para ficar localizado no leste?"
- "Estou procurando um restaurante caro que sirva comida tailandesa."
- "Olá, preciso de um hotel com Wi-Fi gratuito no norte de Cambridge."
Formato de dados de resumo
A síntese pode ser usada com qualquer recurso do Assistente do agente ou como um recurso independente. Para implementar a síntese, é necessário fornecer ao Assistente do agente dados de conversa que incluem anotações. Uma anotação é um resumo de uma transcrição de conversa associada. As anotações são usadas para treinar um modelo que você pode usar para gerar resumos para seus agentes no final de cada conversa com um usuário final.
Usar o modelo de demonstração e os dados de conversa de resumo de exemplo
O Assistente do agente também fornece dados de conversa anotados que podem ser usados para treinar um modelo. Recomendamos que você escolha essa opção se quiser testar o recurso de resumo antes de formatar seu próprio conjunto de dados. O conjunto de dados de teste está localizado no seguinte bucket do Cloud Storage: gs://summarization_integration_test_data/data
. Se você usar os dados de amostra,
poderá treinar um modelo de resumo usando o
console ou a
API. Insira
gs://summarization_integration_test_data/data/*
no campo URI do conjunto de dados para
usar o conjunto de dados de exemplo.
Para testar o modelo de resumo de demonstração (sem a necessidade de um conjunto de dados), acesse o Agent Assist Console e clique no botão Começar no recurso de resumo. Os tutoriais do console oferecem opções para usar seus próprios dados, dados fornecidos ou o modelo de demonstração.
Formatar anotações
Os modelos personalizados de resumo do Assistente do agente são treinados usando conjuntos de dados de conversa. Um conjunto de dados de conversa contém seus próprios dados de transcrição e anotação enviados.
Antes de começar a fazer upload de dados, verifique se cada transcrição de conversa está no formato JSON
, tem uma anotação associada e está armazenada em um bucket do Google Cloud Storage.
Para criar anotações, adicione as strings key
e value
esperadas ao campo
annotation
associado a cada conversa no conjunto de dados. Para melhores
resultados, os dados de treinamento de anotação precisam seguir estas diretrizes:
- O número mínimo recomendado de anotações de treinamento é 1.000. O número mínimo aplicado é 100.
- Os dados de treinamento não podem conter PII.
- As anotações não podem incluir informações sobre gênero, raça ou idade.
- As anotações não podem usar linguagem tóxica ou profana.
- As anotações não podem conter informações que não possam ser inferidas da transcrição de conversa correspondente.
- Cada anotação pode conter até três seções. Você pode escolher os nomes das seções.
- As anotações precisam ter ortografia e gramática corretas.
Confira a seguir um exemplo que demonstra o formato de uma transcrição de conversa com a anotação associada:
{ "entries": [ { "text": "How can I help?", "role": "AGENT" }, { "text": "I cannot login", "role": "CUSTOMER" }, { "text": "Ok, let me confirm. Are you experiencing issues accessing your account", "role": "AGENT" }, { "text": "Yes", "role": "CUSTOMER" }, { "text": "Got it. Do you still have access to the registered email for the account", "role": "AGENT" }, { "text": "Yes", "role": "AGENT" }, { "text": "I have sent an email with reset steps. You can follow the instructions in the email to reset your login password", "role": "AGENT" }, { "text": "That's nice", "role": "CUSTOMER" }, { "text": "Is there anything else I can help", "role": "AGENT" }, { "text": "No that's all", "role": "CUSTOMER" }, { "text": "Thanks for calling. You have a nice day", "role": "AGENT" } ], "conversation_info": { "annotations": [ { "annotation": { "conversation_summarization_suggestion": { "text_sections": [ { "key": "Situation", "value": "Customer was unable to login to account" }, { "key": "Action", "value": "Agent sent an email with password reset instructions" }, { "key": "Outcome", "value": "Problem was resolved" } ] } } } ] } }
Dados da transcrição da conversa
Os dados de conversa por texto precisam ser fornecidos em arquivos formatados em JSON, em que cada arquivo contém dados de uma única conversa. Confira a seguir o formato JSON necessário.
Conversa
O objeto de nível superior para dados de conversa.
Campo | Tipo | Descrição |
---|---|---|
conversation_info | ConversationInfo { } | Opcional. Metadados da conversa. |
entries | Entrada [ ] | Obrigatório. As mensagens de conversa ordenadas cronologicamente. |
ConversationInfo
Os metadados de uma conversa.
Campo | Tipo | Descrição |
---|---|---|
categories | Categoria [ ] | Opcional. Categorias personalizadas para os dados da conversa. |
Categoria
Categoria de dados de conversa. Se você fornecer categorias com seus dados de conversa, elas serão usadas para identificar os tópicos nas suas conversas. Se você não fornecer categorias, o sistema vai categorizar as conversas automaticamente com base no conteúdo.
Campo | Tipo | Descrição |
---|---|---|
display_name | string | Obrigatório. Um nome de exibição para a categoria. |
Entrada
Dados de uma única mensagem de conversa.
Campo | Tipo | Descrição |
---|---|---|
texto | string | Obrigatório. O texto desta mensagem de conversa. Todo o texto precisa estar em maiúsculas. A qualidade do modelo pode ser afetada significativamente se todas as letras do texto forem maiúsculas ou minúsculas. Um erro será retornado se esse campo for deixado em branco. |
user_id | integer | Opcional. Um número que identifica o participante da conversa. Cada participante precisa ter uma única user_id , usada repetidamente se ele participar de várias conversas. |
papel | string | Obrigatório. O papel do participante da conversa. Uma destas opções: "AGENT", "CUSTOMER". |
start_timestamp_usec | integer | Opcional se a conversa for usada apenas para assistência de perguntas frequentes, sugestão de artigos e resumo. Caso contrário, é obrigatório. O carimbo de data/hora do início desta vez de conversa em microssegundos. |
Exemplo
Confira a seguir um exemplo de arquivo de dados de conversa.
{ "conversation_info":{ "categories":[ { "display_name":"Category 1" } ] }, "entries": [ { "start_timestamp_usec": 1000000, "text": "Hello, I'm calling in regards to ...", "role": "CUSTOMER", "user_id": 1 }, { "start_timestamp_usec": 5000000, "text": "Yes, I can answer your question ...", "role": "AGENT", "user_id": 2 }, ... ] }
Fazer upload de conversas para o Cloud Storage
Você precisa fornecer os dados da conversa em um bucket do Cloud Storage no seu projeto da Google Cloud Platform. Ao criar o bucket:
- Verifique se você selecionou o projeto do Google Cloud Platform que usa para o Dialogflow.
- Use a classe Armazenamento padrão.
- Defina o local do bucket como o local mais próximo de
você.
Você vai precisar do ID do local (por exemplo,
us-west1
) ao fornecer os dados da conversa. Portanto, anote sua escolha. - Você também vai precisar do nome do bucket ao fornecer os dados da conversa.
Siga as instruções do guia de início rápido do Cloud Storage para criar um bucket e fazer upload de arquivos.