Este guia apresenta práticas recomendadas especificamente para projetar agentes de voz. Ao projetar um agente de voz, o objetivo é ajudar os usuários (usuários finais) a realizar uma tarefa sem encaminhar para um agente humano. Os usuários precisam sentir que estão tendo uma conversa natural, interativa e cooperativa com o agente de voz.
Consulte também o guia design para agentes gerais para todos os tipos de agentes e o guia de práticas recomendadas para usar o serviço do Dialogflow.
Avaliar a qualidade do agente
Para avaliar a qualidade da experiência do usuário do seu agente, acompanhe as seguintes métricas:
Percurso incorreto: quantos autores das chamadas acessaram o lugar errado.
Resolução da primeira chamada: número de chamadas resolvidas na primeira chamada ou contato.
Tempo médio de processamento: quanto tempo leva para resolver o problema do usuário.
Satisfação do cliente: a pontuação do agente de voz em uma pesquisa de usuário.
Número de turnos: quantas trocas são necessárias para concluir a tarefa do usuário.
Desligamento de usuários: a frequência com que os usuários desistem da conversa.
Reconhecimento de fala
As dicas a seguir podem ajudar seu agente a reconhecer a fala do usuário final:
- O agente precisa incentivar o usuário final a usar frases longas ou completas. Isso melhora a qualidade do reconhecimento.
- Use um webhook para verificar a entrada do usuário final que pode não ser reconhecida com precisão ou que precise ser validada.
- Use eventos sem correspondência para pedir ao usuário final que se pronuncie de forma mais lenta e clara.
Estrutura da conversa
Geralmente, uma conversa com um agente por voz é organizada na seguinte sequência:
Atividade | Exemplo | Observações |
---|---|---|
Atividade de abertura | O usuário faz login ou liga para sua central de atendimento. Agente de voz: oi, essa é a Travel Inc. Como posso ajudar? |
O agente de voz inicia uma conversa com uma mensagem de recepção. |
Sequência principal | Usuário: Quero reservar uma passagem aérea. Agente de voz: Ok, para onde você quer ir? Usuário: Guatemala em 19 de maio, 21h. Agente de voz: Ok, reservamos um bilhete para a Guatemala em 19 de maio, às 21h. |
A tarefa é definida pelo usuário e concluída pelo agente de voz. A tarefa pode levar várias etapas até que o agente de voz colete todas as informações necessárias. |
Fechando a atividade | Agente de voz: Posso ajudar com mais alguma coisa? Usuário: Não Agente de voz: Ok, agradeço por conversar comigo. |
O usuário estará pronto para terminar a conversa quando a solicitação for atendida. |
Mensagem de boas-vindas
Ao projetar a mensagem de abertura para o usuário, pense em como acessar o primeiro tópico o mais rápido possível. A mensagem de boas-vindas precisa ser curta e direta. Veja abaixo algumas sugestões:
- Atenda a chamada com frases como "Olá".
- Identifique o agente por voz com frases como "Este é o agente/assistente de voz da empresa XYZ".
- Mostre disponibilidade com frases como "Como posso ajudar hoje?"
Qualquer informação desnecessária pode frustrar os usuários e fazê-los buscar um agente humano. No entanto, talvez seja necessário estender a mensagem de boas-vindas por motivos legais, como informar ao usuário que a conversa pode ser gravada.
Evite informações que façam a conversa parecer artificial ou desequilibrada. Exemplo:
O que fazer | O que evitar |
---|---|
Adeque o tom de acordo com os usuários. Por exemplo, se você quiser que o usuário explique algo em uma ou duas frases, limite o agente de voz a uma ou duas frases por vez. | Não instrua os usuários a falarem frases como "em uma ou duas frases, diga..." ou "você pode dizer coisas como..." |
Concentre-se na tarefa que o usuário quer realizar e escreva estratégias de solução de erros para o caso de falhas na comunicação. | Não diga aos usuários o que o agente de voz pode fazer com frases como "Posso ajudar você a resolver problemas complexos". |
Pares de turnos de conversas
Uma conversa típica consiste em pares de turnos, como os seguintes tipos de trocas:
- Resposta à pergunta, que é mais comum para um agente de voz
- Aceitação/rejeição de convite
- Saudação mútua
Às vezes, um par de turnos pode incluir um texto adicional, como uma explicação sobre por que precisamos fazer uma pergunta, informações básicas relacionadas à pergunta que queremos fazer ou uma reação à resposta do usuário. Por exemplo, considere o seguinte par de turnos para perguntas e respostas:
Agente de voz: Isso custa US$ 10/dia. (Informações/explicação) Você quer continuar adicionando esse benefício? (pergunta)
Usuário: Sim. (resposta)
Agente de voz: Ótimo! reação
Consulte também a seção Atendimento do guia de práticas recomendadas para design de agentes gerais para ver diretrizes sobre a colocação do atendimento.
Correção da conversa
O reparo de conversas é a prática de corrigir mal-entendidos, frases ouvidas incorretamente e equívocos de interpretação para retomar uma conversa. O reparo de uma conversa pode ajudar a conquistar a confiança do usuário, mostrando que o agente de voz está ouvindo a solicitação.
Algumas práticas recomendadas:
Seja específico e use o contexto que o usuário já oferecia em turnos anteriores. Evite fazer perguntas óbvias e redundantes, como "Não entendi", "Não entendo" ou "Estou com problemas".
Ofereça ao usuário a oportunidade de se corrigir, ou seja, no turno dele, deixa que diga o que quer dizer como acredita ser a melhor maneira para garantir que ele tenha agência na conversa. Evite frases como "tente reformular" ou "você pode dizer X, Y ou Z".
Use a estrutura "Você quis dizer x?" para confirmar a compreensão.
A tabela a seguir descreve vários exemplos do que fazer e o que evitar:
O que fazer | O que evitar |
---|---|
Usuário: Estou indo para a Itália. Agente de voz: Qual país? |
Usuário: Estou indo para a Itália. Agente de voz: Não entendi muito bem. Poderia reformular? Aonde você vai? |
Usuário: Quero pagar US$ 80. Agente de voz: Você quer ganhar US$ 80? (Repete apenas as informações que precisam de confirmação) |
Usuário: Quero pagar US$ 80. Agente de voz: quer pagar US$ 80? (Repete a informação redundante "quero pagar") |
Tratamento de erros
A seção a seguir descreve como lidar com situações em que uma conversa falha.
Nenhuma correspondência
Um evento sem correspondência é invocado quando o agente de voz não consegue encontrar uma intent para corresponder ao que o usuário disse.
Na primeira ocorrência do evento sem correspondência, tente o seguinte:
Repita a pergunta ao usuário, mas reescreva-a de forma mais curta para indicar as informações que estão faltando. Ao focar apenas nas informações que estão faltando, o agente de voz transmite a ideia de que ouviu o restante da declaração do usuário.
Você pode adicionar "desculpe" antes da pergunta reformulada para indicar que algo deu errado.
Na segunda instância do evento sem correspondência, mostre mais claramente que o agente de voz está se esforçando para ouvir. Por exemplo, considere a troca a seguir:
Usuário: Estou indo para a Itália
Agente de voz: Qual país?
Usuário: Itália
Agente de voz: Você está viajando para qual país?
Sem entrada
Se o agente de voz não tiver recebido resposta verbal do usuário, repita a pergunta da mesma forma que na primeira vez. Na segunda instância do evento sem entrada, você pode reformular a pergunta original, mas garantir que todos os componentes originais da pergunta estejam presentes.
Limitar repetições sem correspondência e sem entrada
Para evitar a que os usuários fiquem em um ciclo de erros, implemente no máximo 3 eventos sem correspondência/sem entrada em cada página. Encaminhe os usuários para um agente humano quando ocorrer o terceiro evento sem correspondência ou sem entrada.
Tempo limite de ausência de fala
Nos casos em que os usuários precisam analisar informações ou tomar decisões antes de continuar, aumente a configuração de tempo limite de ausência de fala para dar a eles tempo suficiente para responder.
No exemplo a seguir, a configuração de tempo limite de ausência de fala de dois segundos é muito curta para que o usuário leia uma mensagem SMS e decida:
Agente de voz: Enviei uma mensagem de texto para seu dispositivo. Clique no link para saber mais sobre o cartão de viagem. Vou tocar uma música para dar tempo de você ler o texto e me responder. <2 second pause> Quer continuar?
Usuário: Ainda estou lendo.
Agente de voz: Quer adicionar o cartão de viagem ao seu plano?
Técnicas de conversa
Esta seção descreve técnicas para ajudar o agente de voz a conquistar confiança dos usuários e deixar a conversa mais fluida.
Como elaborar perguntas acionáveis
Elabore perguntas explícitas e úteis para seu agente de voz fazer ao usuário. Por exemplo, considere o que fazer e o que evitar:
O que fazer | O que evitar |
---|---|
Faça perguntas abertas, como "Quando você vai?", o que requer que o usuário informe datas, caso saiba, ou diga "Não sei". | Não pergunte "Você sabe as datas da sua viagem?", porque isso só gera uma resposta de "sim" ou "não" e é menos acionável. |
Pergunte "Você quer verificar o status do pedido de outro pacote?" | Não pergunte "Você quer continuar com o status do pedido de outro pacote?" |
Você também precisa preparar seu agente de voz para situações em que o usuário possa responder a uma pergunta implicitamente, como as pessoas geralmente fazem em conversas naturais. Por exemplo, considere a seguinte interação:
Agente de voz: Acesse Conta, clique em Uso e, depois, em Uso por linha. Avise quando você chegar lá.
Usuário: "Não posso ver dados de três meses atrás ou anteriores".
A resposta do usuário implica que ele chegou à tela de destino, mas ainda precisa de mais ajuda. Seu agente de voz precisa antecipar essas implicações, em vez de esperar que o usuário diga apenas "Eu cheguei" ou "Eu não cheguei".
Ganhe a confiança do usuário
Os agentes de voz podem mostrar aos usuários que estão ouvindo com confirmações e detalhes específicos. Se o agente de voz fornecer respostas genéricas, os usuários poderão sentir que o agente de voz não soa natural.
Use confirmações. Por exemplo, considere a seguinte interação, em que "Nenhum problema" é usado como confirmação:
Usuário: Quero programar um pagamento para segunda-feira.
Agente de voz: Sem problemas. Quanto você quer pagar na segunda-feira?
Adicione detalhes específicos para mostrar que o agente está ouvindo ativamente o usuário. Por exemplo, na troca acima, a frase "na segunda-feira" é um detalhe específico, que indica que o agente ouviu o que o usuário disse.
Responda a solicitação do usuário o mais rápido possível e exclua as etapas desnecessárias. No exemplo a seguir, as informações irrelevantes podem causar frustração do usuário:
Usuário: Há uma interrupção na minha área?
Agente de voz: Sei como é importante permanecer conectado. Vamos descobrir a causa do problema. Informe os últimos quatro dígitos da linha em que você está enfrentando problemas. Se o problema estiver em várias linhas, basta informar uma por enquanto.
Usuário: 1234
Agente de voz: Agradeço. Vou analisar as próximas etapas desta linha. Vamos começar. Desativar e reativar temporariamente o HD Voice pode fazer solucionar o problema. Deu certo?"
A conversa entre o usuário e o agente de voz deve ser equilibrada. Os usuários podem se sentir desconfortáveis com a falta de participação na conversa se o agente de voz dominar a conversa. Priorize perguntas sobre quem/onde/o quê/quando/como em vez de perguntas do tipo "sim/não".
Garanta que a conversa do usuário faça a transição sem problemas quando ele quiser falar com agentes humanos.
Mais informações
Consulte o guia de criação de conversas fornecido pela equipe do Actions on Google.
Consulte o Playbook de boz voz do Next Billion Users (Próximo bilhão de usuários).
Consulte o guia de SSML sobre Cloud Text-to-Speech.
Leia sobre atos de fala para mais informações sobre como criar perguntas acionáveis.