Práticas recomendadas para projetar agentes de voz

Neste guia, apresentamos as práticas recomendadas especificamente para projetar agentes de voz. Ao projetar um agente de voz, o objetivo é ajudar os usuários (usuários finais) a realizar uma tarefa sem encaminhar para um agente humano. Os usuários precisam sentir que estão tendo uma conversa natural, interativa e cooperativa com o agente de voz.

Consulte também o guia geral de design geral de agente para todos os tipos de agente e o guia de práticas recomendadas para usar o serviço do Dialogflow.

Avaliar a qualidade do agente

Para avaliar a qualidade da experiência do usuário do seu agente, acompanhe as seguintes métricas:

  • Percurso incorreto: quantos autores das chamadas acessaram o lugar errado.

  • Resolução da primeira chamada: número de chamadas resolvidas na primeira chamada ou contato.

  • Tempo médio de processamento: quanto tempo leva para resolver o problema do usuário.

  • Satisfação do cliente: a pontuação do agente de voz em uma pesquisa de usuário.

  • Número de turnos: quantas trocas são necessárias para concluir a tarefa do usuário.

  • Desligamento de usuários: a frequência com que os usuários desistem da conversa.

Reconhecimento de fala

As dicas a seguir podem ajudar seu agente a reconhecer a fala do usuário final:

  • O agente precisa incentivar o usuário final a usar frases longas ou completas. Isso melhora a qualidade do reconhecimento.
  • Use um webhook para verificar a entrada do usuário final que pode não ser reconhecida com precisão ou que precise ser validada.
  • Use eventos sem correspondência para pedir ao usuário final que se pronuncie de forma mais lenta e clara.

Estrutura da conversa

Geralmente, uma conversa com um agente por voz é organizada na seguinte sequência:

Atividade Exemplo Observações
Atividade de abertura

O usuário faz login ou liga para sua central de atendimento.

Agente de voz: oi, essa é a Travel Inc. Como posso ajudar?

O agente de voz inicia uma conversa com uma mensagem de recepção.
Sequência principal

Usuário: Quero reservar uma passagem aérea.

Agente de voz: Ok, para onde você quer ir?

Usuário: Guatemala em 19 de maio, 21h.

Agente de voz: Ok, reservamos um bilhete para a Guatemala em 19 de maio, às 21h.

A tarefa é definida pelo usuário e concluída pelo agente de voz. A tarefa pode levar várias etapas até que o agente de voz colete todas as informações necessárias.
Fechando a atividade

Agente de voz: Posso ajudar com mais alguma coisa?

Usuário: Não

Agente de voz: Ok, agradeço por conversar comigo.

O usuário estará pronto para terminar a conversa quando a solicitação for atendida.

Mensagem de boas-vindas

Ao projetar a mensagem de abertura para o usuário, pense em como acessar o primeiro tópico o mais rápido possível. A mensagem de boas-vindas precisa ser curta e direta. Veja abaixo algumas sugestões:

  1. Atenda a chamada com frases como "Olá".
  2. Identifique o agente por voz com frases como "Este é o agente/assistente de voz da empresa XYZ".
  3. Mostre disponibilidade com frases como "Como posso ajudar hoje?"

Qualquer informação desnecessária pode frustrar os usuários e fazê-los buscar um agente humano. No entanto, talvez seja necessário estender a mensagem de boas-vindas por motivos legais, como informar ao usuário que a conversa pode ser gravada.

Evite informações que façam a conversa parecer artificial ou desequilibrada. Exemplo:

O que fazer O que evitar
Adeque o tom de acordo com os usuários. Por exemplo, se você quiser que o usuário explique algo em uma ou duas frases, limite o agente de voz a uma ou duas frases por vez. Não instrua os usuários a falarem frases como "em uma ou duas frases, diga..." ou "você pode dizer coisas como..."
Concentre-se na tarefa que o usuário quer realizar e escreva estratégias de solução de erros para o caso de falhas na comunicação. Não diga aos usuários o que o agente de voz pode fazer com frases como "Posso ajudar você a resolver problemas complexos".

Pares de turnos de conversas

Uma conversa típica consiste em pares de turnos, como os seguintes tipos de trocas:

  • Resposta à pergunta, que é mais comum para um agente de voz
  • Aceitação/rejeição de convite
  • Saudação mútua

Às vezes, um par de turnos pode incluir um texto adicional, como uma explicação sobre por que precisamos fazer uma pergunta, informações básicas relacionadas à pergunta que queremos fazer ou uma reação à resposta do usuário. Por exemplo, considere o seguinte par de turnos para perguntas e respostas:

Agente de voz: Isso custa US$ 10/dia. (Informações/explicação) Você quer continuar adicionando esse benefício? (pergunta)

Usuário: Sim. (answer)

Agente de voz: Ótimo! reação

Consulte também a seção Fulfillment do guia de práticas recomendadas gerais de design de agentes para ver orientações sobre o posicionamento do fulfillment.

Correção da conversa

O reparo de conversas é a prática de corrigir mal-entendidos, frases ouvidas incorretamente e equívocos de interpretação para retomar uma conversa. O reparo de uma conversa pode ajudar a conquistar a confiança do usuário, mostrando que o agente de voz está ouvindo a solicitação.

Algumas práticas recomendadas:

  • Seja específico e use o contexto que o usuário já oferecia em turnos anteriores. Evite fazer perguntas óbvias e redundantes, como "Não entendi", "Não entendo" ou "Estou com problemas".

  • Ofereça ao usuário a oportunidade de se corrigir, ou seja, no turno dele, deixa que diga o que quer dizer como acredita ser a melhor maneira para garantir que ele tenha agência na conversa. Evite frases como "tente reformular" ou "você pode dizer X, Y ou Z".

  • Use a estrutura "Você quis dizer x?" para confirmar a compreensão.

A tabela a seguir descreve vários exemplos do que fazer e o que evitar:

O que fazer O que evitar

Usuário: Estou indo para a Itália.

Agente de voz: Qual país?

Usuário: Estou indo para a Itália.

Agente de voz: Não entendi muito bem. Poderia reformular? Aonde você vai?

Usuário: Quero pagar US$ 80.

Agente de voz: Você quer ganhar US$ 80? (Repete apenas as informações que precisam de confirmação)

Usuário: Quero pagar US$ 80.

Agente de voz: quer pagar US$ 80? (Repete a informação redundante "quero pagar")

Tratamento de erros

A seção a seguir descreve como lidar com situações em que uma conversa falha.

Nenhuma correspondência

Um evento sem correspondência é invocado quando o agente de voz não consegue encontrar uma intent para corresponder ao que o usuário disse.

Na primeira ocorrência do evento sem correspondência, tente o seguinte:

  • Repita a pergunta ao usuário, mas reescreva-a de forma mais curta para indicar as informações que estão faltando. Ao focar apenas nas informações que estão faltando, o agente de voz transmite a ideia de que ouviu o restante da declaração do usuário.

  • Você pode adicionar "desculpe" antes da pergunta reformulada para indicar que algo deu errado.

Na segunda instância do evento sem correspondência, mostre mais claramente que o agente de voz está se esforçando para ouvir. Por exemplo, considere a troca a seguir:

Usuário: Estou indo para a Itália

Agente de voz: Qual país?

Usuário: Itália

Agente de voz: Você está viajando para qual país?

Sem entrada

Se o agente de voz não tiver recebido resposta verbal do usuário, repita a pergunta da mesma forma que na primeira vez. Na segunda instância do evento sem entrada, você pode reformular a pergunta original, mas garantir que todos os componentes originais da pergunta estejam presentes.

Limitar repetições sem correspondência e sem entrada

Para evitar a que os usuários fiquem em um ciclo de erros, implemente no máximo 3 eventos sem correspondência/sem entrada em cada página. Encaminhe os usuários para um agente humano quando ocorrer o terceiro evento sem correspondência ou sem entrada.

Tempo limite de ausência de fala

Nos casos em que os usuários precisam analisar informações ou tomar decisões antes de continuar, aumente a configuração de tempo limite de ausência de fala para dar a eles tempo suficiente para responder.

No exemplo a seguir, a configuração de tempo limite de ausência de fala de dois segundos é muito curta para que o usuário leia uma mensagem SMS e decida:

Agente de voz: Enviei uma mensagem de texto para seu dispositivo. Clique no link para saber mais sobre o cartão de viagem. Vou tocar uma música para dar tempo de você ler o texto e me responder. <2 second pause l10n-attrs-original-order="second,pause"> Gostaria de continuar?

Usuário: Ainda estou lendo.

Agente de voz: Quer adicionar o cartão de viagem ao seu plano?

Técnicas de conversa

Esta seção descreve técnicas para ajudar o agente de voz a conquistar confiança dos usuários e deixar a conversa mais fluida.

Como elaborar perguntas acionáveis

Elabore perguntas explícitas e úteis para seu agente de voz fazer ao usuário. Por exemplo, considere o que fazer e o que evitar:

O que fazer O que evitar
Faça perguntas abertas, como "Quando você vai?", o que requer que o usuário informe datas, caso saiba, ou diga "Não sei". Não pergunte "Você sabe as datas da sua viagem?", porque isso só gera uma resposta de "sim" ou "não" e é menos acionável.
Pergunte "Você quer verificar o status do pedido de outro pacote?" Não pergunte "Você quer continuar com o status do pedido de outro pacote?"

Você também precisa preparar seu agente de voz para situações em que o usuário possa responder a uma pergunta implicitamente, como as pessoas geralmente fazem em conversas naturais. Por exemplo, considere a seguinte interação:

Agente de voz: Acesse Conta, clique em Uso e, depois, em Uso por linha. Avise quando você chegar lá.

Usuário: "Não posso ver dados de três meses atrás ou anteriores".

A resposta do usuário implica que ele chegou à tela de destino, mas ainda precisa de mais ajuda. Seu agente de voz precisa antecipar essas implicações, em vez de esperar que o usuário diga apenas "Eu cheguei" ou "Eu não cheguei".

Ganhe a confiança do usuário

Os agentes de voz podem mostrar aos usuários que estão ouvindo com confirmações e detalhes específicos. Se o agente de voz fornecer respostas genéricas, os usuários poderão sentir que o agente de voz não soa natural.

  • Use confirmações. Por exemplo, considere a seguinte interação, em que "Nenhum problema" é usado como confirmação:

    Usuário: Quero programar um pagamento para segunda-feira.

    Agente de voz: Sem problemas. Quanto você quer pagar na segunda-feira?

  • Adicione detalhes específicos para mostrar que o agente está ouvindo ativamente o usuário. Por exemplo, na troca acima, a frase "na segunda-feira" é um detalhe específico, que indica que o agente ouviu o que o usuário disse.

  • Responda a solicitação do usuário o mais rápido possível e exclua as etapas desnecessárias. No exemplo a seguir, as informações irrelevantes podem causar frustração do usuário:

    Usuário: Há uma interrupção na minha área?

    Agente de voz: Sei como é importante permanecer conectado. Vamos descobrir o que está causando esse problema. Informe os últimos quatro dígitos da linha em que você está tendo problemas. Se o problema ocorrer em várias linhas, forneça uma por enquanto.

    Usuário: 1234

    Agente de voz: Agradeço. Vou analisar as próximas etapas desta linha. Vamos começar. Desativar e reativar temporariamente o HD Voice pode fazer solucionar o problema. Deu certo?"

  • A conversa entre o usuário e o agente de voz deve ser equilibrada. Os usuários podem se sentir desconfortáveis com a falta de participação na conversa se o agente de voz dominar a conversa. Priorize perguntas sobre quem/onde/o quê/quando/como em vez de perguntas do tipo "sim/não".

  • Garanta que a conversa do usuário faça a transição sem problemas quando ele quiser falar com agentes humanos.

Mais informações