Adaptação automática de fala

Ao executar uma solicitação de detecção de intent, é possível fornecer o contexto de fala para fornecer dicas ao reconhecedor de fala. Essas dicas podem ajudar no reconhecimento em um estado de conversa específico.

O recurso de adaptação automática de fala melhora a precisão do reconhecimento de fala do agente usando automaticamente entidades de agente, frases de treinamento e estados de conversa como dicas de contexto de fala para todas as solicitações de detecção de intent. Esse recurso é ativado por padrão.

Ativar ou desativar a adaptação automática de fala

Para ativar ou desativar a adaptação automática de fala:

  1. acesse o Console do Dialogflow (em inglês);
  2. selecione seu agente próximo à parte superior do menu da barra lateral à esquerda;
  3. clique no botão de configurações ao lado do nome do agente.
  4. Selecione a guia Fala.
  5. Role até a seção Melhorar a qualidade de reconhecimento de fala.
  6. Ative ou desative a opção Ativar a adaptação automática de fala.

Exemplos de melhorias no reconhecimento de fala

Com a adaptação automática de fala ativada, é possível criar seu agente de forma a tirar proveito dela. Nos exemplos a seguir, mostramos como é possível melhorar o reconhecimento de fala com algumas alterações no seu agente:

  1. Se você definir uma frase de treinamento que use a entidade do sistema @sys.number e o usuário final disser "dois", ela poderá ser reconhecida como "dos", "2" ou "dois". Com a adaptação automática de fala ativada, o Dialogflow usa a entidade @sys.number como uma dica durante o reconhecimento de fala, e o parâmetro é reconhecido como "dois" ou "2".

  2. Se você definir frases de treinamento com uma frase como "nariz entupido", uma expressão sonora do usuário similar é reconhecida como "nariz entupido" e não como "nariz entope pia".

  3. Se você definir entidades para nomes de produtos ou serviços oferecidos por sua empresa, e o usuário final mencionar esses termos em enunciados, eles terão mais chances de serem reconhecidos.

  4. Os enunciados do usuário com entidades numéricas consecutivas, mas distintas, podem ser ambíguos. Por exemplo, "Quero dois 16 pacotes" pode significar 2 quantidades de 16 pacotes ou 216 quantidades em pacotes. A Adaptação de fala pode ajudar a desambiguar esses casos se você configurar entidades com valores ortográficos:

    • Defina uma entidade quantity com entradas:
      zero
      one
      ...
      twenty
    • Defina uma entidade product ou size com entradas:
      sixteen pack
      two ounce
      ...
      five liter
    • Somente sinônimos de entidade são usados na adaptação de fala. Assim, você pode definir uma entidade com o valor de referência 1 e um único sinônimo one para simplificar a lógica de fulfillment.
  5. Use a adaptação automática de fala com entidades Regexp. É possível usar esses recursos juntos para capturar sequências alfanuméricas ou de dígitos.

    • Caracteres e pontuações especiais, como ` ~ ! @ # $ % ^ & * ( ) - _ = + , . < > / ? ; ' : " [ ] { } \ |, não são aceitos.
    • \s* e \s? são permitidos, mas \s não.
    • Você pode adicionar entradas de entidade regexp adicionais que não estejam em conformidade com essas ações específicas. Você se beneficiará com a correção automática de fala, desde que pelo menos uma das suas entradas esteja em conformidade.

    Por exemplo, é possível usar expressões regulares como as seguintes para capturar sequências alfanuméricas:

    ^[A-Za-z0-9]{1,10}$
    ^WAC\d+$
    215[2-8]{3}[A-Z]+$
    [a-zA-Z]\s?[a-zA-Z]\s?[0-9]\s?[0-9]\s?[0-9]\s?[a-zA-Z]\s?[a-zA-Z]
    

    As expressões regulares a seguir serão adaptadas para sequências de dígitos:

    \d{2,8}
    ^[0-9]+$
    2[0-9]{7}
    [2-9]\d{2}[0-8]{3}\d{4}
    

    Considere também usar @sys.number-sequence para aceitar qualquer sequência de dígitos e @sys.phone-number para um reconhecedor de número de telefone localizado.

Limitações

As seguintes limitações ocorrem:

  1. A adaptação automática de fala não funciona no Actions on Google (Google Assistente), porque o reconhecimento de fala é feito pelo Actions on Google antes de enviar dados ao Dialogflow.

  2. A compatibilidade integrada da adaptação automática de fala para entidades system e regexp varia de acordo com o idioma. Verifique os idiomas compatíveis com Tokens de classe de fala $OOV_CLASS_ALPHANUMERIC_SEQUENCE e $OOV_CLASS_DIGIT_SEQUENCE. Se seu idioma não estiver listado, você poderá contornar essa limitação. Por exemplo, para que um ID de funcionário com três letras e três dígitos seja reconhecido com precisão, crie seu agente com as seguintes entidades e parâmetros:

    • Defina uma entidade digit que contenha 10 entradas de entidade (com sinônimos):
      0, 0
      1, 1
      ...
      9, 9
    • Defina uma entidade letter que contenha 26 entradas de entidade (com sinônimos):
      A, A
      B, B
      ...
      Z, Z
    • Defina uma entidade employee-id que contenha uma única entrada de entidade (sem sinônimos):
      @letter @letter @letter @digit @digit @digit
    • Use @employee-id como parâmetro em uma frase de treinamento.