Práticas recomendadas do playbook

As práticas recomendadas a seguir podem ajudar você a criar agentes robustos.

Nome do playbook em linguagem natural

Use linguagem natural com significados claros para os nomes dos playbooks. Por exemplo, "Guia da Central de Ajuda do cliente" é mais descritivo do que "company_specialist", o que ajuda a melhorar a performance dos Geradores de IA no momento da execução.

Metas concisas

As metas devem ser uma descrição concisa da finalidade do playbook.

Fornecer instruções de qualidade

As instruções devem:

  • refletem a abordagem passo a passo para resolver um problema do usuário final
  • ser frases concisas de linguagem natural com instruções de alto nível
  • ser direta e especificar os cenários de uso da ferramenta

Pelo menos um exemplo para cada playbook

É preciso ter pelo menos um exemplo para cada manual, mas é recomendável ter pelo menos quatro. Os exemplos devem incluir cenários de caminho ideal.

Sem exemplos suficientes, um playbook provavelmente resultará em um comportamento imprevisível. Se o playbook não estiver respondendo ou se comportando da maneira esperada, é provável que a causa seja a falta de exemplos ou a definição inadequada deles. Tente melhorar seus exemplos ou adicionar outros.

Precisão das instruções e dos exemplos

Embora seja útil escrever instruções claras e descritivas, a qualidade e a quantidade dos seus exemplos são o que determinam a precisão do comportamento do playbook. Em outras palavras, gaste mais tempo escrevendo exemplos completos do que instruções perfeitamente precisas.

Referências a ferramentas em exemplos

Se o playbook foi criado para fornecer respostas usando ferramentas, faça referência às ferramentas nos exemplos correspondentes a esse tipo de solicitação.

Campo operationId do esquema da ferramenta

Ao definir esquemas para suas ferramentas, o valor operationId é importante. As instruções do playbook vão fazer referência a esse valor. Confira a seguir as recomendações de nomenclatura para este campo:

  • Somente letras, números e sublinhados.
  • Precisa ser exclusivo entre todos os operationIds descritos no esquema.
  • Precisa ser um nome significativo que reflita a capacidade fornecida.

Validação do esquema da ferramenta

Valide o esquema da ferramenta. Use o Swagger Editor para verificar a sintaxe do esquema da OpenAPI 3.0.

Processar resultados de ferramentas vazias

Quando o playbook depende de uma ferramenta para informar a resposta, um resultado vazio da ferramenta pode levar a um comportamento imprevisível do playbook. Às vezes, o gerador de IA de manual vai alucinar informações em uma resposta em vez de um resultado da ferramenta. Para evitar isso, adicione instruções específicas para garantir que o gerador de IA do playbook não tente responder por conta própria.

Alguns casos de uso exigem que as respostas do playbook sejam bem fundamentadas nos resultados da ferramenta ou nos dados fornecidos e precisam mitigar as respostas com base apenas no conhecimento do Gerador de IA do playbook.

Exemplos de instruções para reduzir o número de alucinações:

  • "Você precisa usar a ferramenta para responder a todas as perguntas dos usuários"
  • "Se você não receber dados da ferramenta, responda que não sabe a resposta para a consulta do usuário"
  • "Não invente uma resposta se não receber dados da ferramenta"

Gerar um esquema com o Gemini

O Gemini pode gerar um esquema para você. Por exemplo, tente "can you create an example openAPI 3.0 schema for Google Calendar".

Playbooks focados

Evite criar playbooks muito grandes e complexos. Cada playbook precisa realizar uma tarefa específica e clara. Se você tiver um playbook complexo, divida-o em subplaybooks menores.

Evite loops e recursões

Não crie loops ou recursões ao vincular agentes nas suas instruções.

Fornecer informações de roteamento para exemplos

Quando um playbook precisa encaminhar para outro, forneça essas informações aos exemplos. Isso é fornecido como um exemplo do campo Exemplo final com informações de saída da seção de exemplo Entrada e saída.

Por exemplo, a frase final deste campo pode ser "Redirecionar de volta ao playbook padrão para outras consultas".

Usar funções JavaScript do Messenger de agentes de conversação (Dialogflow CX) para personalização

Ao usar o Messenger de agentes de conversação (Dialogflow CX), as funções abaixo são úteis para enviar informações de personalização do usuário da interface da Web para o playbook:

Como planejar a performance

Os recursos generativos geralmente exigem vários segundos ou até mesmo dezenas de segundos para gerar uma resposta. Embora os playbooks melhorem a naturalidade da conversa, é crucial gerenciar os tempos de resposta para manter uma experiência positiva do usuário final. Confira algumas estratégias para otimizar a performance:

  • Equilíbrio no uso de recursos generativos

    Considere cuidadosamente a troca entre o tempo necessário para executar vários recursos generativos e o valor que eles trazem para a conversa. Evite o uso excessivo desses recursos se eles não contribuem significativamente para a meta do usuário.

  • Minimizar a entrada de recursos generativos

    Tente coletar e processar a quantidade mínima de informações necessárias para que um gerador de IA gere uma resposta útil. Isso pode reduzir significativamente o tempo de processamento.

  • Usar a armazenagem em cache de contexto

    Se você estiver usando o Gemini por uma ferramenta e tiver um contexto inicial grande, confira as informações de armazenamento em cache usando o armazenamento em cache de contexto da Vertex AI para evitar solicitações repetitivas dos mesmos dados. Implemente respostas fixas para velocidade:

    Se o aplicativo não exigir conteúdo dinâmico e exclusivo, considere armazenar respostas usadas com frequência em um banco de dados tradicional, como o Firebase. Como são predefinidas e estão disponíveis, essas respostas fixas oferecem tempos de resposta muito mais rápidos do que um recurso generativo que precisa calcular uma resposta em tempo real.

  • Instrua o gerador de IA a produzir respostas concisas do manual

    Para entrada e saída de texto, o tempo de resposta do Gerador de IA depende muito do modelo usado e do comprimento da saída. Respostas curtas podem melhorar significativamente o desempenho. Embora o comprimento da entrada também seja um fator, a saída tem um impacto maior.

  • Respostas de streaming:

    Transmita as respostas do playbook de volta ao cliente do Dialogflow, que, por sua vez, transmite as respostas ao usuário final. Isso contrasta com a espera para que toda a resposta seja gerada antes de enviar qualquer parte dela. O streaming de respostas oferece uma experiência do usuário melhor, enviando respostas parciais conforme elas ficam disponíveis. Essa abordagem minimiza o atraso percebido e reduz o tempo de espera do usuário.