Arquitetura da API Conversational Analytics e conceitos-chave

Este documento descreve os principais conceitos para usar a API Conversational Analytics (geminidataanalytics.googleapis.com), que lhe permite criar e interagir com agentes de dados que usam linguagem natural para responder a perguntas sobre os seus dados estruturados. Este documento descreve como funcionam os agentes, os fluxos de trabalho típicos, os modos de conversa, as funções de gestão de identidade e de acesso (IAM) e como criar sistemas com vários agentes.

Como funcionam os agentes de dados

Os agentes de dados da API Conversational Analytics usam o contexto que fornece (informações e dados da empresa) e ferramentas (como SQL e Python) para interpretar perguntas em linguagem natural e gerar respostas a partir dos seus dados estruturados.

O diagrama seguinte ilustra as fases do fluxo de trabalho de um agente quando um utilizador faz uma pergunta:

Diagrama da arquitetura da API Conversational Analytics, que mostra o fluxo desde a entrada do utilizador através de um motor de raciocínio até ao resultado final.

Conforme mostrado no diagrama, quando um utilizador faz uma pergunta, o agente processa o pedido nas seguintes fases:

  1. Entrada do utilizador: o utilizador envia uma pergunta em linguagem natural, juntamente com qualquer contexto adicional que fornecer.
  2. Origens de dados: o agente liga-se aos seus dados no Looker, BigQuery e Looker Studio para obter as informações necessárias.
  3. Motor de raciocínio: o núcleo do agente processa a pergunta do utilizador através das ferramentas disponíveis para gerar uma resposta.
  4. Resultado do agente: o agente gera uma resposta, que pode incluir texto, tabelas de dados ou especificações para gráficos.

Fluxos de trabalho para conceber e usar agentes

A API Conversational Analytics suporta fluxos de trabalho para criadores de agentes (que criam e configuram agentes) e para consumidores de agentes (que interagem com agentes).

O diagrama seguinte ilustra o processo completo, desde a configuração inicial por parte de um criador de agentes até às interações finais por parte de um consumidor de agentes:

O fluxo de trabalho completo para a conceção e a utilização de agentes, desde tarefas de criadores, como criar e partilhar, até tarefas de utilizadores de dados, como interagir com um agente.

As secções seguintes descrevem os fluxos de trabalho para criadores e consumidores de agentes mais detalhadamente.

O fluxo de trabalho de criação de agentes

O criador do agente é responsável pela configuração dos agentes. Este fluxo de trabalho envolve os seguintes passos:

  1. Criar agente: o criador começa por criar um novo agente e fornecer o contexto necessário, incluindo instruções do sistema e associações a origens de dados. Este passo é crucial para permitir que o agente compreenda e responda às perguntas dos utilizadores de forma eficaz.
  2. Partilhe o agente: depois de o agente ser configurado, o criador partilha-o com outros utilizadores e define os controlos de acesso baseados em funções adequados para gerir as autorizações.

O fluxo de trabalho do consumidor do agente

Normalmente, o consumidor do agente é um utilizador empresarial que precisa de obter respostas de um agente configurado. Este fluxo de trabalho envolve os seguintes passos:

  1. Encontrar um agente: o utilizador começa por encontrar um agente que foi partilhado consigo.
  2. Fazer uma pergunta: o utilizador faz uma pergunta em linguagem natural. Esta pergunta pode ser uma única consulta ou parte de uma conversa de várias interações.
  3. O agente "pensa": o motor de raciocínio do agente processa a pergunta. O motor de raciocínio usa o conhecimento predefinido do agente e as ferramentas do agente disponíveis (como SQL, Python e gráficos) num "ciclo de raciocínio" para determinar a melhor forma de responder à pergunta.
  4. O agente responde: o agente devolve uma resposta, que pode incluir texto, tabelas de dados ou gráficos.

Modos de conversa

Os agentes da API Conversational Analytics suportam diferentes modos de conversa que determinam a forma como um agente processa o histórico de conversas e a persistência do contexto nas interações. Estão disponíveis os seguintes modos de conversa:

  • Modo sem estado: o agente não armazena o histórico de conversas. Cada interação é tratada de forma independente. Este modo é útil para aplicações em que não precisa de manter o contexto em várias interações.
  • Modo com estado: o agente retém o contexto e o histórico de conversas, o que permite interações mais contextualizadas. Este modo é útil para aplicações em que precisa de manter o contexto em várias interações. Recomendamos a utilização do modo com estado para uma maior precisão e respostas personalizadas.

Escolha um modo de conversa com base nos requisitos da sua aplicação para o histórico de conversas e a persistência do contexto.

Os diferentes modos de chat para um agente da API Conversational Analytics.

Funções de IAM

As funções da IAM controlam quem pode criar, gerir, partilhar e interagir com agentes da API Conversational Analytics. A tabela seguinte descreve as principais funções de IAM para a API Conversational Analytics:

Função Âmbito típico O que a função permite Quem pode usar esta função
Criador de agentes de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentCreator) Projeto Criar agentes e herdar as autorizações de proprietário no agente. Qualquer analista de dados
Proprietário do agente de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentOwner) Projeto, agente Editar, partilhar ou eliminar agentes com outros utilizadores. Analista de dados sénior
Editor do agente de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentEditor) Agente, projeto Atualize a configuração ou o contexto de um agente. Analista de dados júnior
Utilizador do agente de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentUser) Agente, projeto Conversar no chat com um agente. Marketer, proprietário da loja
Visualizador do agente de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentViewer) Projeto, agente Listar agentes e obter os respetivos detalhes. Qualquer utilizador
Utilizador sem estado do agente de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentStatelessUser) Projeto Conversar no chat com um agente sem armazenamento do contexto nem do histórico de conversas. Qualquer utilizador

Sistemas com vários agentes

Pode criar sistemas complexos integrando vários agentes da API Conversational Analytics. Um padrão comum é usar um agente "organizador" principal que delega tarefas a um ou mais agentes especializados que processam domínios específicos, como dados de vendas ou de marketing. Esta abordagem permite-lhe criar um sistema que pode processar uma vasta gama de perguntas combinando os pontos fortes de vários agentes.

O diagrama seguinte ilustra este padrão multiagente e mostra como um agente principal pode delegar uma pergunta sobre dados a um agente de estatísticas conversacionais especializado:

Um agente orquestrador principal delega uma pergunta de dados a um agente de vendas especializado, que devolve uma resposta ao utilizador.

O fluxo de trabalho típico de um sistema multiagente envolve os seguintes passos:

  1. Um utilizador empresarial ou um analista de dados faz uma pergunta em linguagem natural, como "Mostra-me as três principais lojas por receita".
  2. Um agente "organizador" principal delega o pedido ao agente especializado adequado.
  3. Um agente especializado recebe o pedido delegado, liga-se às origens de dados relevantes, usa as respetivas ferramentas para gerar as consultas SQL e os gráficos necessários e gera uma resposta.
  4. A resposta do agente especializado é devolvida ao utilizador, como "As lojas 4, 9 e 3 têm a receita mais elevada. Aqui está um gráfico."

O que se segue?

Depois de compreender os conceitos básicos da API Conversational Analytics, explore como implementar estas funcionalidades: