Este documento descreve os principais conceitos para usar a API Conversational Analytics (geminidataanalytics.googleapis.com
), que lhe permite criar e interagir com agentes de dados que usam linguagem natural para responder a perguntas sobre os seus dados estruturados. Este documento descreve como funcionam os agentes, os fluxos de trabalho típicos, os modos de conversa, as funções de gestão de identidade e de acesso (IAM) e como criar sistemas com vários agentes.
Como funcionam os agentes de dados
Os agentes de dados da API Conversational Analytics usam o contexto que fornece (informações e dados da empresa) e ferramentas (como SQL e Python) para interpretar perguntas em linguagem natural e gerar respostas a partir dos seus dados estruturados.
O diagrama seguinte ilustra as fases do fluxo de trabalho de um agente quando um utilizador faz uma pergunta:
Conforme mostrado no diagrama, quando um utilizador faz uma pergunta, o agente processa o pedido nas seguintes fases:
- Entrada do utilizador: o utilizador envia uma pergunta em linguagem natural, juntamente com qualquer contexto adicional que fornecer.
- Origens de dados: o agente liga-se aos seus dados no Looker, BigQuery e Looker Studio para obter as informações necessárias.
- Motor de raciocínio: o núcleo do agente processa a pergunta do utilizador através das ferramentas disponíveis para gerar uma resposta.
- Resultado do agente: o agente gera uma resposta, que pode incluir texto, tabelas de dados ou especificações para gráficos.
Fluxos de trabalho para conceber e usar agentes
A API Conversational Analytics suporta fluxos de trabalho para criadores de agentes (que criam e configuram agentes) e para consumidores de agentes (que interagem com agentes).
O diagrama seguinte ilustra o processo completo, desde a configuração inicial por parte de um criador de agentes até às interações finais por parte de um consumidor de agentes:
As secções seguintes descrevem os fluxos de trabalho para criadores e consumidores de agentes mais detalhadamente.
O fluxo de trabalho de criação de agentes
O criador do agente é responsável pela configuração dos agentes. Este fluxo de trabalho envolve os seguintes passos:
- Criar agente: o criador começa por criar um novo agente e fornecer o contexto necessário, incluindo instruções do sistema e associações a origens de dados. Este passo é crucial para permitir que o agente compreenda e responda às perguntas dos utilizadores de forma eficaz.
- Partilhe o agente: depois de o agente ser configurado, o criador partilha-o com outros utilizadores e define os controlos de acesso baseados em funções adequados para gerir as autorizações.
O fluxo de trabalho do consumidor do agente
Normalmente, o consumidor do agente é um utilizador empresarial que precisa de obter respostas de um agente configurado. Este fluxo de trabalho envolve os seguintes passos:
- Encontrar um agente: o utilizador começa por encontrar um agente que foi partilhado consigo.
- Fazer uma pergunta: o utilizador faz uma pergunta em linguagem natural. Esta pergunta pode ser uma única consulta ou parte de uma conversa de várias interações.
- O agente "pensa": o motor de raciocínio do agente processa a pergunta. O motor de raciocínio usa o conhecimento predefinido do agente e as ferramentas do agente disponíveis (como SQL, Python e gráficos) num "ciclo de raciocínio" para determinar a melhor forma de responder à pergunta.
- O agente responde: o agente devolve uma resposta, que pode incluir texto, tabelas de dados ou gráficos.
Modos de conversa
Os agentes da API Conversational Analytics suportam diferentes modos de conversa que determinam a forma como um agente processa o histórico de conversas e a persistência do contexto nas interações. Estão disponíveis os seguintes modos de conversa:
- Modo sem estado: o agente não armazena o histórico de conversas. Cada interação é tratada de forma independente. Este modo é útil para aplicações em que não precisa de manter o contexto em várias interações.
- Modo com estado: o agente retém o contexto e o histórico de conversas, o que permite interações mais contextualizadas. Este modo é útil para aplicações em que precisa de manter o contexto em várias interações. Recomendamos a utilização do modo com estado para uma maior precisão e respostas personalizadas.
Escolha um modo de conversa com base nos requisitos da sua aplicação para o histórico de conversas e a persistência do contexto.
Funções de IAM
As funções da IAM controlam quem pode criar, gerir, partilhar e interagir com agentes da API Conversational Analytics. A tabela seguinte descreve as principais funções de IAM para a API Conversational Analytics:
Função | Âmbito típico | O que a função permite | Quem pode usar esta função |
---|---|---|---|
Criador de agentes de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentCreator ) |
Projeto | Criar agentes e herdar as autorizações de proprietário no agente. | Qualquer analista de dados |
Proprietário do agente de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentOwner ) |
Projeto, agente | Editar, partilhar ou eliminar agentes com outros utilizadores. | Analista de dados sénior |
Editor do agente de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentEditor ) |
Agente, projeto | Atualize a configuração ou o contexto de um agente. | Analista de dados júnior |
Utilizador do agente de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentUser ) |
Agente, projeto | Conversar no chat com um agente. | Marketer, proprietário da loja |
Visualizador do agente de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentViewer ) |
Projeto, agente | Listar agentes e obter os respetivos detalhes. | Qualquer utilizador |
Utilizador sem estado do agente de dados do Gemini Data Analytics (roles/geminidataanalytics.dataAgentStatelessUser ) |
Projeto | Conversar no chat com um agente sem armazenamento do contexto nem do histórico de conversas. | Qualquer utilizador |
Sistemas com vários agentes
Pode criar sistemas complexos integrando vários agentes da API Conversational Analytics. Um padrão comum é usar um agente "organizador" principal que delega tarefas a um ou mais agentes especializados que processam domínios específicos, como dados de vendas ou de marketing. Esta abordagem permite-lhe criar um sistema que pode processar uma vasta gama de perguntas combinando os pontos fortes de vários agentes.
O diagrama seguinte ilustra este padrão multiagente e mostra como um agente principal pode delegar uma pergunta sobre dados a um agente de estatísticas conversacionais especializado:
O fluxo de trabalho típico de um sistema multiagente envolve os seguintes passos:
- Um utilizador empresarial ou um analista de dados faz uma pergunta em linguagem natural, como "Mostra-me as três principais lojas por receita".
- Um agente "organizador" principal delega o pedido ao agente especializado adequado.
- Um agente especializado recebe o pedido delegado, liga-se às origens de dados relevantes, usa as respetivas ferramentas para gerar as consultas SQL e os gráficos necessários e gera uma resposta.
- A resposta do agente especializado é devolvida ao utilizador, como "As lojas 4, 9 e 3 têm a receita mais elevada. Aqui está um gráfico."
O que se segue?
Depois de compreender os conceitos básicos da API Conversational Analytics, explore como implementar estas funcionalidades:
- Explore como autenticar e associar a uma origem de dados.
- Saiba como criar e configurar um agente com HTTP.
- Saiba como criar e configurar um agente com Python.
- Saiba como orientar o comportamento de um agente com contexto criado.
- Compreenda o controlo de acesso com a IAM para a API Conversational Analytics.