Esta página foi traduzida pela API Cloud Translation.

Escolha um padrão de design para o seu sistema de IA autónomo

Last reviewed 2025-10-08 UTC

Este documento fornece orientações para ajudar a escolher um padrão de design para o seu sistema de IA com base em agentes. Os padrões de design de agentes são abordagens arquitetónicas comuns para criar aplicações com agentes. Um padrão de design de agente oferece uma framework distinta para organizar os componentes de um sistema, integrar o modelo e orquestrar um único agente ou vários agentes para realizar um fluxo de trabalho.

Os agentes de IA são eficazes para aplicações que resolvem problemas não específicos, que podem exigir tomada de decisões autónoma e gestão de fluxos de trabalho complexos de vários passos. Os agentes são excelentes a resolver problemas em tempo real através da utilização de dados externos e são excelentes a automatizar tarefas que exigem muitos conhecimentos. Os agentes de IA são adequados quando precisa que a IA conclua tarefas focadas em objetivos com algum grau de autonomia. Para outros exemplos de utilização, pode usar aplicações de IA generativa e de assistência. Para saber mais sobre as diferenças entre os agentes de IA e as aplicações de IA não baseadas em agentes, consulte o artigo Qual é a diferença entre agentes de IA, assistentes de IA e bots?

Este guia pressupõe que tem conhecimentos básicos dos sistemas de IA com agentes e como a respetiva arquitetura difere da dos sistemas sem agentes, como os que usam o raciocínio direto do modelo ou a geração aumentada de recuperação (RAG).

Para um resumo das orientações sobre o padrão de agente, consulte a secção Compare padrões de design mais adiante neste documento.

Vista geral do processo de design

Seguem-se os passos gerais para escolher um padrão de design para o seu sistema de IA com agentes. Estes passos são descritos detalhadamente mais adiante neste documento.

Defina os seus requisitos: avalie as características da sua carga de trabalho, incluindo a complexidade das tarefas, as expetativas de latência e desempenho, o orçamento de custos e a necessidade de envolvimento humano.
Reveja os padrões de design de agentes comuns: Saiba mais sobre os padrões de design comuns neste guia, que incluem sistemas de agente único e sistemas multiagentes.
Selecione um padrão: Selecione o padrão de design adequado com base nas características da sua carga de trabalho.

Este processo não é uma decisão única. Deve rever periodicamente estes passos para refinar a sua arquitetura à medida que as características da carga de trabalho mudam, os seus requisitos evoluem ou novas funcionalidades Google Cloud ficam disponíveis.

Defina os seus requisitos

As perguntas que se seguem não são listas de verificação exaustivas para o planeamento. Use estas perguntas como ponto de partida para identificar o objetivo principal do seu sistema autónomo e selecionar o melhor padrão de design.

Características da tarefa: a sua tarefa pode ser concluída em passos de fluxo de trabalho predefinidos ou é uma tarefa aberta? A sua tarefa precisa de usar um modelo de IA para orquestrar o fluxo de trabalho?
Latência e desempenho: precisa de priorizar respostas rápidas ou interativas à custa da precisão ou de respostas de alta qualidade? Em alternativa, a sua aplicação pode tolerar um atraso para alcançar um resultado mais preciso ou completo?
Custo: qual é o seu orçamento para os custos de inferência? Pode suportar padrões que requerem várias chamadas ao modelo para um único pedido?
Intervenção humana: a sua tarefa envolve decisões de alto risco, operações críticas para a segurança ou aprovações subjetivas que requerem julgamento humano?

Se a sua carga de trabalho for previsível ou altamente estruturada, ou se puder ser executada com uma única chamada para um modelo de IA, pode ser mais rentável explorar soluções não baseadas em agentes para a sua tarefa. Por exemplo, pode não precisar de um fluxo de trabalho autónomo para tarefas como resumir um documento, traduzir texto ou classificar o feedback dos clientes. Para obter informações sobre como escolher componentes de arquitetura para aplicações de IA generativa que não requerem uma infraestrutura de agente, consulte o artigo Escolha modelos e infraestrutura para a sua aplicação de IA generativa.

As secções seguintes descrevem padrões de conceção de agentes comuns para criar um sistema de IA com agentes fiável e eficaz.

Sistema de agente único

Um sistema de agente único usa um modelo de IA, um conjunto definido de ferramentas e um comando do sistema abrangente para processar autonomamente um pedido do utilizador ou concluir uma tarefa específica. Neste padrão fundamental, o agente baseia-se nas capacidades de raciocínio do modelo para interpretar o pedido de um utilizador, planear uma sequência de passos e decidir que ferramentas usar a partir de um conjunto definido. O comando do sistema molda o comportamento do agente definindo a respetiva tarefa principal, personalidade e operações, bem como as condições específicas para usar cada ferramenta.

O diagrama seguinte mostra uma vista de alto nível de um padrão de agente único:

Arquitetura do padrão de design de agente único.

Um sistema de agente único é ideal para tarefas que requerem vários passos e acesso a dados externos. Por exemplo, um agente do apoio ao cliente tem de consultar uma base de dados para encontrar o estado de uma encomenda, ou um assistente de pesquisa tem de chamar APIs para resumir notícias recentes. Um sistema não autónomo não pode realizar estas tarefas porque não consegue usar ferramentas de forma autónoma nem executar um plano de vários passos para sintetizar uma resposta final.

Se estiver numa fase inicial do desenvolvimento do agente, recomendamos que comece com um único agente. Quando inicia o desenvolvimento de agentes com um sistema de agente único, pode concentrar-se em refinar a lógica principal, o comando e as definições de ferramentas do seu agente antes de adicionar componentes arquitetónicos mais complexos.

O desempenho de um único agente pode ser menos eficaz quando usa mais ferramentas e quando as tarefas aumentam em complexidade. Pode observar isto como um aumento da latência, uma seleção ou uma utilização incorreta da ferramenta, ou uma falha na conclusão da tarefa. Pode muitas vezes mitigar estes problemas refinando o processo de raciocínio do agente com técnicas como o padrão Reason and Act (ReAct). No entanto, se o seu fluxo de trabalho exigir que um agente faça a gestão de várias responsabilidades distintas, estas técnicas podem não ser suficientes. Para estes casos, considere um sistema multiagente, que pode melhorar a resiliência e o desempenho ao delegar competências específicas em agentes especializados.

Sistemas multiagentes

Um sistema multiagente orquestra vários agentes especializados para resolver um problema complexo que um único agente não consegue gerir facilmente. O princípio fundamental é decompor um objetivo grande em subtarefas mais pequenas e atribuir cada subtarefa a um agente dedicado com uma competência específica. Estes agentes interagem através de fluxos de trabalho colaborativos ou hierárquicos para alcançar o objetivo final. Os padrões de multiagentes oferecem um design modular que pode melhorar a escalabilidade, a fiabilidade e a capacidade de manutenção do sistema geral em comparação com um único agente com um comando monolítico.

Num sistema multiagente, cada agente requer um contexto específico para realizar a sua tarefa de forma eficaz. O contexto pode incluir documentação, preferências históricas, links relevantes, histórico de conversas ou quaisquer restrições operacionais. O processo de gestão deste fluxo de informações chama-se engenharia de contexto. A engenharia de contexto inclui estratégias como isolar o contexto para um agente específico, persistir informações em vários passos ou comprimir grandes quantidades de dados para melhorar a eficiência.

A criação de um sistema multiagente requer avaliação, segurança, fiabilidade e considerações de custos adicionais em comparação com um sistema de agente único. Por exemplo, os sistemas multiagentes têm de implementar controlos de acesso precisos para cada agente especializado, criar um sistema de orquestração robusto para garantir uma comunicação fiável entre agentes e gerir os custos operacionais aumentados da sobrecarga computacional da execução de vários agentes. Para ver uma arquitetura de referência de exemplo para criar um sistema multiagente, consulte o artigo Sistemas de IA multiagentes no Google Cloud.

Padrão sequencial

O padrão sequencial multiagente executa uma série de agentes especializados numa ordem linear predefinida em que o resultado de um agente serve como entrada direta para o agente seguinte. Este padrão usa um agente de fluxo de trabalho sequencial que opera com base numa lógica predefinida sem ter de consultar um modelo de IA para a orquestração dos respetivos subagentes.

O diagrama seguinte mostra uma vista de alto nível de um padrão sequencial com vários agentes:

Arquitetura do padrão de design sequencial de vários agentes.

Use o padrão sequencial para processos altamente estruturados e repetíveis em que a sequência de operações não se altera. Por exemplo, um pipeline de processamento de dados pode usar este padrão para que um agente de extração de dados obtenha primeiro dados não processados e, em seguida, transmita esses dados a um agente de limpeza de dados para formatação, que, por sua vez, transmite os dados limpos a um agente de carregamento de dados para os guardar numa base de dados.

O padrão sequencial pode reduzir a latência e os custos operacionais em comparação com um padrão que usa um modelo de IA para orquestrar o fluxo de trabalho de tarefas. No entanto, esta eficiência tem um custo em termos de flexibilidade. A estrutura rígida e predefinida do pipeline dificulta a adaptação a condições dinâmicas ou a ignorar passos desnecessários, o que pode causar um processamento ineficiente ou gerar uma latência cumulativa mais elevada se um passo desnecessário for lento.

Padrão paralelo

O padrão paralelo multiagente, também conhecido como padrão concorrente, permite que vários subagentes especializados realizem uma tarefa ou subtarefas de forma independente em simultâneo. Em seguida, as saídas dos subagentes são sintetizadas para produzir a resposta consolidada final. Semelhante a um padrão sequencial, o padrão paralelo usa um agente de fluxo de trabalho paralelo para gerir como e quando os outros agentes são executados sem ter de consultar um modelo de IA para orquestrar os respetivos subagentes.

O diagrama seguinte mostra uma vista de alto nível de um padrão paralelo com vários agentes:

Arquitetura do padrão de design paralelo multiagente.

Use o padrão paralelo quando as subtarefas puderem ser executadas em simultâneo para reduzir a latência ou recolher diversas perspetivas, como recolher dados de origens diferentes ou avaliar várias opções em simultâneo. Por exemplo, para analisar o feedback dos clientes, um agente paralelo pode distribuir uma única entrada de feedback a quatro agentes especializados em simultâneo: um agente de análise de sentimentos, um agente de extração de palavras-chave, um agente de categorização e um agente de deteção de urgência. Um agente final reúne estes quatro resultados numa única análise abrangente do feedback.

O padrão paralelo pode reduzir a latência geral em comparação com uma abordagem sequencial, porque pode recolher informações diversificadas de várias fontes em simultâneo. No entanto, esta abordagem introduz compromissos em termos de custo e complexidade. A execução de vários agentes em paralelo pode aumentar a utilização imediata de recursos e o consumo de tokens, o que leva a custos operacionais mais elevados. Além disso, a etapa de recolha requer uma lógica complexa para sintetizar resultados potencialmente conflituantes, o que aumenta os custos gerais de desenvolvimento e manutenção do sistema.

Padrão de repetição

O padrão de agente de ciclo multiagente executa repetidamente uma sequência de subagentes especializados até ser cumprida uma condição de terminação específica. Este padrão usa um agente de fluxo de trabalho de ciclo que, tal como outros agentes de fluxo de trabalho, opera com base numa lógica predefinida sem consultar um modelo de IA para a orquestração. Depois de todos os subagentes concluírem as respetivas tarefas, o agente de ciclo avalia se uma condição de saída foi cumprida. A condição pode ser um número máximo de iterações ou um estado personalizado. Se a condição de saída não for cumprida, o agente de ciclo inicia novamente a sequência de subagentes. Pode implementar um padrão de ciclo em que a condição de saída é avaliada em qualquer ponto do fluxo. Use o padrão de ciclo para tarefas que requerem refinamento iterativo ou autocorreção, como gerar conteúdo e fazer com que um agente crítico o reveja até cumprir um padrão de qualidade.

O diagrama seguinte mostra uma vista de alto nível de um padrão de ciclo multiagente:

Arquitetura do padrão de design de ciclo multiagente.

O padrão de agente de ciclo oferece uma forma de criar fluxos de trabalho complexos e iterativos. Permite aos agentes refinar o seu próprio trabalho e continuar o processamento até ser alcançada uma qualidade ou um estado específico. No entanto, a principal desvantagem deste padrão é o risco de um ciclo infinito. Se a condição de rescisão não estiver definida corretamente ou se os subagentes não produzirem o estado necessário para parar, o ciclo pode ser executado indefinidamente. Isto pode levar a custos operacionais excessivos, a um elevado consumo de recursos e a potenciais bloqueios do sistema.

Padrão de revisão e crítica

O padrão de revisão e crítica multiagente, também conhecido como o padrão de gerador e crítico, melhora a qualidade e a fiabilidade do conteúdo gerado através da utilização de dois agentes especializados, normalmente num fluxo de trabalho sequencial. O padrão de revisão e crítica é uma implementação do padrão de agente de ciclo.

No padrão de revisão e crítica, um agente gerador cria um resultado inicial, como um bloco de código ou um resumo de um documento. Em seguida, um agente crítico avalia esta saída em relação a um conjunto predefinido de critérios, como a precisão factual, a conformidade com as regras de formatação ou as diretrizes de segurança. Com base na avaliação, o crítico pode aprovar o conteúdo, rejeitá-lo ou devolvê-lo ao gerador com feedback para revisão.

O diagrama seguinte mostra uma vista de alto nível de um padrão de crítica e revisão com vários agentes:

Arquitetura do padrão de design de revisão-crítica multiagente.

Este padrão é adequado para tarefas em que os resultados têm de ser altamente precisos ou têm de estar em conformidade com restrições rigorosas antes de serem apresentados a um utilizador ou usados num processo a jusante. Por exemplo, num fluxo de trabalho de geração de código, um agente gerador pode escrever uma função para satisfazer o pedido de um utilizador. Este código gerado é então transmitido a um agente crítico que atua como auditor de segurança. O agente crítico tem a função de verificar o código em relação a um conjunto de restrições, como procurar vulnerabilidades de segurança ou verificar se passa em todos os testes unitários, antes de o código ser aprovado para utilização.

O padrão de revisão e crítica pode melhorar a qualidade, a precisão e a fiabilidade do resultado, uma vez que adiciona um passo de validação dedicado. No entanto, esta garantia de qualidade tem o custo direto de aumentar a latência e as despesas operacionais. O fluxo de trabalho requer, pelo menos, uma chamada de modelo adicional para a avaliação do crítico. Se o processo incluir ciclos de revisão em que o conteúdo é enviado de volta para refinamento, a latência e os custos acumulam-se a cada iteração.

O padrão de refinamento iterativo usa um mecanismo de ciclo para melhorar progressivamente um resultado ao longo de vários ciclos. O padrão de refinamento iterativo é uma implementação do padrão de agente de ciclo.

Neste padrão, um ou mais agentes trabalham num ciclo para modificar um resultado que é armazenado no estado da sessão durante cada iteração. O processo continua até que o resultado cumpra um limite de qualidade predefinido ou atinja um número máximo de iterações, o que evita ciclos infinitos.

O diagrama seguinte mostra uma vista de alto nível de um padrão de refinamento iterativo com vários agentes:

Arquitetura do padrão de design de refinamento iterativo multiagente.

Este padrão é adequado para tarefas de geração complexas em que é difícil alcançar o resultado num único passo. Alguns exemplos destas tarefas incluem escrever e depurar um fragmento de código, desenvolver um plano detalhado de várias partes ou criar e rever um documento de formato longo. Por exemplo, num fluxo de trabalho de escrita criativa, um agente pode gerar um rascunho de uma publicação no blogue, criticar o rascunho em termos de fluxo e tom, e, em seguida, reescrever o rascunho com base nessa crítica. Este processo repete-se num ciclo até que o trabalho do agente cumpra uma norma de qualidade predefinida ou até que a repetição atinja um número máximo de iterações.

O padrão de refinamento iterativo pode produzir resultados altamente complexos ou refinados que seriam difíceis de alcançar num único passo. No entanto, o mecanismo de repetição aumenta diretamente a latência e os custos operacionais a cada ciclo. Este padrão também adiciona complexidade arquitetónica, porque requer condições de saída cuidadosamente concebidas, como uma avaliação de qualidade ou um limite máximo de iterações, para evitar custos excessivos ou execução não controlada.

Padrão de coordenador

O padrão de coordenador multiagente usa um agente central, o coordenador, para direcionar um fluxo de trabalho. O coordenador analisa e decompõe o pedido de um utilizador em subtarefas e, em seguida, envia cada subtarefa para um agente especializado para execução. Cada agente especializado é um especialista numa função específica, como consultar uma base de dados ou chamar uma API.

Uma distinção do padrão de coordenador é a sua utilização de um modelo de IA para orquestrar e encaminhar dinamicamente as tarefas. Por outro lado, o padrão paralelo baseia-se num fluxo de trabalho codificado para enviar tarefas para execução simultânea sem necessidade de orquestração de modelos de IA.

O diagrama seguinte mostra uma vista de alto nível de um padrão de coordenador multiagente:

Arquitetura do padrão de design do coordenador multiagente.

Use o padrão de coordenador para automatizar processos empresariais estruturados que requerem encaminhamento adaptativo. Por exemplo, um agente do serviço de apoio ao cliente pode atuar como o coordenador. O agente coordenador analisa a solicitação para determinar se se trata de uma solicitação de estado da encomenda, devolução de produto ou reembolso. Com base no tipo de pedido, o coordenador encaminha a tarefa para o agente especializado adequado.

O padrão de coordenador oferece flexibilidade em comparação com fluxos de trabalho mais rígidos e predefinidos. Ao usar um modelo para encaminhar tarefas, o coordenador pode processar uma maior variedade de entradas e adaptar o fluxo de trabalho no tempo de execução. No entanto, esta abordagem também introduz compromissos. Uma vez que o coordenador e cada agente especializado dependem de um modelo para raciocinar, este padrão resulta em mais chamadas de modelos do que um sistema de agente único. Embora o padrão de coordenador possa levar a um raciocínio de maior qualidade, também aumenta o débito de tokens, os custos operacionais e a latência geral quando comparado com um sistema de agente único.

Padrão de decomposição de tarefas hierárquica

O padrão de decomposição de tarefas hierárquica com vários agentes organiza os agentes numa hierarquia de vários níveis para resolver problemas complexos que requerem um planeamento extensivo. O padrão de decomposição de tarefas hierárquica é uma implementação do padrão de coordenador. Um agente principal de nível superior, ou raiz, recebe uma tarefa complexa e é responsável por decompor a tarefa em várias subtarefas mais pequenas e geríveis. O agente principal delega cada subtarefa a um subagente especializado num nível inferior. Este processo pode repetir-se em várias camadas, com agentes que decompõem progressivamente as tarefas atribuídas até que as tarefas sejam suficientemente simples para um agente trabalhador no nível mais baixo executar diretamente.

O diagrama seguinte mostra uma vista de alto nível de um padrão de decomposição de tarefas hierárquico com vários agentes:

Arquitetura do padrão de design de decomposição hierárquica de tarefas multiagente.

Use o padrão de decomposição de tarefas hierárquica para problemas ambíguos e ilimitados que requerem raciocínio de várias etapas, como tarefas que envolvem investigação, planeamento e síntese. Por exemplo, para concluir um projeto de investigação complexo, um agente coordenador decompõe o objetivo de alto nível em várias tarefas, como recolher informações, analisar as conclusões e sintetizar o relatório final. Em seguida, o agente coordenador delega essas tarefas a subagentes especializados, como um agente para recolha de dados, um agente de análise e um agente que escreve relatórios, para execução ou decomposição adicional.

O padrão de decomposição de tarefas hierárquica é ideal para resolver problemas altamente complexos e ambíguos porque os decompõe sistematicamente em subtarefas geríveis. Este padrão pode resultar em resultados mais abrangentes e de maior qualidade do que os padrões mais simples. No entanto, esta capacidade avançada apresenta compromissos significativos. A estrutura de vários níveis adiciona uma complexidade arquitetónica considerável, o que torna o sistema mais difícil de conceber, depurar e manter. As várias camadas de delegação e raciocínio também resultam num elevado número de chamadas de modelos, o que aumenta significativamente a latência geral e os custos operacionais em comparação com outros padrões.

Padrão de enxame

O padrão de enxame multiagente usa uma abordagem de comunicação colaborativa e abrangente. Neste padrão, vários agentes especializados trabalham em conjunto para refinar iterativamente uma solução para um problema complexo.

O diagrama seguinte mostra uma vista de alto nível de um padrão de enxame multiagente:

Arquitetura do padrão de design de enxame multiagente.

O padrão de enxame usa um agente de expedição para encaminhar um pedido do utilizador para um grupo colaborativo de agentes especializados. O agente de expedição interpreta o pedido e determina que agente no enxame é mais adequado para iniciar a tarefa. Neste padrão, cada agente pode comunicar com todos os outros agentes, o que lhes permite partilhar conclusões, criticar propostas e desenvolver o trabalho uns dos outros para refinar iterativamente uma solução. Qualquer agente no enxame pode transferir a tarefa para outro agente que determine ser mais adequado para processar o passo seguinte ou pode comunicar a resposta final ao utilizador através do agente coordenador.

Normalmente, um enxame não tem um supervisor central nem um agente coordenador para manter o processo no caminho certo. O agente de expedição não orquestra o fluxo de trabalho do agente, ao contrário do padrão de coordenador. Em vez disso, o agente de expedição facilita a comunicação entre os subagentes do enxame e o utilizador. Para garantir que o enxame acaba por parar e devolve um resultado, tem de definir uma condição de saída explícita. Esta condição é frequentemente um número máximo de iterações, um limite de tempo ou a concretização de um objetivo específico, como alcançar um consenso.

Use o padrão de enxame para problemas ambíguos ou altamente complexos que beneficiam de debate e refinamento iterativo. Por exemplo, a conceção de um novo produto pode envolver um agente de pesquisa de mercado, um agente de engenharia e um agente de modelagem financeira. Os agentes partilhavam ideias iniciais, debatiam as concessões entre funcionalidades e custos, e convergiam coletivamente numa especificação de design final que equilibrava todos os requisitos concorrentes.

O padrão de enxame simula uma equipa colaborativa de especialistas e, por isso, pode produzir soluções criativas e de qualidade excecionalmente elevada. No entanto, representa o padrão multiagente mais complexo e dispendioso de implementar. A falta de um agente que use um modelo de IA para orquestrar pode introduzir o risco de ciclos improdutivos ou a falha na convergência para uma solução. Por conseguinte, tem de criar uma lógica sofisticada para gerir a complexa comunicação entre agentes, controlar o fluxo de trabalho iterativo e processar os custos operacionais e a latência significativos associados à execução de uma conversa dinâmica de várias interações entre vários agentes.

Padrão de raciocínio e ação (ReAct)

O padrão ReAct é uma abordagem que usa o modelo de IA para enquadrar os seus processos de pensamento e ações como uma sequência de interações de linguagem natural. Neste padrão, o agente opera num ciclo iterativo de pensamento, ação e observação até ser cumprida uma condição de saída.

Raciocínio: o modelo raciocina sobre a tarefa e decide o que fazer a seguir. O modelo avalia todas as informações que recolheu para determinar se o pedido do utilizador foi totalmente respondido.
Ação: com base no seu processo de raciocínio, o modelo toma uma de duas ações:
- Se a tarefa não estiver concluída, seleciona uma ferramenta e, em seguida, formula uma consulta para recolher mais informações.
- Se a tarefa estiver concluída, formula a resposta final para enviar ao utilizador, o que termina o ciclo.
Observação: o modelo recebe o resultado da ferramenta e guarda informações relevantes na sua memória. Uma vez que o modelo guarda resultados relevantes, pode basear-se em observações anteriores, o que ajuda a evitar que o modelo se repita ou perca o contexto.

O ciclo iterativo termina quando o agente encontra uma resposta conclusiva, atinge um número máximo predefinido de iterações ou encontra um erro que o impede de continuar. Este ciclo iterativo permite que o agente crie dinamicamente um plano, recolha provas e ajuste a sua abordagem à medida que trabalha para obter uma resposta final.

O diagrama seguinte mostra uma vista de alto nível do padrão ReAct:

Arquitetura do padrão de design ReAct.

Use o padrão ReAct para tarefas complexas e dinâmicas que requerem planeamento e adaptação contínuos. Por exemplo, considere um agente de robótica que tem de gerar um caminho para fazer a transição de um estado inicial para um estado de objetivo:

Reflexão: o modelo raciocina sobre o caminho ideal para fazer a transição do estado atual para o estado de objetivo. Durante o processo de reflexão, o modelo é otimizado em função de métricas como o tempo ou a energia.
Ação: o modelo executa o passo seguinte no seu plano movendo-se ao longo de um segmento de caminho calculado.
Observação: o modelo observa e guarda o novo estado do ambiente. O modelo guarda a sua nova posição e quaisquer alterações ao ambiente que percebe.

Este ciclo permite que o agente cumpra restrições dinâmicas, como evitar novos obstáculos ou seguir regulamentos de trânsito, atualizando constantemente o seu plano com base em novas observações. O agente continua o ciclo iterativo até atingir o objetivo ou encontrar um erro.

Um único agente ReAct pode ser mais simples e rentável de implementar e manter do que um sistema multiagente complexo. O raciocínio do modelo fornece uma transcrição do raciocínio do modelo, o que ajuda na depuração. No entanto, esta flexibilidade introduz compromissos. A natureza iterativa e de vários passos do ciclo pode levar a uma latência ponto a ponto mais elevada em comparação com uma única consulta. Além disso, a eficácia do agente depende muito da qualidade do raciocínio do modelo de IA. Por conseguinte, um erro ou um resultado enganador de uma ferramenta num passo de observação pode propagar-se e fazer com que a resposta final esteja incorreta.

Padrão humano no circuito

O padrão de intervenção humana integra pontos de intervenção humana diretamente no fluxo de trabalho de um agente. Num ponto de verificação predefinido, o agente pausa a execução e chama um sistema externo para aguardar que uma pessoa reveja o seu trabalho. Este padrão permite que uma pessoa aprove uma decisão, corrija um erro ou forneça a entrada necessária antes de o agente poder continuar.

O diagrama seguinte mostra uma vista de alto nível de um padrão de intervenção humana:

Arquitetura do padrão de design humano no circuito com vários agentes.

Use o padrão de humano no circuito para tarefas que requerem supervisão humana, julgamento subjetivo ou aprovação final para ações críticas. Essas ações incluem a aprovação de uma transação financeira de grande valor, a validação do resumo de um documento confidencial ou o fornecimento de feedback subjetivo sobre conteúdo de criativos gerado. Por exemplo, um agente pode ter a tarefa de anonimizar um conjunto de dados de pacientes para fins de investigação. O agente identificaria e ocultaria automaticamente todas as informações de saúde protegidas, mas seria pausado num ponto de verificação final. Em seguida, aguarda que um responsável pela conformidade humano valide manualmente o conjunto de dados e aprove a respetiva publicação, o que ajuda a garantir que não são expostos dados confidenciais.

O padrão de intervenção humana melhora a segurança e a fiabilidade através da inserção de julgamento humano em pontos de decisão críticos no fluxo de trabalho. Este padrão pode adicionar uma complexidade arquitetónica significativa porque requer que crie e mantenha o sistema externo para interação do utilizador.

Padrão de lógica personalizada

O padrão de lógica personalizada oferece a máxima flexibilidade no design do fluxo de trabalho. Esta abordagem permite-lhe implementar uma lógica de orquestração específica que usa código, como declarações condicionais, para criar fluxos de trabalho complexos com vários caminhos de ramificação.

O diagrama seguinte ilustra um exemplo de utilização de um padrão de lógica personalizado para captar um processo de reembolso:

Arquitetura do padrão de design personalizado multiagente.

No diagrama anterior, segue-se o fluxo de trabalho de agente para o exemplo do agente de reembolso ao cliente:

O utilizador envia uma consulta ao agente de reembolso ao cliente que atua como um agente coordenador.
A lógica personalizada do coordenador invoca primeiro um agente de validação paralelo, que envia simultaneamente dois subagentes: o agente de validação do comprador e o agente de elegibilidade para reembolso.
Depois de recolher os resultados, o agente coordenador executa uma ferramenta para verificar se o pedido é elegível para um reembolso.
1. Se o utilizador for elegível, o coordenador encaminha a tarefa para um agente de processamento de reembolsos, que chama a ferramenta process_refund.
2. Se o utilizador não for elegível, o coordenador encaminha a tarefa para um fluxo sequencial separado, começando pelo agente de crédito da loja e pelo agente de decisão de crédito do processo.
O resultado do caminho escolhido é enviado para o agente de resposta final para formular a resposta para o utilizador.

O exemplo do agente de reembolso ao cliente requer uma solução única para a respetiva orquestração ao nível da lógica, que vai além das abordagens estruturadas que outros padrões oferecem. Este fluxo de trabalho mistura padrões porque executa uma verificação paralela e, em seguida, executa um ramo condicional personalizado que encaminha para dois processos a jusante totalmente diferentes. Este tipo de fluxo de trabalho complexo com padrões mistos é o exemplo de utilização ideal para o padrão de lógica personalizado.

Use o padrão de lógica personalizada quando precisar de um controlo detalhado sobre a execução do agente ou quando o seu fluxo de trabalho não se enquadrar num dos outros padrões descritos neste documento. No entanto, esta abordagem aumenta a complexidade do desenvolvimento e da manutenção. É responsável por conceber, implementar e depurar todo o fluxo de orquestração, o que requer mais esforço de desenvolvimento e pode ser mais propenso a erros do que usar um padrão predefinido suportado por uma ferramenta de desenvolvimento de agentes, como o Agent Development Kit (ADK).

Para obter informações sobre agentes personalizados e como implementar lógica personalizada através do ADK, consulte o artigo Agentes personalizados.

Compare padrões de design

A escolha de um padrão de agente é uma decisão arquitetónica fundamental. Cada padrão oferece diferentes vantagens e desvantagens em termos de flexibilidade, complexidade e desempenho. Para determinar o padrão adequado para a sua carga de trabalho, considere os padrões de design nas secções seguintes.

Fluxos de trabalho determinísticos

Os fluxos de trabalho determinísticos incluem tarefas previsíveis e sequenciais, e que têm um caminho de fluxo de trabalho claramente definido do início ao fim. Os passos nas suas tarefas são conhecidos antecipadamente e o processo não se altera muito de uma execução para a seguinte. Seguem-se padrões de design de agentes para fluxos de trabalho determinísticos:

Caraterísticas da carga de trabalho	Padrão de design de agente
Tarefas com vários passos que seguem um fluxo de trabalho rígido e predefinido. Não requer orquestração de modelos. Sequência fixa de operações. A saída de um agente é a entrada direta do agente seguinte na sequência.	Padrão sequencial multiagente
Tarefas independentes que podem ser executadas em simultâneo. Não requer orquestração de modelos. Reduz a latência geral executando subtarefas em simultâneo.	Padrão paralelo multiagente
Tarefas de geração abertas ou complexas que são difíceis de concluir numa única tentativa. Requer que o agente melhore progressivamente o resultado ao longo de vários ciclos. Não requer orquestração de modelos. Prioriza a qualidade do resultado em detrimento da latência.	Padrão de refinamento iterativo multiagente

Fluxos de trabalho que requerem orquestração dinâmica

Os fluxos de trabalho que requerem orquestração dinâmica incluem problemas complexos em que os agentes têm de determinar a melhor forma de proceder. O sistema de IA autónoma tem de planear, delegar e coordenar tarefas dinamicamente sem um script predefinido. Seguem-se os padrões de design de agentes para fluxos de trabalho que requerem orquestração autónoma e dinâmica:

Caraterísticas da carga de trabalho	Padrão de design de agente
Tarefas estruturadas e de vários passos que requerem a utilização de ferramentas externas. Requer um desenvolvimento rápido para um protótipo de uma solução como prova de conceito.	Padrão de agente único
Requer o encaminhamento dinâmico para um subagente especializado adequado para tarefas estruturadas com dados introduzidos variados. Latência elevada devido a várias chamadas para o modelo de IA coordenador, para que possa direcionar tarefas para o subagente adequado. Pode incorrer num custo elevado devido a várias chamadas para o agente coordenador.	Padrão de coordenador multiagente
Requer orquestração de modelos de vários níveis para tarefas complexas, ambíguas e sem restrições. Requer resultados abrangentes e de alta qualidade em que a decomposição da ambiguidade é o principal desafio. Latência elevada devido à decomposição aninhada de vários níveis que leva a várias chamadas ao modelo de IA para raciocínio.	Padrão de decomposição hierárquica de tarefas multiagente
Requer debate colaborativo e refinamento iterativo de vários agentes especializados para tarefas altamente complexas, em aberto ou ambíguas. Prioriza a síntese de várias perspetivas para criar uma solução abrangente ou criativa. Latência elevada e custos operacionais devido à comunicação dinâmica e abrangente entre agentes.	Padrão de enxame multiagente

Fluxos de trabalho que envolvem iteração

Os fluxos de trabalho que envolvem iteração incluem tarefas em que o resultado final é alcançado através de ciclos de refinamento, feedback e melhoria. Seguem-se padrões de design de agentes para fluxos de trabalho que envolvem iteração:

Caraterísticas da carga de trabalho	Padrão de design de agente
Requer que um agente raciocine, aja e observe de forma iterativa para criar ou adaptar um plano para tarefas complexas, dinâmicas e sem restrições. Prioriza um resultado mais preciso e completo em detrimento da latência.	Padrão ReAct
Requer tarefas de monitorização ou sondagem que repetem uma ação predefinida, como verificações automáticas, até que o agente cumpra uma condição de saída. Latência imprevisível ou de longa duração enquanto aguarda que uma condição de saída seja cumprida.	Padrão de ciclo multiagente
As tarefas requerem um passo de validação distinto antes da conclusão.	Padrão de revisão e crítica multiagente
Tarefas de geração abertas ou complexas que são difíceis de concluir numa única tentativa. Requer que o agente melhore progressivamente o resultado ao longo de vários ciclos. Não requer orquestração de modelos. Prioriza a qualidade do resultado em detrimento da latência.	Padrão de refinamento iterativo multiagente

Fluxos de trabalho com requisitos especiais

Os fluxos de trabalho com requisitos especiais incluem tarefas que não seguem os padrões de agentes comuns. As suas tarefas podem incluir uma lógica empresarial única ou podem exigir julgamento e intervenção humanos em pontos críticos. O seu sistema de IA autónoma é uma máquina criada à medida concebida para uma finalidade única e específica. Seguem-se padrões de conceção de agentes para fluxos de trabalho com requisitos especiais:

Caraterísticas da carga de trabalho	Padrão de design de agente
Requer supervisão humana devido a tarefas de alto risco ou subjetivas que podem incluir requisitos de segurança, fiabilidade e conformidade.	Padrão de intervenção humana
Lógica complexa e ramificada que vai além de uma sequência linear direta. Requer o controlo máximo para combinar regras predefinidas com o raciocínio do modelo. Requer um controlo de processos detalhado para um fluxo de trabalho que não se enquadra num modelo padrão.	Padrão de lógica personalizado

O que se segue?

Saiba como construir e gerir sistemas multiagentes com primitivas do ADK.
Saiba como alojar apps e agentes de IA no Cloud Run.
Saiba mais acerca de Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems.
Saiba como criar um agente com o Agent Development Kit.
Saiba como criar sistemas de IA multiagentes no Google Cloud.
Para ver mais arquiteturas de referência, diagramas e práticas recomendadas, explore o Centro de arquitetura na nuvem.

Colaboradores

Autor: Samantha He | Redator técnico

Outros colaboradores:

Abdul Saleh | Engenheiro de software
Amina Mansour | Head of Cloud Platform Evaluations Team
Amit Maraj | Developer Relations Engineer
Casey West | Architecture Advocate, Google Cloud
Jack Wotherspoon | Consultor de programadores
Joe Fernandez | Staff Technical Writer
Joe Shirey | Gestor de relações com programadores do Google Cloud
Karl Weinmeister | Head of Cloud Product Developer Relations
Kumar Dhanagopal | Cross-Product Solution Developer
Lisa Shen | Senior Outbound Product Manager, Google Cloud
Mandy Grover | Head of Architecture Center
Mark Lu | Redator técnico
Megan O'Keefe | Consultora de programadores
Olivier Bourgeois | Developer Relations Engineer
Shir Meir Lador | Developer Relations Engineering Manager
Vlad Kolesnikov | Developer Relations Engineer