Modo agente

Este documento descreve o modo de agente no Gemini Code Assist.

O modo de agente está disponível nos ambientes de programação integrados (IDEs) do VS Code e IntelliJ. Para começar a usar o modo de agente, consulte o artigo Use o chat com agentes como programador em pares.

O modo de agente no VS Code é baseado na CLI do Gemini.

O modo de agente no IntelliJ não usa a CLI do Gemini.

Com o modo de agente, pode fazer qualquer uma das seguintes ações e muito mais:

  • Fazer perguntas sobre o seu código.
  • Use contexto e ferramentas integradas para melhorar o conteúdo gerado.
  • Configure servidores MCP para expandir as capacidades do agente.
  • Receba soluções para tarefas complexas com vários passos.
  • Gerar código a partir de documentos de design, problemas e TODO comentários.
  • Controle o comportamento do agente comentando, editando e aprovando planos e a utilização de ferramentas durante a execução.

Como funciona o modo de agente

No modo de agente, o seu comando é enviado para a API Gemini com uma lista de ferramentas disponíveis. A API Gemini processa o comando e devolve uma resposta. A resposta pode ser uma resposta direta ou um pedido para usar uma ferramenta disponível.

Quando é pedida uma ferramenta, o agente prepara-se para a usar e verifica se tem autorização para a usar com ou sem autorização explícita:

  • Para pedidos de ferramentas que modificam o sistema de ficheiros ou executam operações de mutação em quaisquer recursos, o Gemini pede-lhe que permita a operação, a menos que tenha configurado o Gemini para permitir sempre a ferramenta ou as ferramentas.
  • As solicitações de ferramentas só de leitura podem não pedir autorização antes de concluir a tarefa.

Quando lhe for pedido que permita a utilização de uma ferramenta, pode optar por permitir ou negar a operação. O agente também pode dar-lhe opções para permitir sempre uma ferramenta ou um servidor, ou permitir operações semelhantes. Para mais informações, consulte o artigo Permita sempre as ações do agente.

Assim que a autorização para usar a ferramenta é concedida ou autoconcedida, o agente usa a ferramenta para concluir a ação necessária e o resultado dessa ação é enviado de volta para a API Gemini. O Gemini processa o resultado da ação da ferramenta e gera outra resposta. Este ciclo de ação e avaliação continua até que a tarefa esteja concluída.

Para tarefas complexas, o Gemini pode mostrar um plano de alto nível para sua aprovação. Pode ajustar o plano e fazer perguntas no chat antes de iniciar o processo. Quando estiver satisfeito com o plano, pode aprová-lo. Depois de aprovar o plano, o agente começa a trabalhar na primeira tarefa e pede-lhe esclarecimentos ou autorizações, conforme necessário, à medida que executa o plano.

Contexto do modo agente

O contexto permite que um agente gere melhores respostas para um determinado comando. O contexto pode ser retirado de ficheiros no seu IDE, ficheiros nas pastas do sistema local, respostas de ferramentas e detalhes do comando.

Consoante o IDE e as definições, podem estar disponíveis diferentes contextos para o agente.

Os separadores seguintes detalham como o contexto é recolhido para diferentes IDEs.

VS Code

Os seguintes métodos de obtenção de contexto estão normalmente disponíveis para o Gemini Code Assist no modo de agente:

  • Informações no seu espaço de trabalho do IDE.
  • Respostas de ferramentas incorporadas, como grep, terminal, leitura de ficheiros ou escrita de ficheiros.
  • Respostas da Pesquisa Google.
  • Conteúdo de um determinado URL fornecido num comando ou por uma ferramenta.
  • Ficheiros de contexto que cria em Markdown.

Memória do agente

O modo de agente do Gemini Code Assist no VS Code tira partido do serviço de deteção de memória da CLI do Gemini para encontrar e carregar GEMINI.md ficheiros que fornecem contexto ao agente. O serviço de deteção de memória procura estes ficheiros hierarquicamente, começando pelo diretório de trabalho atual e movendo-se até à raiz do projeto e ao seu diretório pessoal. Também pesquisa em subdiretórios.

Pode criar ficheiros de contexto globais, ao nível do projeto e ao nível do componente, que são combinados para fornecer ao modelo as informações mais relevantes.

Pode usar o comando /memory show para ver o conteúdo combinado de todos os ficheiros GEMINI.md carregados e o comando /memory refresh para os recarregar.

IntelliJ

Os seguintes métodos de obtenção de contexto estão normalmente disponíveis para o Gemini Code Assist no modo de agente:

  • Informações no seu projeto de IDE, incluindo os seus ficheiros, símbolos indexados e utilização de símbolos no seu projeto.
  • Respostas de ferramentas integradas, como grep, leitura de ficheiros ou escrita de ficheiros.
  • Controlo de versões do IntelliJ.
  • Servidores e ferramentas de MCP configurados
  • Ficheiros de contexto que cria em Markdown.

Pode ver o contexto disponível para o agente no painel de contexto na área de comando de chat do modo de agente.

Gaveta de contexto do modo de agente.

Ferramentas

As ferramentas são uma categoria ampla de serviços que um agente pode usar para contexto e ações na respetiva resposta ao seu comando. As ferramentas permitem que os agentes acedam a informações atualizadas através de chamadas de funções para pontos finais da API ou para outros agentes. As ferramentas podem oferecer apenas uma função ou várias funções relacionadas.

Algumas ferramentas de exemplo são ferramentas integradas, como grep e leitura ou escrita de ficheiros, servidores de protocolo de contexto do modelo (MCP) locais ou remotos e as respetivas funções executáveis, bem como chamadas de API RESTful.

Ferramentas integradas

No modo de agente, o Gemini tem acesso às ferramentas do sistema integradas. Selecione o seu IDE para ver uma lista de ferramentas integradas disponíveis para o Gemini no modo de agente.

VS Code

Todas as ferramentas integradas da CLI do Gemini estão disponíveis para o modo de agente no Gemini Code Assist.

IntelliJ

read_file
Obtém o conteúdo de texto de um ficheiro através do respetivo caminho absoluto.
write_file
Escreve o texto indicado num ficheiro especificado, criando o ficheiro se não existir.
analyze_current_file
Analisa o ficheiro aberto no editor para encontrar erros e avisos.
find_files
Encontra o caminho absoluto para ficheiros dado um nome de ficheiro ou uma parte do caminho
grep
Encontra todos os ficheiros no projeto que contêm um determinado padrão de texto ou expressão regular.
list_files
Lista todos os ficheiros e diretórios num determinado caminho absoluto.
resolve_symbol
Resolve uma referência de símbolo específica à respetiva declaração original.
find_usages
Pesquisa no projeto todas as referências a uma determinada declaração de símbolo.
git
Executa um comando da interface de linhas de comando (CLI) do Git e devolve o resultado.
list_vcs_roots
Devolve todas as raízes do sistema de controlo de versões (VCS), como repositórios Git, no projeto atual.

Limitações

Algumas funcionalidades do chat padrão do Gemini Code Assist podem não estar disponíveis no modo de agente ou podem funcionar de forma diferente do que no chat padrão.

A recitação não está disponível no modo de agente. No modo de agente, o Gemini não cita fontes e não pode desativar as sugestões de código que correspondem a fontes citadas.

O que se segue?