Modo agente

En este documento, se describe el modo de agente en Gemini Code Assist.

El modo de agente está disponible en el entorno de desarrollo integrado (IDE) de VS Code. Para comenzar a usar el modo de agente, consulta Cómo usar el chat con agente como programador par.

El modo de agente en VS Code funciona con la CLI de Gemini.

Con el modo de agente, puedes hacer lo siguiente y mucho más:

Haz preguntas sobre tu código.
Usa el contexto y las herramientas integradas para mejorar el contenido generado.
Configura servidores de MCP para extender las capacidades del agente.
Obtén soluciones para tareas complejas con varios pasos.
Genera código a partir de documentos de diseño, problemas y comentarios de TODO.
Controla el comportamiento del agente comentando, editando y aprobando planes y el uso de herramientas durante la ejecución.

Cómo funciona el modo de agente

En el modo de agente, tu instrucción se envía a la API de Gemini con una lista de herramientas disponibles. La API de Gemini procesa la instrucción y devuelve una respuesta. La respuesta puede ser una respuesta directa o una solicitud para usar una herramienta disponible.

Cuando se solicita una herramienta, el agente se prepara para usarla y verifica si se le permite usarla con o sin permiso explícito:

En el caso de las solicitudes de herramientas que modifican el sistema de archivos o realizan operaciones de mutación en cualquier recurso, Gemini te pedirá que permitas la operación, a menos que hayas configurado Gemini para que siempre permita la herramienta o las herramientas.
Es posible que las solicitudes de herramientas de solo lectura no pidan permiso antes de completar la tarea.

Cuando se te solicite que permitas el uso de una herramienta, puedes permitir o rechazar la operación. El agente también puede ofrecerte opciones para permitir siempre una herramienta o un servidor, o bien permitir operaciones similares. Para obtener más información, consulta Cómo permitir siempre las acciones del agente.

Una vez que se otorga el permiso para usar la herramienta o se otorga por sí mismo, el agente la usa para completar la acción requerida, y el resultado de esa acción se envía de vuelta a la API de Gemini. Gemini procesa el resultado de la acción de la herramienta y genera otra respuesta. Este ciclo de acción y evaluación continúa hasta que se completa la tarea.

Para las tareas complejas, Gemini puede mostrar un plan de alto nivel para que lo apruebes. Puedes ajustar el plan y hacer preguntas en el chat antes de comenzar el proceso. Cuando estés conforme con el plan, puedes aprobarlo. Después de que apruebes el plan, el agente comenzará a trabajar en la primera tarea y te pedirá aclaraciones o permisos según sea necesario a medida que ejecute el plan.

Contexto del modo agente

El contexto permite que un agente genere mejores respuestas para una instrucción determinada. El contexto se puede obtener de los archivos de tu IDE, los archivos de las carpetas del sistema local, las respuestas de las herramientas y los detalles de tu instrucción.

Según tu IDE y configuración, es posible que el agente tenga acceso a diferentes contextos.

En las siguientes pestañas, se detalla cómo se recopila el contexto para diferentes IDEs.

VS Code

Por lo general, Gemini Code Assist en modo de agente puede obtener contexto de las siguientes maneras:

Información en tu espacio de trabajo del IDE
Son las respuestas de herramientas integradas, como grep, terminal, lectura de archivos o escritura de archivos.
Respuestas de la Búsqueda de Google
Es el contenido de una URL determinada que se proporciona en una instrucción o mediante una herramienta.
Archivos de contexto que creas en Markdown

Memoria del agente

El modo de agente de Gemini Code Assist en VS Code aprovecha el servicio de descubrimiento de memoria de la CLI de Gemini para encontrar y cargar archivos GEMINI.md que proporcionan contexto para el agente. El servicio de detección de memoria busca estos archivos de forma jerárquica, comenzando por el directorio de trabajo actual y subiendo hasta la raíz del proyecto y tu directorio principal. También busca en los subdirectorios.

Puedes crear archivos de contexto globales, a nivel del proyecto y a nivel del componente, que se combinan para proporcionar al modelo la información más relevante.

Puedes usar el comando /memory show para ver el contenido combinado de todos los archivos GEMINI.md cargados y el comando /memory refresh para volver a cargarlos.

Extensiones de Gemini CLI

Puedes usar las extensiones de la CLI de Gemini para configurar y extender la funcionalidad del modo de agente de Gemini Code Assist.

El agente busca extensiones en dos ubicaciones:

WORKSPACE/.gemini/extensions, donde WORKSPACE es tu espacio de trabajo actual.
~/.gemini/extensions, donde ~ es tu directorio principal.

El agente carga todas las extensiones de ambas ubicaciones, pero si existe una extensión con el mismo nombre en ambas, tendrá prioridad la que se encuentre en el directorio del espacio de trabajo. Cada extensión es un directorio que contiene un archivo gemini-extension.json. Este archivo contiene la configuración de la extensión.

Para obtener más información, consulta Extensiones de la CLI de Gemini.

IntelliJ

Esta función no es compatible con Gemini Code Assist para IntelliJ ni otros IDE de JetBrains.

Herramientas

Las herramientas son una amplia categoría de servicios que un agente puede usar para obtener contexto y realizar acciones en su respuesta a tu instrucción. Algunas herramientas de ejemplo son las integradas, como grep y la lectura o escritura de archivos, los servidores locales o remotos del Protocolo de contexto del modelo (MCP) y sus funciones ejecutables, y las implementaciones de servicios personalizadas.

Limitaciones

Es posible que algunas funciones del chat estándar de Gemini Code Assist no estén disponibles en el modo de agente o que funcionen de manera diferente a como lo hacen en el chat estándar.

Modo agente Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.