Modo Agente

En este documento se describe el modo de agente de Gemini Code Assist.

El modo Agente está disponible en los entornos de desarrollo integrados (IDEs) de VS Code e IntelliJ. Para empezar a usar el modo Agente, consulta el artículo Usar la conversación con agentes como programador en pareja.

El modo Agente de VS Code se basa en Gemini CLI.

El modo Agente de IntelliJ no usa la CLI de Gemini.

Con el modo Agente, puedes hacer lo siguiente y más:

  • Hacer preguntas sobre tu código.
  • Usa el contexto y las herramientas integradas para mejorar el contenido generado.
  • Configura los servidores de MCP para ampliar las funciones del agente.
  • Obtén soluciones para tareas complejas con varios pasos.
  • Genera código a partir de documentos de diseño, incidencias y comentarios de TODO.
  • Controla el comportamiento del agente comentando, editando y aprobando planes y el uso de herramientas durante la ejecución.

Cómo funciona el modo de agente

En el modo agente, tu petición se envía a la API de Gemini con una lista de herramientas disponibles. La API de Gemini procesa la petición y devuelve una respuesta. La respuesta puede ser una respuesta directa o una solicitud para usar una herramienta disponible.

Cuando se solicita una herramienta, el agente se prepara para usarla y comprueba si tiene permiso para usarla con o sin permiso explícito:

  • En el caso de las solicitudes de herramientas que modifican el sistema de archivos o realizan operaciones de mutación en cualquier recurso, Gemini te pedirá que permitas la operación, a menos que hayas configurado Gemini para que siempre permita la herramienta o las herramientas.
  • Es posible que las solicitudes de herramientas de solo lectura no pidan permiso antes de completar la tarea.

Cuando se te pida que permitas el uso de una herramienta, puedes aceptar o rechazar la operación. El agente también puede ofrecerte opciones para permitir siempre una herramienta o un servidor, o bien permitir operaciones similares. Para obtener más información, consulta Permitir siempre las acciones del agente.

Una vez que se le concede permiso para usar la herramienta o se lo concede él mismo, el agente la usa para completar la acción necesaria y el resultado de esa acción se envía de vuelta a la API de Gemini. Gemini procesa el resultado de la acción de la herramienta y genera otra respuesta. Este ciclo de acción y evaluación continúa hasta que se completa la tarea.

En el caso de las tareas complejas, Gemini puede mostrarte un plan general para que lo apruebes. Puedes ajustar el plan y hacer preguntas en el chat antes de empezar el proceso. Cuando estés conforme con el plan, puedes aprobarlo. Una vez que apruebes el plan, el agente empezará a trabajar en la primera tarea y te pedirá aclaraciones o permisos según sea necesario mientras ejecuta el plan.

Contexto del modo Agente

El contexto permite a un agente generar mejores respuestas a una petición determinada. El contexto se puede obtener de los archivos de tu IDE, de los archivos de las carpetas de tu sistema local, de las respuestas de la herramienta y de los detalles de tu petición.

Según tu IDE y tu configuración, el agente puede tener acceso a diferentes contextos.

En las siguientes pestañas se explica cómo se obtiene el contexto en diferentes IDEs.

VS Code

Gemini Code Assist en modo agente suele tener acceso a los siguientes métodos para obtener contexto:

  • Información de tu espacio de trabajo del IDE.
  • Respuestas de herramientas integradas, como grep, terminal, lectura de archivos o escritura de archivos.
  • Respuestas de la Búsqueda de Google.
  • Contenido de una URL determinada proporcionada en una petición o por una herramienta.
  • Archivos de contexto que crees en Markdown.

Memoria del agente

El modo agente de Gemini Code Assist en VS Code aprovecha el servicio de detección de memoria de Gemini CLI para buscar y cargar GEMINI.md archivos que proporcionen contexto al agente. El servicio de descubrimiento de memoria busca estos archivos de forma jerárquica, empezando por el directorio de trabajo actual y subiendo hasta la raíz del proyecto y tu directorio principal. También busca en subdirectorios.

Puedes crear archivos de contexto globales, de nivel de proyecto y de nivel de componente, que se combinan para proporcionar al modelo la información más relevante.

Puedes usar el comando /memory show para ver el contenido combinado de todos los archivos GEMINI.md cargados y el comando /memory refresh para volver a cargarlos.

IntelliJ

Gemini Code Assist en modo agente suele tener acceso a los siguientes métodos para obtener contexto:

  • Información de tu proyecto de IDE, incluidos tus archivos, símbolos indexados y uso de símbolos en tu proyecto.
  • Respuestas de herramientas integradas, como grep, lectura de archivos o escritura de archivos.
  • Control de versiones de IntelliJ.
  • Servidores y herramientas de MCP configurados
  • Archivos de contexto que crees en Markdown.

Puedes ver el contexto disponible para el agente en el panel de contexto del área de petición del chat del modo Agente.

Cajón de contexto del modo Agente.

Herramientas

Las herramientas son una categoría amplia de servicios que un agente puede usar para obtener contexto y realizar acciones en su respuesta a tu petición. Las herramientas permiten a los agentes acceder a información actualizada mediante llamadas a funciones a endpoints de APIs u otros agentes. Las herramientas pueden ofrecer una sola función o varias funciones relacionadas.

Algunas herramientas de ejemplo son herramientas integradas, como grep y lectura o escritura de archivos, servidores de Model Context Protocol (MCP) locales o remotos y sus funciones ejecutables, así como llamadas a APIs RESTful.

Herramientas integradas

En el modo agente, Gemini tiene acceso a tus herramientas del sistema integradas. Selecciona tu IDE para ver una lista de las herramientas integradas disponibles para Gemini en modo agente.

VS Code

Todas las herramientas integradas de Gemini CLI están disponibles en el modo Agente de Gemini Code Assist.

IntelliJ

read_file
Obtiene el contenido de texto de un archivo mediante su ruta absoluta.
write_file
Escribe el texto proporcionado en un archivo especificado. Si el archivo no existe, lo crea.
analyze_current_file
Analiza el archivo abierto en el editor para detectar errores y advertencias.
find_files
Busca la ruta absoluta de los archivos a partir de un nombre de archivo o de una parte de la ruta
grep
Busca todos los archivos del proyecto que contengan un patrón de texto o una expresión regular determinados.
list_files
Enumera todos los archivos y directorios de una ruta absoluta determinada.
resolve_symbol
Resuelve una referencia de símbolo específica a su declaración original.
find_usages
Busca en el proyecto todas las referencias a una declaración de símbolo determinada.
git
Ejecuta un comando de la interfaz de línea de comandos (CLI) de Git y devuelve el resultado.
list_vcs_roots
Devuelve todas las raíces del sistema de control de versiones (VCS), como los repositorios de Git, del proyecto actual.

Limitaciones

Es posible que algunas funciones de la conversación estándar de Gemini Code Assist no estén disponibles en el modo agente o que funcionen de forma diferente a como lo hacen en la conversación estándar.

La recitación no está disponible en el modo Agente. En el modo agente, Gemini no cita fuentes y no puedes inhabilitar las sugerencias de código que coincidan con las fuentes citadas.

Siguientes pasos