Modalità agente

Questo documento descrive la modalità agente in Gemini Code Assist.

La modalità Agente è disponibile nell'ambiente di sviluppo integrato (IDE) VS Code. Per iniziare a utilizzare la modalità Agente, consulta Utilizzare la chat con agenti come pair programmer.

La modalità Agente in VS Code è basata sulla CLI Gemini.

Con la modalità Agente, puoi fare quanto segue e altro ancora:

  • Fare domande sul codice.
  • Utilizza il contesto e gli strumenti integrati per migliorare i contenuti generati.
  • Configura i server MCP per estendere le funzionalità dell'agente.
  • Ricevi soluzioni per attività complesse con più passaggi.
  • Genera codice da documenti di progettazione, problemi e commenti TODO.
  • Controlla il comportamento dell'agente commentando, modificando e approvando i piani e l'utilizzo degli strumenti durante l'esecuzione.

Come funziona la modalità Agente

In modalità agente, il prompt viene inviato all'API Gemini con un elenco di strumenti disponibili. L'API Gemini elabora il prompt e restituisce una risposta. La risposta potrebbe essere una risposta diretta o una richiesta di utilizzare uno strumento disponibile.

Quando viene richiesto uno strumento, l'agente si prepara a utilizzarlo e verifica se è autorizzato a utilizzarlo con o senza un'autorizzazione esplicita:

  • Per le richieste di strumenti che modificano il file system o eseguono operazioni di mutazione su qualsiasi risorsa, Gemini ti chiederà di consentire l'operazione, a meno che tu non abbia configurato Gemini per consentire sempre lo strumento o gli strumenti.
  • Le richieste di strumenti di sola lettura potrebbero non richiedere l'autorizzazione prima di completare l'attività.

Quando ti viene chiesto di consentire l'utilizzo di uno strumento, puoi scegliere di consentire o negare l'operazione. L'agente potrebbe anche offrirti opzioni per consentire sempre uno strumento o un server o consentire operazioni simili. Per ulteriori informazioni, vedi Consenti sempre le azioni dell'agente.

Una volta concessa o autoassegnata l'autorizzazione a utilizzare lo strumento, l'agente lo utilizza per completare l'azione richiesta e il risultato di questa azione viene inviato all'API Gemini. Gemini elabora il risultato dell'azione dello strumento e genera un'altra risposta. Questo ciclo di azione e valutazione continua fino al completamento dell'attività.

Per le attività complesse, Gemini potrebbe mostrare un piano di alto livello per la tua approvazione. Puoi perfezionare il piano e porre domande nella chat prima di iniziare la procedura. Una volta che il piano ti soddisfa, puoi approvarlo. Dopo che avrai approvato il piano, l'agente inizierà a lavorare sulla prima attività e ti chiederà chiarimenti o autorizzazioni in base alle necessità durante l'esecuzione del piano.

Contesto della modalità Agente

Il contesto consente a un agente di generare risposte migliori per un determinato prompt. Il contesto può essere tratto da file nell'IDE, file nelle cartelle di sistema locali, risposte dello strumento e dettagli del prompt.

A seconda dell'IDE e delle impostazioni, l'agente potrebbe avere a disposizione contesti diversi.

Le seguenti schede descrivono in dettaglio come vengono raccolti i contesti per diversi IDE.

VS Code

I seguenti metodi per ottenere il contesto sono in genere disponibili per Gemini Code Assist in modalità agente:

  • Informazioni nello spazio di lavoro IDE.
  • Risposte degli strumenti integrati come grep, terminale, lettura file o scrittura file.
  • Risposte della Ricerca Google.
  • Contenuti di un determinato URL fornito in un prompt o da uno strumento.
  • File di contesto creati in Markdown.

Memoria dell'agente

La modalità agente di Gemini Code Assist in VS Code utilizza il servizio di rilevamento della memoria della CLI Gemini per trovare e caricare i file GEMINI.md che forniscono il contesto per l'agente. Il servizio di rilevamento della memoria cerca questi file in modo gerarchico, a partire dalla directory di lavoro corrente e spostandosi fino alla radice del progetto e alla tua home directory. Esegue anche la ricerca nelle sottodirectory.

Puoi creare file di contesto globali, a livello di progetto e a livello di componente, che vengono combinati per fornire al modello le informazioni più pertinenti.

Puoi utilizzare il comando /memory show per visualizzare i contenuti combinati di tutti i file GEMINI.md caricati e il comando /memory refresh per ricaricarli.

Estensioni della CLI Gemini

Puoi utilizzare le estensioni della CLI Gemini per configurare ed estendere la funzionalità della modalità agente di Gemini Code Assist.

L'agente cerca le estensioni in due posizioni:

  • WORKSPACE/.gemini/extensions dove WORKSPACE è il tuo spazio di lavoro attuale.
  • ~/.gemini/extensions dove ~ è la tua home directory.

L'agente carica tutte le estensioni da entrambe le posizioni, ma se esiste un'estensione con lo stesso nome in entrambe, quella nella directory dello spazio di lavoro avrà la precedenza. Ogni estensione è una directory che contiene un file gemini-extension.json. Questo file contiene la configurazione dell'estensione.

Per saperne di più, vedi Estensioni della CLI Gemini.

IntelliJ

Questa funzionalità non è supportata nell'Assistente codice Gemini per IntelliJ o altri IDE JetBrains.

Strumenti

Gli strumenti sono una categoria generica di servizi che un agente può utilizzare per il contesto e le azioni nella sua risposta al tuo prompt. Alcuni strumenti di esempio sono strumenti integrati come grep e lettura o scrittura di file, server Model Context Protocol (MCP) locali o remoti e le relative funzioni eseguibili e implementazioni di servizi personalizzati.

Limitazioni

Alcune funzionalità della chat standard di Gemini Code Assist potrebbero non essere disponibili in modalità agente o potrebbero funzionare in modo diverso rispetto alla chat standard.

Passaggi successivi