A partire dal 29 aprile 2025, i modelli Gemini 1.5 Pro e Gemini 1.5 Flash non sono disponibili nei progetti che non li hanno mai utilizzati, inclusi i nuovi progetti. Per maggiori dettagli, vedi Versioni e ciclo di vita dei modelli.

Questa pagina è stata tradotta dall'API Cloud Translation.

Terreno con la Ricerca Google

Questa pagina spiega come basare le risposte di un modello utilizzando la Ricerca Google, che utilizza dati web di dominio pubblico.

Grounding con la Ricerca Google

Se vuoi collegare il tuo modello alle conoscenze del mondo, a un'ampia gamma possibile di argomenti o a informazioni aggiornate su internet, utilizza il grounding con la Ricerca Google.

La funzionalità di ancoraggio con la Ricerca Google supporta il recupero dinamico che ti offre la possibilità di generare risposte basate su fatti con la Ricerca Google. Pertanto, la configurazione del recupero dinamico valuta se un prompt richiede la conoscenza di eventi recenti e attiva il grounding con la Ricerca Google. Per ulteriori informazioni, consulta la sezione Riempimento dinamico.

Per scoprire di più sul grounding dei modelli in Vertex AI, consulta la Panoramica del grounding.

Modelli supportati

Questa sezione elenca i modelli che supportano il grounding con la Ricerca. Per scoprire in che modo ogni modello genera risposte basate su dati, segui queste istruzioni:

Prova un modello elencato in questa tabella nella console Google Cloud.
Fai clic sul pulsante di attivazione/disattivazione Collegamento a terra in modo che sia impostato su On.

Modello	Descrizione	Provare un modello
Gemini 2.0 Flash	Testo, codice, immagini, audio, video, video con audio, PDF Non supporta il recupero dinamico. Per ulteriori informazioni, consulta la sezione Considerazioni.	Prova il modello Gemini 2.0 Flash
Gemini 1.5 Pro	Solo input di testo	Prova il modello Gemini 1.5 Pro
Gemini 1.5 Flash	Solo input di testo	Prova il modello Gemini 1.5 Flash

Modello

Descrizione

Provare un modello

Gemini 2.0 Flash

Testo, codice, immagini, audio, video, video con audio, PDF

Non supporta il recupero dinamico. Per ulteriori informazioni, consulta la sezione Considerazioni.

Prova il modello Gemini 2.0 Flash

Gemini 1.5 Pro

Solo input di testo

Prova il modello Gemini 1.5 Pro

Gemini 1.5 Flash

Solo input di testo

Prova il modello Gemini 1.5 Flash

Lingue supportate

Per un elenco delle lingue supportate, consulta Lingue.

Basare il modello sulla Ricerca Google

Segui le istruzioni riportate di seguito per basare un modello su dati web disponibili pubblicamente.

Recupero dinamico

Puoi utilizzare il recupero dinamico nella tua richiesta per scegliere quando disattivare il grounding con la Ricerca Google. Questa opzione è utile quando il prompt non richiede una risposta basata sulla Ricerca Google e i modelli supportati possono fornire una risposta in base alle loro conoscenze senza alcuna base. In questo modo puoi gestire la latenza, la qualità e il costo in modo più efficace.

Prima di richiamare la configurazione di recupero dinamico nella richiesta, comprendere la seguente terminologia:

Punteggio di previsione: quando richiedi una risposta basata su dati, Vertex AI assegna un punteggio di previsione al prompt. Il punteggio di previsione è un valore di rappresentazione in virgola mobile compreso nell'intervallo [0,1]. Il suo valore dipende dal fatto che il prompt possa beneficiare della fondazione della risposta con le informazioni più aggiornate della Ricerca Google. Pertanto, un prompt che richiede una risposta basata su fatti più recenti sul web ha un punteggio di previsione più elevato. Un prompt per il quale è sufficiente una risposta generata dal modello ha un punteggio di previsione più basso.

Ecco alcuni esempi di prompt e i relativi punteggi di previsione.

Prompt	Punteggio di previsione	Commento
"Scrivi una poesia sulle peonie"	0,13	Il modello può fare affidamento sulle sue conoscenze e la risposta non richiede grounding
"Consigliami un giocattolo per un bambino di 2 anni"	0,36	Il modello può fare affidamento sulle sue conoscenze e la risposta non richiede grounding
"Puoi darmi la ricetta di un guacamole di ispirazione asiatica?"	0,55	La Ricerca Google può dare una risposta basata su dati, ma questa operazione non è strettamente necessaria; la conoscenza del modello potrebbe essere sufficiente
"Che cos'è Agent Builder? Come viene addebitato il grounding in Agent Builder?"	0,72	Richiede la Ricerca Google per generare una risposta ben fondata
"Chi ha vinto l'ultimo Gran Premio di Formula 1?"	0,97	Richiede la Ricerca Google per generare una risposta ben fondata

Soglia: nella richiesta, puoi specificare una configurazione di recupero dinamico con una soglia. La soglia è un valore a virgola mobile compreso nell'intervallo [0,1] e il valore predefinito è 0,7. Se il valore di soglia è zero, la risposta è sempre basata sulla Ricerca Google. Per tutti gli altri valori della soglia, si applica quanto segue:
- Se il punteggio di previsione è maggiore o uguale alla soglia, la risposta si basa sulla Ricerca Google. Una soglia più bassa implica che più prompt hanno risposte generate utilizzando il Grounding con la Ricerca Google.
- Se il punteggio di previsione è inferiore alla soglia, il modello potrebbe comunque generare la risposta, ma non è basato sulla Ricerca Google.

Per trovare una soglia adatta alle esigenze della tua attività, puoi creare un insieme rappresentativo di query che prevedi di trovare. Poi puoi ordinare le query in base al punteggio di previsione nella risposta e selezionare una buona soglia per il tuo caso d'uso.

Considerazioni

Per utilizzare il grounding con la Ricerca Google, devi attivare i suggerimenti della Ricerca Google. Scopri di più sui suggerimenti della Ricerca Google.
Per risultati ottimali, utilizza una temperatura di 0.0. Per scoprire di più su come impostare questa configurazione, consulta il corpo della richiesta dell'API Gemini nel riferimento del modello.
La funzionalità di grounding con la Ricerca Google ha un limite di un milione di query al giorno. Se hai bisogno di ulteriori informazioni, contatta l'assistenzaGoogle Cloud .
Solo i modelli Gemini 1.0 e Gemini 1.5 supportano il recupero dinamico. I modelli Gemini 2.0 non supportano il recupero dinamico.

Gen AI SDK for Python

Installa

pip install --upgrade google-genai

Per scoprire di più, consulta la documentazione di riferimento dell'SDK.

Imposta le variabili di ambiente per utilizzare l'SDK Gen AI con Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=us-central1
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import (
    GenerateContentConfig,
    GoogleSearch,
    HttpOptions,
    Tool,
)

client = genai.Client(http_options=HttpOptions(api_version="v1"))

response = client.models.generate_content(
    model="gemini-2.0-flash-001",
    contents="When is the next total solar eclipse in the United States?",
    config=GenerateContentConfig(
        tools=[
            # Use Google Search Tool
            Tool(google_search=GoogleSearch())
        ],
    ),
)

print(response.text)
# Example response:
# 'The next total solar eclipse in the United States will occur on ...'

Console

Per utilizzare il grounding con la Ricerca Google con Vertex AI Studio, segui questi passaggi:

Nella console Google Cloud, vai alla pagina Vertex AI Studio.
Vai a Vertex AI Studio
Fai clic sulla scheda Forma libera.
Nel riquadro laterale, fai clic sul pulsante di attivazione/disattivazione Basa le risposte sul modello.
Fai clic su Personalizza e imposta la Ricerca Google come origine.
Inserisci il prompt nella casella di testo e fai clic su Invia.

Le risposte rapide ora si basano sulla Ricerca Google.

REST

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

LOCATION: la regione in cui elaborare la richiesta.
PROJECT_ID: il tuo ID progetto.
MODEL_ID: l'ID del modello multimodale. I modelli Gemini 2.0 e versioni successive non supportano il recupero dinamico.
TEXT: le istruzioni di testo da includere nel prompt.
DYNAMIC_THRESHOLD: un campo facoltativo per impostare la soglia per richiamare la configurazione del recupero dinamico. È un valore a rappresentazione in virgola mobile compreso nell'intervallo [0,1]. Se non imposti il campo dynamicThreshold, il valore predefinito della soglia è 0,7.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Corpo JSON della richiesta:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "googleSearchRetrieval": {
      "dynamicRetrievalConfig": {
        "mode": "MODE_DYNAMIC",
        "dynamicThreshold": DYNAMIC_THRESHOLD
      }
    }
  }],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Per inviare la richiesta, espandi una di queste opzioni:

curl (Linux, macOS o Cloud Shell)

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che ti consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent"

PowerShell (Windows)

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso alla CLI gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent" | Select-Object -Expand Content

Dovresti ricevere una risposta JSON simile alla seguente:

{
   "candidates": [
     {
       "content": {
         "role": "model",
         "parts": [
           {
             "text": "Chicago weather changes rapidly, so layers let you adjust easily. Consider a base layer, a warm mid-layer (sweater-fleece), and a weatherproof outer layer."
           }
         ]
       },
       "finishReason": "STOP",
       "safetyRatings":[
       "..."
    ],
       "groundingMetadata": {
         "webSearchQueries": [
           "What's the weather in Chicago this weekend?"
         ],
         "searchEntryPoint": {
            "renderedContent": "....................."
         }
         "groundingSupports": [
            {
              "segment": {
                "startIndex": 0,
                "endIndex": 65,
                "text": "Chicago weather changes rapidly, so layers let you adjust easily."
              },
              "groundingChunkIndices": [
                0
              ],
              "confidenceScores": [
                0.99
              ]
            },
          ]
          "retrievalMetadata": {
              "webDynamicRetrievalScore": 0.96879
            }
       }
     }
   ],
   "usageMetadata": { "..."
   }
 }

Informazioni sulla risposta

Se il prompt del modello si basa correttamente sulla Ricerca Google da Vertex AI Studio o dall'API, le risposte includono metadati con link alle origini (URL web). Tuttavia, esistono diversi motivi per cui questi metadati potrebbero non essere forniti e la risposta al prompt non sarà basata su dati. Questi motivi includono la bassa pertinenza della fonte o informazioni incomplete nella risposta del modello.

Citazioni

Ti consigliamo vivamente di mostrare le citazioni. Aiutano gli utenti a convalidare le risposte dei publisher stessi e offrono opportunità di apprendimento ulteriore.

Le citazioni per le risposte provenienti dalle fonti della Ricerca Google devono essere mostrate sia in linea sia in forma aggregata. Guarda l'immagine seguente come suggerimento su come procedere.

Esempi di citazioni

Utilizzo di opzioni di motori di ricerca alternativi

L'utilizzo della funzionalità di ancoraggio con la Ricerca Google da parte del Cliente non impedisce al Cliente di offrire opzioni alternative per i motori di ricerca, di impostare le opzioni di ricerca alternativa come opzione predefinita per le Applicazioni del Cliente o di mostrare suggerimenti di ricerca o risultati di ricerca propri o di terze parti nelle Applicazioni del Cliente, a condizione che questi servizi non correlati alla Ricerca Google o i risultati associati vengano visualizzati separatamente dai risultati basati su ancoraggio e dai suggerimenti di ricerca e non possano essere ragionevolmente attribuiti o confusi con i risultati forniti da Google.

Passaggi successivi

Per scoprire come inviare richieste di prompt di chat, consulta Chat multiturno.
Per scoprire di più sulle best practice per l'IA responsabile e sui filtri di sicurezza di Vertex AI, consulta le best practice per la sicurezza.
Per scoprire come eseguire il grounding dei modelli PaLM, consulta Grounding in Vertex AI.