Mostrare gradualmente le risposte

Questa pagina introduce il metodo di risposta in streaming.

Il metodo di risposta in streaming ha molte delle stesse funzionalità del metodo di risposta, più una funzionalità aggiuntiva: lo streaming. Quando trasmetti in streaming una risposta, questa viene suddivisa in più parti che vengono inviate in sequenza.

Le risposte dinamiche sono particolarmente utili se le risposte generate sono lunghe, in modo che l'invio dell'intera risposta contemporaneamente causi un ritardo. Le risposte in streaming riducono la latenza.

Limitazioni

Il metodo di risposta in streaming ha le stesse funzionalità del metodo di risposta con le seguenti eccezioni:

  • Il numero di passaggi di riformulazione è uno. Non puoi disattivare la riformulazione né modificare il numero massimo di passaggi.

  • Solo i modelli Gemini possono essere utilizzati con il metodo di risposta in streaming. Per un elenco dei modelli, vedi Modelli disponibili.

Visualizzare in streaming una risposta

Il seguente comando mostra come chiamare il metodo streaming answer e restituire una risposta generata sotto forma di una serie di risposte JSON. In genere, ogni risposta contiene una frase della risposta.

Questo comando di base mostra solo l'input richiesto. Le opzioni vengono lasciate ai valori predefiniti.

Per esempi di altre opzioni, consulta Ricevere risposte e follow-up. Alcune opzioni di risposta non sono disponibili per lo streaming delle risposte. Consulta le limitazioni in questa pagina.

REST

Per cercare e ottenere risultati con una risposta generata in streaming:

  1. Esegui questo comando curl:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del tuo Google Cloud progetto.
    • APP_ID: l'ID dell'app Vertex AI Search per cui vuoi eseguire query.
    • QUERY: una stringa di testo libero che contiene la domanda o la query di ricerca. Ad esempio, "Quale database è più veloce, BigQuery o Spanner?".

Altri esempi

Il comando di base mostrato in Trasmettere in streaming una risposta è il comando più semplice senza opzioni specificate. Tuttavia, puoi applicare le stesse opzioni disponibili con il metodo answer, ad eccezione delle limitazioni elencate in questa pagina.

Le risposte in streaming possono essere utilizzate anche con le sessioni di follow-up.