Mostrare gradualmente le risposte

Questa pagina introduce il metodo di risposta in streaming.

Il metodo di risposta con streaming ha molte delle stesse funzionalità del metodo risposta, oltre a una funzionalità aggiuntiva: lo streaming. Quando scorri una risposta, la risposta generata viene suddivisa in più parti che vengono inviate in sequenza.

Le risposte dinamiche sono particolarmente utili se le risposte generate sono lunghe, quindi l'invio dell'intera risposta contemporaneamente causa un ritardo. Le risposte in streaming riducono la percezione della latenza.

Limitazioni

Il metodo di risposta in streaming ha le stesse funzionalità del metodo di risposta, con le seguenti eccezioni:

  • La risposta in streaming è supportata solo per l'inglese.

  • Il numero di passaggi di riformulazione è uno. Non puoi disattivare la riformulazione né modificare il numero massimo di passaggi.

  • Non puoi ottenere punteggi di fondatezza per le risposte in streaming e non puoi scegliere di rispondere solo con risposte ben fondate.

  • Solo i modelli Gemini possono essere utilizzati con il metodo di risposta in streaming. Per un elenco dei modelli, vedi Modelli disponibili.

Visualizzare una risposta in streaming

Il seguente comando mostra come chiamare il metodo streaming answer e restituire una risposta generata sotto forma di una serie di risposte JSON. In genere, ogni risposta contiene una frase della risposta.

Questo comando di base mostra solo l'input richiesto. Le opzioni rimangono predefinite.

Per esempi di altre opzioni, consulta Ricevere risposte e follow-up. Alcune opzioni di risposta non sono disponibili per lo streaming delle risposte. Consulta le limitazioni riportate in questa pagina.

REST

Per eseguire ricerche e ottenere risultati con una risposta generata in streaming:

  1. Esegui il seguente comando curl:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del tuo progetto Google Cloud.
    • APP_ID: l'ID dell'app Vertex AI Search su cui vuoi eseguire una query.
    • QUERY: una stringa di testo libero contenente la domanda o la query di ricerca. Ad esempio, "Quale database è più veloce, BigQuery o Spanner?".

Altri esempi

Il comando di base mostrato in Trasmettere in streaming una risposta è il comando più semplice senza opzioni specificate. Tuttavia, puoi applicare le stesse opzioni disponibili con il metodo answer, ad eccezione delle limitazioni elencate in questa pagina.

Le risposte in streaming possono essere utilizzate anche con le sessioni di follow-up.