Antworten streamen

Auf dieser Seite wird die Methode für Streamingantworten vorgestellt.

Die Methode für Streamingantworten hat viele der gleichen Funktionen wie die Methode answer, aber eine zusätzliche Funktion: Streaming. Wenn Sie eine Antwort streamen, wird die generierte Antwort in mehrere Teile unterteilt, die nacheinander gesendet werden.

Das Streamen von Antworten ist besonders nützlich, wenn die generierten Antworten lang sind und das Senden der gesamten Antwort auf einmal zu einer Verzögerung führen würde. Durch das Streamen von Antworten wird die wahrgenommene Latenz reduziert.

Beschränkungen

Die Methode für Streaming-Antworten hat dieselben Funktionen wie die Methode für Antworten, mit den folgenden Ausnahmen:

  • Die Anzahl der Umformulierungsschritte ist eins. Sie können das Umformulieren nicht deaktivieren und auch die maximale Anzahl von Schritten nicht ändern.

  • Nur Gemini-Modelle können mit der Streaming-Antwortmethode verwendet werden. Eine Liste der Modelle finden Sie unter Verfügbare Modelle.

Antwort streamen

Der folgende Befehl zeigt, wie Sie die Methode streamingAnswer aufrufen und eine generierte Antwort in Form einer Reihe von JSON-Antworten zurückgeben. Normalerweise enthält jede Antwort einen Satz der Antwort.

Dieser einfache Befehl zeigt nur die erforderliche Eingabe. Die Optionen werden mit den Standardwerten belassen.

Beispiele für andere Optionen finden Sie unter Antworten und Follow-ups erhalten. Einige Antwortoptionen sind für das Streaming von Antworten nicht verfügbar. Weitere Informationen finden Sie auf dieser Seite unter Einschränkungen.

REST

So suchen Sie und erhalten Ergebnisse mit einer gestreamten generierten Antwort:

  1. Führen Sie den folgenden curl-Befehl aus:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID: die ID Ihres Google Cloud Projekts.
    • APP_ID: Die ID der Vertex AI Search-App, die Sie abfragen möchten.
    • QUERY: Ein Freitextstring, der die Frage oder Suchanfrage enthält. Beispiel: „Welche Datenbank ist schneller, BigQuery oder Spanner?“

Weitere Beispiele

Der in Antwort streamen gezeigte einfache Befehl ist der einfachste Befehl ohne angegebene Optionen. Sie können jedoch dieselben Optionen wie bei der Methode answer verwenden, mit Ausnahme der auf dieser Seite aufgeführten Einschränkungen.

Streaming-Antworten können auch mit Follow-up-Sitzungen verwendet werden.