Antworten streamen

Auf dieser Seite wird die Streaming-Antwortmethode vorgestellt.

Die Streaming-Antwortmethode bietet viele der Funktionen der Antwortmethode und zusätzlich eine weitere Funktion: Streaming. Wenn Sie eine Antwort streamen, wird die generierte Antwort in mehrere Teile aufgeteilt, die nacheinander gesendet werden.

Das Streaming von Antworten ist besonders nützlich, wenn die generierten Antworten lang sind und das Senden der gesamten Antwort auf einmal zu einer Verzögerung führt. Durch das Streamen von Antworten wird die Latenz verringert.

Beschränkungen

Die Streaming-Antwortmethode bietet dieselben Funktionen wie die Antwortmethode, mit folgenden Ausnahmen:

  • Die Anzahl der Schritte zum Umformulieren ist eins. Sie können die Umformulierung nicht deaktivieren und auch die maximale Anzahl von Schritten nicht ändern.

  • Nur Gemini-Modelle können mit der Streaming-Antwortmethode verwendet werden. Eine Liste der Modelle finden Sie unter Verfügbare Modelle.

Antwort streamen

Im folgenden Befehl wird gezeigt, wie die Methode streaming answer aufgerufen und eine generierte Antwort in Form einer Reihe von JSON-Antworten zurückgegeben wird. Normalerweise enthält jede Antwort einen Satz.

Bei diesem einfachen Befehl wird nur die erforderliche Eingabe angezeigt. Die Optionen bleiben auf den Standardwerten.

Beispiele für andere Optionen finden Sie unter Antworten und Nachfragen erhalten. Einige Antwortoptionen sind für das Streaming von Antworten nicht verfügbar. Weitere Informationen finden Sie in den Einschränkungen auf dieser Seite.

REST

So suchen Sie nach Ergebnissen mit einer gestreamten generierten Antwort:

  1. Führen Sie den folgenden curl-Befehl aus:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID: die ID Ihres Google Cloud Projekts.
    • APP_ID: Die ID der Vertex AI Search-App, die Sie abfragen möchten.
    • QUERY: Ein Freitextstring, der die Frage oder Suchanfrage enthält. Beispiel: „Welche Datenbank ist schneller, BigQuery oder Spanner?“

Weitere Beispiele

Der grundlegende Befehl unter Antwort streamen ist der einfachste Befehl ohne Optionen. Sie können jedoch dieselben Optionen wie bei der Methode answer anwenden, mit Ausnahme der auf dieser Seite aufgeführten Einschränkungen.

Streamingantworten können auch für Folgesitzungen verwendet werden.