Diffuser des réponses

Cette page présente la méthode de réponse en streaming.

La méthode de réponse en flux continu présente de nombreuses fonctionnalités identiques à la méthode answer, ainsi qu'une fonctionnalité supplémentaire : streaming. Lorsque vous diffusez une réponse, celle-ci est divisée en plusieurs parties qui sont envoyées séquentiellement.

L'affichage progressif des réponses est particulièrement utile si les réponses générées sont longues, car l'envoi de la réponse entière en une seule fois entraîne un délai. La diffusion en streaming des réponses réduit l'impression de latence.

Limites

La méthode de réponse en flux continu présente les mêmes caractéristiques que la méthode de réponse, à l'exception des suivantes :

  • Le nombre d'étapes de reformulation est de un. Vous ne pouvez pas désactiver la reformulation ni modifier le nombre maximal d'étapes.

  • Seuls les modèles Gemini peuvent être utilisés avec la méthode de réponse en streaming. Pour obtenir la liste des modèles, consultez Modèles disponibles.

Diffuser une réponse

La commande suivante montre comment appeler la méthode streaming answer et renvoyer une réponse générée sous la forme d'une série de réponses JSON. En règle générale, chaque réponse contient une phrase.

Cette commande de base n'affiche que les entrées requises. Les options sont laissées à leurs valeurs par défaut.

Pour obtenir des exemples d'autres options, consultez Obtenir des réponses et des informations complémentaires. Certaines options de réponse ne sont pas disponibles pour le streaming des réponses. Consultez les limitations sur cette page.

REST

Pour effectuer une recherche et obtenir des résultats avec une réponse générée en streaming :

  1. Exécutez la commande curl suivante :

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Remplacez les éléments suivants :

    • PROJECT_ID : ID de votre projet Google Cloud .
    • APP_ID : ID de l'application Vertex AI Search que vous souhaitez interroger.
    • QUERY : chaîne de texte libre contenant la question ou la requête de recherche. Par exemple, "Quelle base de données est la plus rapide, BigQuery ou Spanner ?".

Autres exemples

La commande de base présentée dans Diffuser une réponse en streaming est la commande la plus simple, sans aucune option spécifiée. Toutefois, vous pouvez appliquer les mêmes options que celles disponibles avec la méthode answer, à l'exception des limitations listées sur cette page.

Les réponses en streaming peuvent également être utilisées avec les sessions de suivi.