Diffuser des réponses

Cette page présente la méthode de réponse en streaming.

La méthode de réponse en streaming présente de nombreuses fonctionnalités similaires à celles de la méthode answer, avec une fonctionnalité supplémentaire: le streaming. Lorsque vous diffusez une réponse, la réponse générée est divisée en plusieurs parties qui sont envoyées dans l'ordre.

Le streaming des réponses est particulièrement utile si les réponses générées sont longues, car l'envoi de l'intégralité de la réponse en une seule fois entraîne un retard. Le streaming des réponses réduit l'apparence de la latence.

Limites

La méthode de réponse en streaming présente les mêmes fonctionnalités que la méthode de réponse, à l'exception des éléments suivants:

  • Le nombre d'étapes de reformulation est de 1. Vous ne pouvez pas désactiver la reformulation ni modifier le nombre maximal d'étapes.

  • Seuls les modèles Gemini peuvent être utilisés avec la méthode de réponse en streaming. Pour obtenir la liste des modèles, consultez la section Modèles disponibles.

Diffuser une réponse

La commande suivante montre comment appeler la méthode streaming answer (Réponse en streaming) et renvoyer une réponse générée sous la forme d'une série de réponses JSON. En règle générale, chaque réponse contient une phrase.

Cette commande de base n'affiche que les entrées requises. Les options sont conservées par défaut.

Pour obtenir des exemples d'autres options, consultez Obtenir des réponses et des relances. Certaines propositions de réponse ne sont pas disponibles pour la diffusion des réponses. Consultez les limitations sur cette page.

REST

Pour effectuer une recherche et obtenir des résultats avec une réponse générée en streaming, procédez comme suit:

  1. Exécutez la commande curl suivante:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Remplacez les éléments suivants :

    • PROJECT_ID: ID de votre Google Cloud projet.
    • APP_ID: ID de l'application Vertex AI Search que vous souhaitez interroger.
    • QUERY: chaîne de texte libre contenant la question ou la requête de recherche. Par exemple, "Quelle base de données est plus rapide, BigQuery ou Spanner ?".

Autres exemples

La commande de base affichée dans Diffuser une réponse est la commande la plus simple, sans options spécifiées. Toutefois, vous pouvez appliquer les mêmes options disponibles avec la méthode answer, à l'exception des limites indiquées sur cette page.

Les réponses en streaming peuvent également être utilisées avec les sessions de suivi.