Respuestas graduales

En esta página se presenta el método de respuesta de streaming.

El método de respuesta de streaming tiene muchas de las mismas funciones que el método answer, además de una función adicional: streaming. Cuando transmites una respuesta, esta se divide en varias partes que se envían en secuencia.

Las respuestas graduales son especialmente útiles si las respuestas generadas son largas, de modo que el envío de la respuesta completa de una vez provoca un retraso. Las respuestas de streaming reducen la latencia.

Limitaciones

El método de respuesta de streaming tiene las mismas funciones que el método de respuesta, con las siguientes excepciones:

  • El número de pasos de reformulación es uno. No puedes inhabilitar la reformulación ni cambiar el número máximo de pasos.

  • Solo se pueden usar modelos de Gemini con el método de respuesta en streaming. Para ver una lista de modelos, consulta Modelos disponibles.

Transmitir una respuesta

El siguiente comando muestra cómo llamar al método streamingAnswer y devolver una respuesta generada en forma de una serie de respuestas JSON. Normalmente, cada respuesta contiene una frase de la respuesta.

Este comando básico solo muestra la entrada necesaria. Las opciones se dejan con sus valores predeterminados.

Para ver ejemplos de otras opciones, consulta Obtener respuestas y hacer un seguimiento. Algunas opciones de respuesta no están disponibles para la transmisión de respuestas. Consulta las limitaciones de esta página.

REST

Para buscar y obtener resultados con una respuesta generada en streaming, haz lo siguiente:

  1. Ejecuta el siguiente comando curl:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Haz los cambios siguientes:

    • PROJECT_ID: el ID de tu proyecto de Google Cloud .
    • APP_ID: el ID de la aplicación de Vertex AI Search que quieres consultar.
    • QUERY: una cadena de texto libre que contiene la pregunta o la consulta de búsqueda. Por ejemplo, "¿Qué base de datos es más rápida, BigQuery o Spanner?".

Otros ejemplos

El comando básico que se muestra en Enviar una respuesta es el más sencillo y no tiene opciones especificadas. Sin embargo, puedes aplicar las mismas opciones que con el método answer, excepto las limitaciones que se indican en esta página.

Las respuestas de streaming también se pueden usar con sesiones de seguimiento.