Cómo mostrar respuestas

En esta página, se presenta el método de respuesta de transmisión.

El método de respuesta de transmisión tiene muchas de las mismas funciones que el método answer, además de una función adicional: transmisión. Cuando transmites una respuesta, la respuesta generada se divide en varias partes que se envían en secuencia.

Las respuestas de transmisión continua son especialmente útiles si las respuestas generadas son largas, de modo que enviar la respuesta completa de una sola vez causa una demora. La transmisión de respuestas reduce la apariencia de latencia.

Limitaciones

El método de respuesta de transmisión tiene las mismas características que el método de respuesta, con las siguientes excepciones:

  • La cantidad de pasos de reformulación es uno. No puedes inhabilitar la función de reformulación ni cambiar la cantidad máxima de pasos.

  • Solo se pueden usar modelos de Gemini con el método de respuesta de transmisión. Para obtener una lista de los modelos, consulta Modelos disponibles.

Cómo transmitir una respuesta

El siguiente comando muestra cómo llamar al método streamingAnswer y devolver una respuesta generada en forma de una serie de respuestas JSON. Por lo general, cada respuesta contiene una oración de la respuesta.

Este comando básico solo muestra la entrada requerida. Las opciones se dejan con sus valores predeterminados.

Para ver ejemplos de otras opciones, consulta Obtén respuestas y seguimientos. Algunas opciones de respuesta no están disponibles para la transmisión de respuestas. Consulta las limitaciones en esta página.

REST

Para buscar y obtener resultados con una respuesta generada transmitida, haz lo siguiente:

  1. Ejecuta el siguiente comando de curl:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Reemplaza lo siguiente:

    • PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
    • APP_ID: Es el ID de la app de Vertex AI Search que deseas consultar.
    • QUERY: Es una cadena de texto libre que contiene la pregunta o la búsqueda. Por ejemplo, "¿Qué base de datos es más rápida, BigQuery o Spanner?".

Otros ejemplos

El comando básico que se muestra en Transmite una respuesta es el más simple y no tiene opciones especificadas. Sin embargo, puedes aplicar las mismas opciones disponibles con el método answer, con la excepción de las limitaciones que se indican en esta página.

Las respuestas de transmisión también se pueden usar con sesiones de seguimiento.