Mostrar as respostas

Esta página apresenta o método de resposta de streaming.

O método de resposta de streaming tem muitos dos mesmos recursos do método resposta, além de um recurso extra: streaming. Quando você transmite uma resposta, a resposta gerada é dividida em várias partes que são enviadas em sequência.

O streaming de respostas é particularmente útil se as respostas geradas forem longas, de modo que o envio de toda a resposta de uma só vez cause um atraso. A transmissão de respostas reduz a aparência de latência.

Limitações

O método de resposta de streaming tem os mesmos recursos do método de resposta, com as seguintes exceções:

  • O número de etapas de reformulação é uma. Não é possível desativar a reformulação nem mudar o número máximo de etapas.

  • Somente os modelos do Gemini podem ser usados com o método de resposta de streaming. Para conferir uma lista de modelos, consulte Modelos disponíveis.

Mostrar uma resposta

O comando a seguir mostra como chamar o método resposta de streaming e retornar uma resposta gerada na forma de uma série de respostas JSON. Normalmente, cada resposta contém uma frase da resposta.

Esse comando básico mostra apenas a entrada necessária. As opções são deixadas com os valores padrão.

Para conferir exemplos de outras opções, consulte Receber respostas e fazer acompanhamentos. Algumas opções de resposta não estão disponíveis para streaming de respostas. Consulte as limitações nesta página.

REST

Para pesquisar e receber resultados com uma resposta gerada transmitida, faça o seguinte:

  1. Execute o seguinte comando curl:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Substitua:

    • PROJECT_ID: o ID do projeto Google Cloud .
    • APP_ID: o ID do app da Vertex AI para Pesquisa que você quer consultar.
    • QUERY: uma string de texto livre que contém a pergunta ou consulta de pesquisa. Por exemplo, "Qual banco de dados é mais rápido, o BigQuery ou o Spanner?".

Outros exemplos

O comando básico mostrado em Transmitir uma resposta é o comando mais simples, sem opções especificadas. No entanto, é possível aplicar as mesmas opções disponíveis com o método answer, com exceção das limitações listadas nesta página.

As respostas em streaming também podem ser usadas com sessões de acompanhamento.