逐字逐句给出回答

本页介绍了流式回答方法。

流式回答方法具有与 answer 方法相同的许多功能,此外还提供一项额外的功能:流式传输。当您以流式传输方式获取回答时,生成的回答会被分成多个部分,并按顺序发送。

如果生成的回答很长,一次性发送整个回答会导致延迟,因此流式回答特别有用。流式传输回答可减少延迟感。

限制

流式回答方法与回答方法具有相同的功能,但有以下例外情况:

  • 重新措辞的步骤数为 1。您无法停用重述功能,也无法更改步骤数上限。

  • 只有 Gemini 模型才能与流式回答方法搭配使用。 如需查看模型列表,请参阅可用模型

逐字逐句给出回答

以下命令展示了如何调用 streaming answer 方法,并以一系列 JSON 响应的形式返回生成的答案。通常,每个回答都包含一句答案。

此基本命令仅显示必需的输入内容。选项保留为默认值。

如需查看其他选项的示例,请参阅获取回答和后续问题。部分回答选项不适用于回答流式传输;请参阅本页面中的限制

REST

如需搜索并获取包含流式生成的答案的结果,请执行以下操作:

  1. 运行以下 curl 命令:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    替换以下内容:

    • PROJECT_ID:您的 Google Cloud 项目的 ID。
    • APP_ID:要查询的 Vertex AI Search 应用的 ID。
    • QUERY:包含问题或搜索查询的自由文本字符串。例如,“哪个数据库更快,是 BigQuery 还是 Spanner?”。

其他示例

以流式传输方式回答问题中显示的基本命令是最简单的命令,未指定任何选项。不过,您可以应用与 answer 方法相同的选项,但需遵守此页面上列出的限制

流式回答还可以与后续会话搭配使用。