逐字逐句给出回答

本页介绍了流式回答方法。

流式回答方法与回答方法具有许多相同的功能,但多了一个功能:流式。在流式传输答案时,系统会将生成的答案拆分为多个部分,并按顺序发送。

如果生成的回答很长,一次发送整个回答会导致延迟,那么流式传输回答特别有用。流式传输回答可减少延迟时间。

限制

流式回答方法与回答方法具有相同的功能,但存在以下例外情况:

  • 重述步骤数为 1。您无法停用重述功能,也无法更改步骤数上限。

  • 只有 Gemini 模型才能与流式回答方法搭配使用。如需查看模型列表,请参阅可用模型

逐字逐句给出回答

以下命令展示了如何调用流式回答方法,并以一系列 JSON 响应的形式返回生成的回答。通常,每个回答都包含一个回答句子。

此基本命令仅显示必需的输入。将选项保留为默认值。

如需查看其他选项的示例,请参阅获取回答和后续跟进。部分答案选项不支持答案流式传输;请参阅本页中的限制

REST

如需搜索并获取包含逐字逐句生成的答案的结果,请执行以下操作:

  1. 运行以下 curl 命令:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    替换以下内容:

    • PROJECT_ID:您的 Google Cloud 项目的 ID。
    • APP_ID:您要查询的 Vertex AI Search 应用的 ID。
    • QUERY:包含问题或搜索查询的自由文本字符串。例如,“哪个数据库更快,BigQuery 还是 Spanner?”

其他示例

流式传输回答中显示的基本命令是最简单的命令,没有指定任何选项。不过,您可以应用与 answer 方法相同的选项,但本页面列出的限制除外。

流式传输答案还可与后续会话搭配使用。