建立依据概览

在生成式 AI 中,建立依据是指将模型输出连接到可验证的信息源的能力。如果您向模型提供访问特定数据源的权限,则建立依据可以将其输出仅限于这些数据范围,从而降低内容创造的可能性。在准确率和可靠性非常重要的情况下,这一点尤为重要。

建立依据功能具有以下优势:

  • 减少模型误区,即模型生成不真实内容的情况。
  • 将模型响应固定到特定信息。
  • 提高生成内容的可信度和适用性。

在 Vertex AI 中,您可以通过两种主要方式为受支持的模型输出建立依据:

使用 Google 搜索建立依据

使用“使用 Google 搜索建立依据”时,它会将 Google 模型连接到互联网。由于没有建立依据的生成式 AI 模型的回答会根据学习的模式被视为新内容,因此您不会获得特定于时间的真实回答,例如在提示中询问天气预报情况。由于通过互联网,您可以访问现有信息和新信息,因此,一个有依据的提示可以为您提供细致且具体的提示回答,几乎没有错误,并引用来源。

以下示例比较了无依据的提示回答和有依据的回答:

无依据的 Gemini 使用 Google 搜索建立依据
提示:401k 缴款限额是多少?
回答:2023 年,401(k) 计划的年度缴款限额为 22,500 美元,高于 2022 年的 20,500 美元。50 周岁及以上的个人补充缴款仍为 7,500 美元。
提示:401k 缴款限额是多少?
回答:以下介绍了 2024 年的 401(k) 缴款限额: 2024 年员工缴款的基本限额为 23,000 美元。高于 2023 年的 22,500 美元。如果您已年满 50 周岁,还可以在补充缴款中额外缴纳 7,500 美元。

使用“使用 Google 搜索建立依据”时,您必须在生产环境和应用中显示搜索建议。如需了解使用“依托 Google 搜索进行接地”时的要求,请参阅搜索建议

下图说明了如何将“使用 Google 搜索建立依据”用于 Gemini API: 建立依据概览

使用您自己的数据建立依据

您可以通过将 Vertex AI Search 用作数据存储区,使用自己的文本数据为语言模型建立依据。借助 Vertex AI Search,您可以集成自己的数据(无论格式如何),以优化模型输出。支持的数据类型包括:

  • 网站数据:直接使用您网站上的内容。
  • 非结构化数据:使用未格式化的原始数据。

当您使用特定数据建立根据后,模型可以在其训练数据之外执行更多任务。 通过链接到 Vertex AI Search 中的指定数据存储区,有依据的模型可以生成更准确、更相关的回答,以及与您的应用场景直接相关的回答。

以下示例比较了无依据的提示回答和有专用依据的回答:

无依据的 Gemini 有专用依据的 Gemini
提示:我公司的 PTO 政策是什么?

回答:我无法明确回答有关贵公司的具体 PTO 政策的问题。PTO 政策由各个公司制定,可能会因贵公司的规模、位置和行业而异。
提示:我公司的 PTO 政策是什么?

回答:贵公司采用不受限制的 PTO 政策。仍需要批准:您的经理必须根据工作负载、覆盖范围和公司需求批准或拒绝请求。

后续步骤