使用 RAG 将回答接地

接地是一种技术,可用于帮助生成更可信、更实用且更真实的模型回答。为生成式 AI 模型回答建立依据时,您需要将其与可验证的信息源相关联。如需实现接地,通常必须检索相关来源数据。建议的最佳实践是使用检索增强生成 (RAG) 技术。检索通常使用搜索引擎完成,该引擎使用嵌入了源文本语义的索引。

还有一些服务和组件 API 可实现 RAG 生命周期,例如 Vertex AI Search Builder API,可用于混搭构建。通过混搭构建,您可以使用以下任意服务或 API 实现 RAG 解决方案:

  • 有事实依据的生成 API:您可以使用此 API 实现有事实依据的生成,也可以将其与检索提供程序相关联,以实现完整的 RAG 生命周期。
  • 文档布局解析器:此解析器集成了 Document AI 和 Gemini 在文档理解方面的优势。如需详细了解布局解析器,请参阅使用布局解析器
  • Vertex AI Vector Search:此搜索服务性能出色,并使用高质量的向量数据库。
  • Check Grounding API:此 API 会将 RAG 输出与检索到的事实进行比较,并有助于确保所有陈述都经过事实依据验证,然后再向用户返回回答。

使用 Vertex AI RAG Engine 将回答接地

如需使用 Vertex AI RAG Engine 来接地回答,您必须创建提示。执行以下操作:

  1. 在 Google Cloud 控制台中,使用 Vertex AI Studio 前往创建提示页面。

    前往“创建提示”

  2. 选择接地:自有数据

  3. 选择 RAG 引擎依据来源。

  4. 语料库列表中,选择您的语料库名称。

  5. Top-K 相似度字段中,选择默认值 20

  6. 点击保存

后续步骤