本页介绍了 Vertex AI RAG 引擎的含义及其运作方式。
概览
Vertex AI RAG Engine 是 Vertex AI Platform 的组成部分,有助于检索增强生成 (RAG)。Vertex AI RAG 引擎也是一个用于开发上下文增强型大语言模型 (LLM) 应用的数据框架。当您将 LLM 应用于数据时,上下文便会得到增强。这实现了检索增强生成 (RAG)。
LLM 的一个常见问题是,它们不理解私有知识,也就是您的组织的数据。借助 Vertex AI RAG Engine,您可以使用更多私密信息丰富 LLM 上下文,因为该模型可以减少幻觉并更准确地回答问题。
通过将更多知识来源与 LLM 所拥有的现有知识相结合,可以提供更好的上下文。改进的上下文与查询一起可提高 LLM 的回答质量。
下图展示了理解 Vertex AI RAG Engine 的关键概念。
这些概念按检索增强生成 (RAG) 过程的顺序列出。
数据注入:从不同数据源注入数据。例如,本地文件、Cloud Storage 和 Google 云端硬盘。
数据转换:转换数据以准备编入索引。例如,数据会拆分为多个分块。
嵌入:字词或文本片段的数值表示法。这些数字捕获了文本的语义含义和上下文。相似或相关的字词或文本往往具有类似的嵌入,这意味着它们在高维向量空间中彼此更靠近。
数据索引编制:Vertex AI RAG Engine 会创建一个称为语料库的索引。索引会对知识库进行结构化,以便进行搜索优化。例如,索引就像一本大型参考图书的详细目录。
检索:当用户提问或提供问题时,Vertex AI RAG 引擎中的检索组件会搜索其知识库,以查找与查询相关的信息。
生成:检索到的信息将成为添加到原始用户查询的上下文(作为生成式 AI 模型的指南),以生成确实有依据的相关响应。
支持的区域
Vertex AI RAG Engine 在以下区域受支持:
区域 | 位置 | 说明 | 发布阶段 |
---|---|---|---|
europe-west3 |
德国法兰克福 | 支持 v1 和 v1beta1 版本。 |
GA |
us-central1 |
爱荷华 | 支持 v1 和 v1beta1 版本。 |
GA |
提交反馈
如需与 Google 支持团队聊天,请前往 Vertex AI RAG 引擎支持团队。
如需发送电子邮件,请使用电子邮件地址 vertex-ai-rag-engine-support@google.com
。
后续步骤
- 如需了解如何使用 Vertex AI SDK 运行 Vertex AI RAG Engine 任务,请参阅 Python 版 RAG 快速入门。
- 如需了解接地,请参阅接地概览。
- 如需了解 RAG 和接地之间的区别,请参阅使用 RAG 将回答接地。
- 如需详细了解 RAG 的回答,请参阅 Vertex AI RAG Engine 的检索和生成输出。
- 如需了解 RAG 架构,请执行以下操作: