Informações gerais sobre o mecanismo de RAG da Vertex AI

O mecanismo RAG da Vertex AI, um componente da plataforma Vertex AI, facilita a geração aumentada de recuperação (RAG, na sigla em inglês). O mecanismo RAG da Vertex AI também é um framework de dados para desenvolver aplicativos de modelo de linguagem grande (LLM) aumentados por contexto. A ampliação de contexto ocorre quando você aplica um LLM aos seus dados. Isso implementa a geração de recuperação aumentada (RAG, na sigla em inglês).

Um problema comum com os LLMs é que eles não entendem o conhecimento particular, ou seja, os dados da sua organização. Com o mecanismo de RAG da Vertex AI, é possível enriquecer o contexto do LLM com mais informações particulares, porque o modelo pode reduzir a alucinação artificial e responder a perguntas com mais precisão.

Ao combinar outras fontes de conhecimento com o conhecimento atual que os LLMs têm, um contexto melhor é fornecido. O contexto aprimorado com a consulta melhora a qualidade da resposta do LLM.

A imagem a seguir ilustra os principais conceitos para entender o Vertex AI RAG Engine.

Conceitos principais da RAG da Vertex AI

Esses conceitos são listados na ordem do processo de geração aumentada por recuperação (RAG, na sigla em inglês).

  1. Ingestão de dados: receba dados de diferentes fontes. Por exemplo, arquivos locais, Cloud Storage e Google Drive.

  2. Transformação de dados: conversão dos dados na preparação para indexação. Por exemplo, os dados são divididos em partes.

  3. Embedding: representações numéricas de palavras ou partes de texto. Esses números captam o significado semântico e o contexto do texto. Palavras ou textos semelhantes ou relacionados costumam ter embeddings semelhantes, o que significa que estão mais próximos no espaço vetorial de alta dimensão.

  4. Indexação de dados: o mecanismo RAG da Vertex AI cria um índice chamado corpus. O índice estrutura a base de conhecimento para que seja otimizado para pesquisa. Por exemplo, o índice é como um índice detalhado de um grande livro de referência.

  5. Recuperação: quando um usuário faz uma pergunta ou fornece uma solicitação, o componente de recuperação no mecanismo de RAG da Vertex AI pesquisa na base de conhecimento para encontrar informações relevantes para a consulta.

  6. Geração: as informações recuperadas se tornam o contexto adicionado à consulta do usuário original como um guia para que o modelo de IA generativa gere respostas factuais baseadas e relevantes.

Regiões compatíveis

O Vertex AI RAG Engine tem suporte nas seguintes regiões:

Região Local Descrição Etapa do lançamento
europe-west3 Frankfurt, Alemanha As versões v1 e v1beta1 são compatíveis. GA
us-central1 Iowa As versões v1 e v1beta1 são compatíveis. GA

A seguir