Vista geral do Vertex AI RAG Engine

Esta página descreve o que é o motor RAG da Vertex AI e como funciona.

Descrição Consola
Para saber como usar o SDK Vertex AI para executar tarefas do motor RAG do Vertex AI, consulte o início rápido do RAG para Python.

Experimente o Vertex AI RAG Engine

Vista geral

O Vertex AI RAG Engine, um componente da plataforma Vertex AI, facilita a geração aumentada por recuperação (RAG). O Vertex AI RAG Engine também é uma framework de dados para desenvolver aplicações de grandes modelos de linguagem (GMLs) aumentados com contexto. O enriquecimento do contexto ocorre quando aplica um MDG aos seus dados. Isto implementa a geração melhorada de recuperação (RAG).

Um problema comum com os MDIs é que não compreendem o conhecimento privado, ou seja, os dados da sua organização. Com o motor RAG da Vertex AI, pode enriquecer o contexto do MDG com informações privadas adicionais, porque o modelo pode reduzir as alucinações e responder a perguntas com maior precisão.

Ao combinar origens de conhecimento adicionais com o conhecimento existente dos MDIs/CEs, é fornecido um contexto melhor. O contexto melhorado, juntamente com a consulta, melhora a qualidade da resposta do MDLI.

A imagem seguinte ilustra os principais conceitos para compreender o motor RAG da Vertex AI.

Principais conceitos da RAG do Vertex AI

Estes conceitos estão listados pela ordem do processo de geração melhorada com base na obtenção (RAG).

  1. Carregamento de dados: receba dados de diferentes origens de dados. Por exemplo, ficheiros locais, o Cloud Storage e o Google Drive.

  2. Transformação de dados: Conversão dos dados na preparação para a indexação. Por exemplo, os dados são divididos em partes.

  3. Incorporação: representações numéricas de palavras ou fragmentos de texto. Estes números captam o significado semântico e o contexto do texto. As palavras ou o texto semelhantes ou relacionados tendem a ter incorporações semelhantes, o que significa que estão mais próximos no espaço vetorial de alta dimensão.

  4. Indexação de dados: o Vertex AI RAG Engine cria um índice denominado corpus. O índice estrutura a base de conhecimentos para que seja otimizado para a pesquisa. Por exemplo, o índice é como uma tabela de conteúdos detalhada para um livro de referência enorme.

  5. Obtenção: quando um utilizador faz uma pergunta ou fornece um comando, o componente de obtenção no Vertex AI RAG Engine pesquisa na respetiva base de conhecimentos para encontrar informações relevantes para a consulta.

  6. Geração: as informações obtidas tornam-se o contexto adicionado à consulta original do utilizador como um guia para o modelo de IA generativa gerar respostas fundamentadas e relevantes.

Regiões suportadas

O Vertex AI RAG Engine é suportado nas seguintes regiões:

Região Localização Descrição Fase de lançamento
us-central1 Iowa As versões v1 e v1beta1 são suportadas. Lista de autorizações
us-east4 Virgínia As versões v1 e v1beta1 são suportadas. DG
europe-west3 Frankfurt, Alemanha As versões v1 e v1beta1 são suportadas. DG
europe-west4 Eemshaven, Países Baixos As versões v1 e v1beta1 são suportadas. DG
  • us-central1 é alterado para Allowlist. Se quiser fazer experiências com o motor RAG da Vertex AI, experimente outras regiões. Se planeia integrar o seu tráfego de produção no us-central1, contacte vertex-ai-rag-engine-support@google.com.

Elimine o Vertex AI RAG Engine

Os exemplos de código seguintes demonstram como eliminar um motor RAG da Vertex AI para a Google Cloud consola, Python e REST:

Enviar feedback

Para conversar com o apoio técnico da Google, aceda ao grupo de apoio técnico do Vertex AI RAG Engine.

Para enviar um email, use o endereço de email vertex-ai-rag-engine-support@google.com.

O que se segue?