Esta página descreve o que é o motor RAG da Vertex AI e como funciona.
Descrição | Consola |
---|---|
Para saber como usar o SDK Vertex AI para executar tarefas do motor RAG do Vertex AI, consulte o início rápido do RAG para Python. |
Vista geral
O Vertex AI RAG Engine, um componente da plataforma Vertex AI, facilita a geração aumentada por recuperação (RAG). O Vertex AI RAG Engine também é uma framework de dados para desenvolver aplicações de grandes modelos de linguagem (GMLs) aumentados com contexto. O enriquecimento do contexto ocorre quando aplica um MDG aos seus dados. Isto implementa a geração melhorada de recuperação (RAG).
Um problema comum com os MDIs é que não compreendem o conhecimento privado, ou seja, os dados da sua organização. Com o motor RAG da Vertex AI, pode enriquecer o contexto do MDG com informações privadas adicionais, porque o modelo pode reduzir as alucinações e responder a perguntas com maior precisão.
Ao combinar origens de conhecimento adicionais com o conhecimento existente dos MDIs/CEs, é fornecido um contexto melhor. O contexto melhorado, juntamente com a consulta, melhora a qualidade da resposta do MDLI.
A imagem seguinte ilustra os principais conceitos para compreender o motor RAG da Vertex AI.
Estes conceitos estão listados pela ordem do processo de geração melhorada com base na obtenção (RAG).
Carregamento de dados: receba dados de diferentes origens de dados. Por exemplo, ficheiros locais, o Cloud Storage e o Google Drive.
Transformação de dados: Conversão dos dados na preparação para a indexação. Por exemplo, os dados são divididos em partes.
Incorporação: representações numéricas de palavras ou fragmentos de texto. Estes números captam o significado semântico e o contexto do texto. As palavras ou o texto semelhantes ou relacionados tendem a ter incorporações semelhantes, o que significa que estão mais próximos no espaço vetorial de alta dimensão.
Indexação de dados: o Vertex AI RAG Engine cria um índice denominado corpus. O índice estrutura a base de conhecimentos para que seja otimizado para a pesquisa. Por exemplo, o índice é como uma tabela de conteúdos detalhada para um livro de referência enorme.
Obtenção: quando um utilizador faz uma pergunta ou fornece um comando, o componente de obtenção no Vertex AI RAG Engine pesquisa na respetiva base de conhecimentos para encontrar informações relevantes para a consulta.
Geração: as informações obtidas tornam-se o contexto adicionado à consulta original do utilizador como um guia para o modelo de IA generativa gerar respostas fundamentadas e relevantes.
Regiões suportadas
O Vertex AI RAG Engine é suportado nas seguintes regiões:
Região | Localização | Descrição | Fase de lançamento |
---|---|---|---|
us-central1 |
Iowa | As versões v1 e v1beta1 são suportadas. |
Lista de autorizações |
us-east4 |
Virgínia | As versões v1 e v1beta1 são suportadas. |
DG |
europe-west3 |
Frankfurt, Alemanha | As versões v1 e v1beta1 são suportadas. |
DG |
europe-west4 |
Eemshaven, Países Baixos | As versões v1 e v1beta1 são suportadas. |
DG |
us-central1
é alterado paraAllowlist
. Se quiser fazer experiências com o motor RAG da Vertex AI, experimente outras regiões. Se planeia integrar o seu tráfego de produção nous-central1
, contactevertex-ai-rag-engine-support@google.com
.
Elimine o Vertex AI RAG Engine
Os exemplos de código seguintes demonstram como eliminar um motor RAG da Vertex AI para a Google Cloud consola, Python e REST:
Parâmetros da API versão 1 (v1) e exemplos de código.
Parâmetros da API v1beta1 e exemplos de código.
Enviar feedback
Para conversar com o apoio técnico da Google, aceda ao grupo de apoio técnico do Vertex AI RAG Engine.
Para enviar um email, use o endereço de email
vertex-ai-rag-engine-support@google.com
.
O que se segue?
- Para saber como usar o SDK Vertex AI para executar tarefas do Vertex AI RAG Engine, consulte o guia de início rápido do RAG para Python.
- Para saber mais sobre a fundamentação, consulte a vista geral da fundamentação.
- Para saber mais sobre as respostas da RAG, consulte o artigo Resultados de obtenção e geração do motor RAG da Vertex AI.
- Para saber mais sobre a arquitetura RAG: