Esta página descreve o que é o motor RAG da Vertex AI e como funciona.
| Descrição | Consola | 
|---|---|
| Para saber como usar o SDK Vertex AI para executar tarefas do motor RAG do Vertex AI, consulte o início rápido do RAG para Python. | 
Vista geral
O Vertex AI RAG Engine, um componente da plataforma Vertex AI, facilita a geração aumentada por recuperação (RAG). O Vertex AI RAG Engine também é uma framework de dados para desenvolver aplicações de grandes modelos de linguagem (GMLs) aumentados com contexto. O enriquecimento do contexto ocorre quando aplica um MDG aos seus dados. Isto implementa a geração melhorada de recuperação (RAG).
Um problema comum com os MDIs é que não compreendem o conhecimento privado, ou seja, os dados da sua organização. Com o motor RAG da Vertex AI, pode enriquecer o contexto do MDG com informações privadas adicionais, porque o modelo pode reduzir as alucinações e responder a perguntas com maior precisão.
Ao combinar origens de conhecimento adicionais com o conhecimento existente dos MDIs/CEs, é fornecido um contexto melhor. O contexto melhorado, juntamente com a consulta, melhora a qualidade da resposta do MDLI.
A imagem seguinte ilustra os principais conceitos para compreender o motor RAG da Vertex AI.

Estes conceitos estão listados pela ordem do processo de geração melhorada com base na obtenção (RAG).
- Carregamento de dados: receba dados de diferentes origens de dados. Por exemplo, ficheiros locais, o Cloud Storage e o Google Drive. 
- Transformação de dados: Conversão dos dados na preparação para a indexação. Por exemplo, os dados são divididos em partes. 
- Incorporação: representações numéricas de palavras ou fragmentos de texto. Estes números captam o significado semântico e o contexto do texto. As palavras ou o texto semelhantes ou relacionados tendem a ter incorporações semelhantes, o que significa que estão mais próximos no espaço vetorial de alta dimensão. 
- Indexação de dados: o Vertex AI RAG Engine cria um índice denominado corpus. O índice estrutura a base de conhecimentos para que seja otimizado para a pesquisa. Por exemplo, o índice é como uma tabela de conteúdos detalhada para um livro de referência enorme. 
- Obtenção: quando um utilizador faz uma pergunta ou fornece um comando, o componente de obtenção no Vertex AI RAG Engine pesquisa na respetiva base de conhecimentos para encontrar informações relevantes para a consulta. 
- Geração: as informações obtidas tornam-se o contexto adicionado à consulta original do utilizador como um guia para o modelo de IA generativa gerar respostas fundamentadas e relevantes. 
Regiões suportadas
O Vertex AI RAG Engine é suportado nas seguintes regiões:
| Região | Localização | Descrição | Fase de lançamento | 
|---|---|---|---|
| us-central1 | Iowa | As versões v1ev1beta1são suportadas. | Lista de autorizações | 
| us-east4 | Virgínia | As versões v1ev1beta1são suportadas. | DG | 
| europe-west3 | Frankfurt, Alemanha | As versões v1ev1beta1são suportadas. | DG | 
| europe-west4 | Eemshaven, Países Baixos | As versões v1ev1beta1são suportadas. | DG | 
- us-central1é alterado para- Allowlist. Se quiser fazer experiências com o motor RAG da Vertex AI, experimente outras regiões. Se planeia integrar o seu tráfego de produção no- us-central1, contacte- vertex-ai-rag-engine-support@google.com.
Elimine o Vertex AI RAG Engine
Os exemplos de código seguintes demonstram como eliminar um motor RAG da Vertex AI para a Google Cloud consola, Python e REST:
- Parâmetros da API versão 1 (v1) e exemplos de código. 
- Parâmetros da API v1beta1 e exemplos de código. 
Enviar feedback
Para conversar com o apoio técnico da Google, aceda ao grupo de apoio técnico do Vertex AI RAG Engine.
Para enviar um email, use o endereço de email
vertex-ai-rag-engine-support@google.com.
O que se segue?
- Para saber como usar o SDK Vertex AI para executar tarefas do Vertex AI RAG Engine, consulte o guia de início rápido do RAG para Python.
- Para saber mais sobre a fundamentação, consulte a vista geral da fundamentação.
- Para saber mais sobre as respostas da RAG, consulte o artigo Resultados de obtenção e geração do motor RAG da Vertex AI.
- Para saber mais sobre a arquitetura RAG: