A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estão disponíveis em projetos que não tenham usado estes modelos anteriormente, incluindo novos projetos. Para ver detalhes, consulte o artigo Versões e ciclo de vida dos modelos.

Esta página foi traduzida pela API Cloud Translation.

Vista geral do Vertex AI RAG Engine

Esta página descreve o que é o motor RAG da Vertex AI e como funciona.

Descrição	Consola
Para saber como usar o SDK Vertex AI para executar tarefas do motor RAG do Vertex AI, consulte o início rápido do RAG para Python.	Experimente o Vertex AI RAG Engine

Vista geral

O Vertex AI RAG Engine, um componente da plataforma Vertex AI, facilita a geração aumentada por recuperação (RAG). O Vertex AI RAG Engine também é uma framework de dados para desenvolver aplicações de grandes modelos de linguagem (GMLs) aumentados com contexto. O enriquecimento do contexto ocorre quando aplica um MDG aos seus dados. Isto implementa a geração melhorada de recuperação (RAG).

Um problema comum com os MDIs é que não compreendem o conhecimento privado, ou seja, os dados da sua organização. Com o motor RAG da Vertex AI, pode enriquecer o contexto do MDG com informações privadas adicionais, porque o modelo pode reduzir as alucinações e responder a perguntas com maior precisão.

Ao combinar origens de conhecimento adicionais com o conhecimento existente dos MDIs/CEs, é fornecido um contexto melhor. O contexto melhorado, juntamente com a consulta, melhora a qualidade da resposta do MDLI.

A imagem seguinte ilustra os principais conceitos para compreender o motor RAG da Vertex AI.

Principais conceitos da RAG do Vertex AI

Estes conceitos estão listados pela ordem do processo de geração melhorada com base na obtenção (RAG).

Carregamento de dados: receba dados de diferentes origens de dados. Por exemplo, ficheiros locais, o Cloud Storage e o Google Drive.
Transformação de dados: Conversão dos dados na preparação para a indexação. Por exemplo, os dados são divididos em partes.
Incorporação: representações numéricas de palavras ou fragmentos de texto. Estes números captam o significado semântico e o contexto do texto. As palavras ou o texto semelhantes ou relacionados tendem a ter incorporações semelhantes, o que significa que estão mais próximos no espaço vetorial de alta dimensão.
Indexação de dados: o Vertex AI RAG Engine cria um índice denominado corpus. O índice estrutura a base de conhecimentos para que seja otimizado para a pesquisa. Por exemplo, o índice é como uma tabela de conteúdos detalhada para um livro de referência enorme.
Obtenção: quando um utilizador faz uma pergunta ou fornece um comando, o componente de obtenção no Vertex AI RAG Engine pesquisa na respetiva base de conhecimentos para encontrar informações relevantes para a consulta.
Geração: as informações obtidas tornam-se o contexto adicionado à consulta original do utilizador como um guia para o modelo de IA generativa gerar respostas fundamentadas e relevantes.

Regiões suportadas

O Vertex AI RAG Engine é suportado nas seguintes regiões:

Região	Localização	Descrição	Fase de lançamento
`us-central1`	Iowa	As versões `v1` e `v1beta1` são suportadas.	Lista de autorizações
`us-east4`	Virgínia	As versões `v1` e `v1beta1` são suportadas.	DG
`europe-west3`	Frankfurt, Alemanha	As versões `v1` e `v1beta1` são suportadas.	DG
`europe-west4`	Eemshaven, Países Baixos	As versões `v1` e `v1beta1` são suportadas.	DG

us-central1 é alterado para Allowlist. Se quiser fazer experiências com o motor RAG da Vertex AI, experimente outras regiões. Se planeia integrar o seu tráfego de produção no us-central1, contacte vertex-ai-rag-engine-support@google.com.

Elimine o Vertex AI RAG Engine

Os exemplos de código seguintes demonstram como eliminar um motor RAG da Vertex AI para a Google Cloud consola, Python e REST:

Parâmetros da API versão 1 (v1) e exemplos de código.
Parâmetros da API v1beta1 e exemplos de código.

Enviar feedback

Para conversar com o apoio técnico da Google, aceda ao grupo de apoio técnico do Vertex AI RAG Engine.

Para enviar um email, use o endereço de email vertex-ai-rag-engine-support@google.com.

O que se segue?

Para saber como usar o SDK Vertex AI para executar tarefas do Vertex AI RAG Engine, consulte o guia de início rápido do RAG para Python.
Para saber mais sobre a fundamentação, consulte a vista geral da fundamentação.
Para saber mais sobre as respostas da RAG, consulte o artigo Resultados de obtenção e geração do motor RAG da Vertex AI.
Para saber mais sobre a arquitetura RAG:
- Infraestrutura para uma aplicação de IA generativa com capacidade de RAG que usa o Vertex AI e a pesquisa vetorial
- Infraestrutura para uma aplicação de IA generativa com capacidade de RAG que usa a Vertex AI e o AlloyDB para PostgreSQL.