Desde el 29 de abril del 2025, los modelos Gemini 1.5 Pro y Gemini 1.5 Flash no están disponibles en proyectos donde no se hayan utilizado previamente, incluidos los proyectos nuevos. Para obtener más información, consulta Versiones y ciclo de vida de los modelos.

Esta página se ha traducido con Cloud Translation API.

Información general sobre el motor de RAG de Vertex AI

En esta página se describe qué es Vertex AI RAG Engine y cómo funciona.

Descripción	Consola
Para saber cómo usar el SDK de Vertex AI para ejecutar tareas de Vertex AI RAG Engine, consulta la guía de inicio rápido de RAG para Python.	Probar el motor de RAG de Vertex AI

Información general

Vertex AI RAG Engine, un componente de la plataforma Vertex AI, facilita la generación aumentada de recuperación (RAG). Vertex AI RAG Engine también es un marco de datos para desarrollar aplicaciones de modelos de lenguaje extensos (LLMs) con contexto aumentado. El aumento del contexto se produce cuando aplicas un LLM a tus datos. Implementa la generación aumentada por recuperación (RAG).

Un problema habitual de los LLMs es que no entienden el conocimiento privado, es decir, los datos de tu organización. Con Vertex AI RAG Engine, puedes enriquecer el contexto de los LLMs con información privada adicional, ya que el modelo puede reducir las alucinaciones y responder a las preguntas de forma más precisa.

Al combinar fuentes de conocimiento adicionales con el conocimiento que ya tienen los LLMs, se proporciona un mejor contexto. El contexto mejorado junto con la consulta aumenta la calidad de la respuesta del LLM.

En la siguiente imagen se ilustran los conceptos clave para entender el motor de RAG de Vertex AI.

Conceptos clave de RAG de Vertex AI

Estos conceptos se enumeran en el orden del proceso de generación aumentada de recuperación (RAG).

Ingestión de datos: ingiere datos de diferentes fuentes de datos. Por ejemplo, archivos locales, Cloud Storage y Google Drive.
Transformación de datos: conversión de los datos para prepararlos para la indexación. Por ejemplo, los datos se dividen en fragmentos.
Inserción: representaciones numéricas de palabras o fragmentos de texto. Estos números capturan el significado semántico y el contexto del texto. Las palabras o el texto similares o relacionados tienden a tener inserciones similares, lo que significa que están más cerca en el espacio vectorial de alta dimensión.
Indexación de datos: el motor de RAG de Vertex AI crea un índice llamado corpus. El índice estructura la base de conocimientos para que esté optimizada para las búsquedas. Por ejemplo, el índice es como una tabla de contenido detallada de un libro de referencia enorme.
Extracción: cuando un usuario hace una pregunta o proporciona una petición, el componente de extracción de Vertex AI RAG Engine busca en su base de conocimientos información relevante para la consulta.
Generación: la información obtenida se convierte en el contexto que se añade a la consulta original del usuario como guía para que el modelo de IA generativa genere respuestas fundamentadas y relevantes.

Regiones disponibles

El motor de RAG de Vertex AI está disponible en las siguientes regiones:

Región	Ubicación	Descripción	Fase de lanzamiento
`us-central1`	Iowa	Se admiten las versiones `v1` y `v1beta1`.	Lista de permitidos
`us-east4`	Virginia	Se admiten las versiones `v1` y `v1beta1`.	GA
`europe-west3`	Fráncfort (Alemania)	Se admiten las versiones `v1` y `v1beta1`.	GA
`europe-west4`	Eemshaven (Países Bajos)	Se admiten las versiones `v1` y `v1beta1`.	GA

us-central1 se ha cambiado a Allowlist. Si quieres experimentar con Vertex AI RAG Engine, prueba con otras regiones. Si tiene previsto incorporar su tráfico de producción a us-central1, póngase en contacto con vertex-ai-rag-engine-support@google.com.

Eliminar Vertex AI RAG Engine

En los siguientes ejemplos de código se muestra cómo eliminar un motor RAG de Vertex AI en la consola, Python y REST: Google Cloud

Parámetros de la API versión 1 (v1) y ejemplos de código.
Parámetros y ejemplos de código de la API v1beta1.

Enviar comentarios

Para chatear con el equipo de Asistencia de Google, ve al grupo de asistencia de Vertex AI RAG Engine.

Para enviar un correo, usa la dirección de correo vertex-ai-rag-engine-support@google.com.

Siguientes pasos

Para saber cómo usar el SDK de Vertex AI para ejecutar tareas de Vertex AI RAG Engine, consulta la guía de inicio rápido de RAG para Python.
Para obtener información sobre el grounding, consulta la introducción al grounding.
Para obtener más información sobre las respuestas de RAG, consulta Resultados de extracción y generación del motor RAG de Vertex AI.
Para obtener información sobre la arquitectura RAG, sigue estos pasos:
- Infraestructura para una aplicación de IA generativa compatible con RAG que use Vertex AI y Vector Search
- Infraestructura para una aplicación de IA generativa compatible con RAG que use Vertex AI y AlloyDB para PostgreSQL.