Información general sobre el motor de RAG de Vertex AI

En esta página se describe qué es Vertex AI RAG Engine y cómo funciona.

Descripción Consola
Para saber cómo usar el SDK de Vertex AI para ejecutar tareas de Vertex AI RAG Engine, consulta la guía de inicio rápido de RAG para Python.

Probar el motor de RAG de Vertex AI

Información general

Vertex AI RAG Engine, un componente de la plataforma Vertex AI, facilita la generación aumentada de recuperación (RAG). Vertex AI RAG Engine también es un marco de datos para desarrollar aplicaciones de modelos de lenguaje extensos (LLMs) con contexto aumentado. El aumento del contexto se produce cuando aplicas un LLM a tus datos. Implementa la generación aumentada por recuperación (RAG).

Un problema habitual de los LLMs es que no entienden el conocimiento privado, es decir, los datos de tu organización. Con Vertex AI RAG Engine, puedes enriquecer el contexto de los LLMs con información privada adicional, ya que el modelo puede reducir las alucinaciones y responder a las preguntas de forma más precisa.

Al combinar fuentes de conocimiento adicionales con el conocimiento que ya tienen los LLMs, se proporciona un mejor contexto. El contexto mejorado junto con la consulta aumenta la calidad de la respuesta del LLM.

En la siguiente imagen se ilustran los conceptos clave para entender el motor de RAG de Vertex AI.

Conceptos clave de RAG de Vertex AI

Estos conceptos se enumeran en el orden del proceso de generación aumentada de recuperación (RAG).

  1. Ingestión de datos: ingiere datos de diferentes fuentes de datos. Por ejemplo, archivos locales, Cloud Storage y Google Drive.

  2. Transformación de datos: conversión de los datos para prepararlos para la indexación. Por ejemplo, los datos se dividen en fragmentos.

  3. Inserción: representaciones numéricas de palabras o fragmentos de texto. Estos números capturan el significado semántico y el contexto del texto. Las palabras o el texto similares o relacionados tienden a tener inserciones similares, lo que significa que están más cerca en el espacio vectorial de alta dimensión.

  4. Indexación de datos: el motor de RAG de Vertex AI crea un índice llamado corpus. El índice estructura la base de conocimientos para que esté optimizada para las búsquedas. Por ejemplo, el índice es como una tabla de contenido detallada de un libro de referencia enorme.

  5. Extracción: cuando un usuario hace una pregunta o proporciona una petición, el componente de extracción de Vertex AI RAG Engine busca en su base de conocimientos información relevante para la consulta.

  6. Generación: la información obtenida se convierte en el contexto que se añade a la consulta original del usuario como guía para que el modelo de IA generativa genere respuestas fundamentadas y relevantes.

Regiones disponibles

El motor de RAG de Vertex AI está disponible en las siguientes regiones:

Región Ubicación Descripción Fase de lanzamiento
us-central1 Iowa Se admiten las versiones v1 y v1beta1. Lista de permitidos
us-east4 Virginia Se admiten las versiones v1 y v1beta1. GA
europe-west3 Fráncfort (Alemania) Se admiten las versiones v1 y v1beta1. GA
europe-west4 Eemshaven (Países Bajos) Se admiten las versiones v1 y v1beta1. GA
  • us-central1 se ha cambiado a Allowlist. Si quieres experimentar con Vertex AI RAG Engine, prueba con otras regiones. Si tiene previsto incorporar su tráfico de producción a us-central1, póngase en contacto con vertex-ai-rag-engine-support@google.com.

Eliminar Vertex AI RAG Engine

En los siguientes ejemplos de código se muestra cómo eliminar un motor RAG de Vertex AI en la consola, Python y REST: Google Cloud

Enviar comentarios

Para chatear con el equipo de Asistencia de Google, ve al grupo de asistencia de Vertex AI RAG Engine.

Para enviar un correo, usa la dirección de correo vertex-ai-rag-engine-support@google.com.

Siguientes pasos