En esta página, se describe qué es el motor de RAG de Vertex AI y cómo funciona.
Descripción general
El motor de RAG de Vertex AI, un componente de la plataforma de Vertex AI, facilita la generación de aumento de recuperación (RAG). El motor de RAG de Vertex AI también es un framework de datos para desarrollar aplicaciones de modelos de lenguaje grandes (LLM) adaptados al contexto. El aumento del contexto se produce cuando se aplica un LLM a tus datos. Esto implemente generación aumentada y de recuperación (RAG).
Un problema común con los LLM es que no comprenden el conocimiento privado, es decir, los datos de tu organización. Con el motor de RAG de Vertex AI, puedes enriquecer el contexto del LLM con información privada adicional, ya que el modelo puede reducir las alucinaciones y responder preguntas con mayor precisión.
Cuando se combinan fuentes de conocimiento adicionales con el conocimiento existente que tienen los LLM, se proporciona un mejor contexto. El contexto mejorado junto con la consulta mejoran la calidad de la respuesta del LLM.
En la siguiente imagen, se ilustran los conceptos clave para comprender el motor de RAG de Vertex AI.
Estos conceptos se enumeran en el orden del proceso de generación aumentada y de recuperación (RAG).
Transferencia de datos: Transferencia de datos de diferentes fuentes. Por ejemplo, archivos locales, Cloud Storage y Google Drive.
Transformación de datos: Conversión de los datos para prepararlos para el indexado. Por ejemplo, los datos se dividen en fragmentos.
Embedding: Representaciones numéricas de palabras o fragmentos de texto. Estos números capturan el significado semántico y el contexto del texto. Las palabras o textos similares o relacionados tienden a tener incrustaciones similares, lo que significa que están más cerca unas de otras en el espacio vectorial de alta dimensión.
Indexación de datos: El motor de RAG de Vertex AI crea un índice llamado corpus. El índice estructura la base de conocimientos para optimizar la búsqueda. Por ejemplo, el índice es como el índice detallado de un libro de consulta masiva.
Recuperación: Cuando un usuario hace una pregunta o proporciona una instrucción, el componente de recuperación del motor de RAG de Vertex AI busca en su base de conocimiento información relevante para la consulta.
Generación: La información recuperada se convierte en el contexto que se agrega a la consulta original del usuario como guía para que el modelo de IA generativa genere respuestas relevantes y fundamentadas en los hechos.
Regiones admitidas
Vertex AI RAG Engine es compatible con las siguientes regiones:
Región | Ubicación | Descripción | Etapa de lanzamiento |
---|---|---|---|
europe-west3 |
Fráncfort, Alemania | Se admiten las versiones v1 y v1beta1 . |
DG |
us-central1 |
Iowa | Se admiten las versiones v1 y v1beta1 . |
DG |
Enviar comentarios
Para chatear con el equipo de asistencia al cliente de Google, ve al grupo de asistencia al cliente de Vertex AI RAG Engine.
Para enviar un correo electrónico, usa la dirección de correo electrónico vertex-ai-rag-engine-support@google.com
.
¿Qué sigue?
- Si deseas obtener información para usar el SDK de Vertex AI y ejecutar tareas del motor de RAG de Vertex AI, consulta la Guía de inicio rápido de RAG para Python.
- Para obtener más información sobre la fundamentación, consulta Descripción general de la fundamentación.
- Para obtener información sobre las diferencias entre la RAG y la fundamentación, consulta Cómo fundamentar respuestas con RAG.
- Para obtener más información sobre las respuestas de la RAG, consulta Resultado de recuperación y generación del motor de RAG de Vertex AI.
- Para obtener más información sobre la arquitectura de RAG, haz lo siguiente: