Opciones de bases de datos de vectores en el motor de RAG de Vertex AI

En esta página se presentan las bases de datos vectoriales compatibles con el motor de RAG de Vertex AI. También puedes consultar cómo conectar una base de datos vectorial (almacén de vectores) a tu corpus de RAG.

Las bases de datos de vectores desempeñan un papel fundamental a la hora de habilitar la recuperación de información en las aplicaciones RAG. Las bases de datos vectoriales ofrecen una forma especializada de almacenar y consultar incrustaciones de vectores, que son representaciones matemáticas de texto u otros datos que capturan el significado semántico y las relaciones. Las incrustaciones de vectores permiten que los sistemas RAG encuentren de forma rápida y precisa la información más relevante en una base de conocimientos extensa, incluso cuando se trata de consultas complejas o matizadas. Cuando se combinan con un modelo de inserciones, las bases de datos vectoriales pueden ayudar a superar las limitaciones de los LLMs y proporcionar respuestas más precisas, relevantes y completas.

Bases de datos vectoriales admitidas

Al crear un corpus de RAG, Vertex AI RAG Engine ofrece RagManagedDb, que está listo para empresas, como base de datos de vectores predeterminada, por lo que no requiere aprovisionamiento ni gestión adicionales. RagManagedDb ofrece opciones de búsqueda de KNN y ANN, y permite cambiar a un nivel básico para hacer prototipos y experimentos rápidos. Para obtener más información sobre cómo elegir una estrategia de recuperación en RagManagedDb o para actualizar el nivel, consulta Usar RagManagedDb con RAG. Para que Vertex AI RAG Engine cree y gestione automáticamente la base de datos de vectores, consulta Crear un corpus de RAG.

Además de RagManagedDb, Vertex AI RAG Engine te permite aprovisionar y usar tu base de datos vectorial en tu corpus de RAG. En este caso, eres responsable del ciclo de vida y la escalabilidad de tu base de datos de vectores.

Comparar opciones de bases de datos vectoriales

En esta tabla se enumeran las bases de datos vectoriales que se admiten en Vertex AI RAG Engine y se proporcionan enlaces a páginas que explican cómo usar las bases de datos vectoriales en tu corpus de RAG.

Base de datos vectorial   Ventajas   Recomendado para   Inconvenientes Métricas de distancia admitidas Tipo de búsqueda Fase de lanzamiento
RagManagedDb (opción predeterminada) es un servicio de base de datos escalable distribuido regionalmente que ofrece una coherencia y una disponibilidad muy altas, y que se puede usar para realizar búsquedas vectoriales. easy simple fast quick
  • No tienes que configurar nada.
  • Ideal para casos prácticos a gran y pequeña escala.
  • Coherencia muy alta.
  • Alta disponibilidad.
  • Latencia baja.
  • Excelente para cargas de trabajo transaccionales.
  • CMEK habilitado.
  • Generar documentos de gran volumen.
  • Crear RAG a escala empresarial.
  • Desarrollar una prueba de concepto rápida.
  • Proporciona una sobrecarga de aprovisionamiento y mantenimiento baja.
  • Usar con chatbots.
  • Crear aplicaciones RAG.
  • Para que la función ANN funcione de forma óptima, es necesario volver a compilar el índice después de hacer cambios importantes en los datos.
cosine KNN (predeterminado) y ANN Disponible de forma general
Vector Search es el servicio de base de datos de vectores de Vertex AI optimizado para tareas de aprendizaje automático.
  • Se integra con otros Google Cloud servicios.
  • La escalabilidad y la fiabilidad se basan en la infraestructura de Google Cloud .
  • Usa el modelo de precios de pago por uso.
  • Generar documentos de gran volumen.
  • Crear RAG a escala empresarial.
  • Gestionar la infraestructura de la base de datos de vectores.
  • Clientes actuales de Google Cloud o cualquier persona que quiera usar varios servicios de Google Cloud .
  • Las actualizaciones no se reflejan inmediatamente.
  • Dependencia de proveedores con Google Cloud.
  • Puede ser más caro en función de tus casos prácticos.
cosine

dot-product
ANN Disponible de forma general
Vertex AI Feature Store es un servicio gestionado para organizar, almacenar y ofrecer características de aprendizaje automático.
  • Se integra con Vertex AI y otros Google Cloud servicios.
  • La escalabilidad y la fiabilidad se basan en la infraestructura de Google Cloud .
  • Aprovecha la infraestructura de BigQuery.
  • Generar documentos de gran volumen.
  • Crear RAG a escala empresarial.
  • Gestionar la infraestructura de la base de datos de vectores.
  • Clientes actuales o clientes que quieran usar varios servicios. Google Cloud Google Cloud
  • Los cambios solo estarán disponibles en la tienda online después de realizar una sincronización manual.
  • Dependencia de proveedores con Google Cloud.
cosine

dot-product

L2 squared
ANN Vista previa
Weaviate es una base de datos vectorial de código abierto flexible y modular.
  • Admite varios tipos de datos y ofrece funciones de gráficos integradas.
  • Ofrece software libre y una comunidad activa.
  • Es muy flexible y personalizable.
  • Admite diversos tipos de datos y módulos para diferentes modalidades, como texto e imágenes.
  • Puede elegir entre proveedores de servicios en la nube, como Google Cloud, AWS y Azure.
  • Generar documentos de gran volumen.
  • Crear RAG a escala empresarial.
  • Gestionar la infraestructura de la base de datos de vectores.
  • Clientes actuales de Weaviate.
  • Las actualizaciones no se reflejan inmediatamente.
  • Puede ser más complejo de configurar y gestionar.
  • El rendimiento puede variar en función de la configuración.
cosine

dot-product

L2 squared

hamming

manhattan
Compatibilidad con ANN y búsqueda híbrida Vista previa
Pinecone es una base de datos de vectores nativa de la nube y totalmente gestionada, diseñada para realizar búsquedas de similitud de alto rendimiento.
  • Empieza rápidamente.
  • Excelente escalabilidad y rendimiento.
  • Centrarse en la búsqueda vectorial con funciones avanzadas, como el filtrado y la búsqueda de metadatos.
  • Puede elegir entre proveedores de servicios en la nube, como Google Cloud, AWS y Azure.
  • Generar documentos de gran volumen.
  • Crear RAG a escala empresarial.
  • Gestionar la infraestructura de la base de datos de vectores.
  • Clientes actuales de Pinecone.
  • Las actualizaciones no se reflejan inmediatamente.
  • Puede ser más caro que otras opciones.
  • Las cuotas y los límites restringen la escalabilidad y el rendimiento.
  • Control limitado sobre la infraestructura subyacente.
cosine

euclidean

dot-product
ANN Disponible de forma general

Siguientes pasos