En esta página se presentan las bases de datos vectoriales compatibles con el motor de RAG de Vertex AI. También puedes consultar cómo conectar una base de datos vectorial (almacén de vectores) a tu corpus de RAG.
Las bases de datos de vectores desempeñan un papel fundamental a la hora de habilitar la recuperación de información en las aplicaciones RAG. Las bases de datos vectoriales ofrecen una forma especializada de almacenar y consultar incrustaciones de vectores, que son representaciones matemáticas de texto u otros datos que capturan el significado semántico y las relaciones. Las incrustaciones de vectores permiten que los sistemas RAG encuentren de forma rápida y precisa la información más relevante en una base de conocimientos extensa, incluso cuando se trata de consultas complejas o matizadas. Cuando se combinan con un modelo de inserciones, las bases de datos vectoriales pueden ayudar a superar las limitaciones de los LLMs y proporcionar respuestas más precisas, relevantes y completas.
Bases de datos vectoriales admitidas
Al crear un corpus de RAG, Vertex AI RAG Engine ofrece RagManagedDb
, que está listo para empresas, como base de datos de vectores predeterminada, por lo que no requiere aprovisionamiento ni gestión adicionales.
RagManagedDb
ofrece opciones de búsqueda de KNN y ANN, y permite cambiar a un nivel básico para hacer prototipos y experimentos rápidos.
Para obtener más información sobre cómo elegir una estrategia de recuperación en RagManagedDb
o para actualizar el nivel, consulta Usar RagManagedDb
con RAG. Para que Vertex AI RAG Engine cree y gestione automáticamente la base de datos de vectores, consulta Crear un corpus de RAG.
Además de RagManagedDb
, Vertex AI RAG Engine te permite aprovisionar y usar tu base de datos vectorial en tu corpus de RAG. En este caso, eres responsable del ciclo de vida y la escalabilidad de tu base de datos de vectores.
Comparar opciones de bases de datos vectoriales
En esta tabla se enumeran las bases de datos vectoriales que se admiten en Vertex AI RAG Engine y se proporcionan enlaces a páginas que explican cómo usar las bases de datos vectoriales en tu corpus de RAG.
Base de datos vectorial | Ventajas | Recomendado para | Inconvenientes | Métricas de distancia admitidas | Tipo de búsqueda | Fase de lanzamiento |
---|---|---|---|---|---|---|
RagManagedDb (opción predeterminada) es un servicio de base de datos escalable distribuido regionalmente que ofrece una coherencia y una disponibilidad muy altas, y que se puede usar para realizar búsquedas vectoriales.
easy simple fast quick |
|
|
|
cosine |
KNN (predeterminado) y ANN | Disponible de forma general |
Vector Search es el servicio de base de datos de vectores de Vertex AI optimizado para tareas de aprendizaje automático. |
|
|
|
cosine dot-product |
ANN | Disponible de forma general |
Vertex AI Feature Store es un servicio gestionado para organizar, almacenar y ofrecer características de aprendizaje automático. |
|
|
|
cosine dot-product L2 squared |
ANN | Vista previa |
Weaviate es una base de datos vectorial de código abierto flexible y modular. |
|
|
|
cosine dot-product L2 squared hamming manhattan |
Compatibilidad con ANN y búsqueda híbrida | Vista previa |
Pinecone es una base de datos de vectores nativa de la nube y totalmente gestionada, diseñada para realizar búsquedas de similitud de alto rendimiento. |
|
|
|
cosine euclidean dot-product |
ANN | Disponible de forma general |
Siguientes pasos
- Para crear un corpus de RAG, consulta el ejemplo de creación de un corpus de RAG.
- Para ver una lista de todos los corpora de RAG, consulta el ejemplo de lista de corpora de RAG.