En esta página, se presentan las opciones de una base de datos vectorial compatible en el motor de RAG. También puedes ver cómo conectar una base de datos de vectores (almacenamiento de vectores) a tu corpus de RAG.
Un problema común con los LLM es que no comprenden el conocimiento privado, es decir, los datos de tu organización. Con RAG Engine, puedes enriquecer el contexto del LLM con información privada adicional, ya que el modelo puede reducir las alucinaciones y responder preguntas con mayor precisión.
Las bases de datos vectoriales desempeñan un papel fundamental en la recuperación de aplicaciones de RAG. Las bases de datos vectoriales ofrecen una forma especializada de almacenar y consultar incorporaciones vectoriales, que son representaciones matemáticas de texto o de otros datos que capturan el significado y las relaciones semánticas. Las incorporaciones vectoriales permiten que los sistemas de RAG encuentren con rapidez y precisión la información más relevante dentro de una amplia base de conocimiento, incluso cuando se trata de consultas complejas o con matices. Cuando se combinan con un modelo de incorporación, las bases de datos vectoriales pueden ayudar a superar las limitaciones de los LLM y proporcionar respuestas más precisas, relevantes y completas.
Bases de datos vectoriales compatibles
Cuando se crea un corpus de RAG, RAG Engine ofrece RagManagedDb
como la opción predeterminada de una base de datos de vectores, que no requiere aprovisionamiento ni administración adicionales. Para que RAG Engine cree y administre automáticamente la base de datos de vectores por ti, consulta Cómo crear un corpus de RAG.
Además del RagManagedDb
predeterminado, RAG Engine te permite aprovisionar y llevar tu base de datos de vectores para usarla en tu corpus de RAG. En este caso,
eres responsable del ciclo de vida y la escalabilidad de tu base de datos vectorial.
Compara opciones de bases de datos vectoriales
En esta tabla, se enumeran las opciones de bases de datos de vectores que se admiten en RAG Engine y se proporcionan vínculos a páginas que explican cómo usar las bases de datos de vectores en tu corpus de RAG.
Para identificar qué base de datos de vectores satisface tus necesidades, usa esta tabla para comparar las opciones de bases de datos de vectores:
Base de datos de vectores | Descripción | Beneficios | Desventajas | Métricas de distancia admitidas en el motor de RAG | Tipo de búsqueda | Etapa de lanzamiento en RAG Engine | Listo para la producción | Ideal para |
---|---|---|---|---|---|---|---|---|
RagManagedDb (default) |
RagManagedDb es un servicio de base de datos escalable distribuido regionalmente que ofrece coherencia y alta disponibilidad.RagManagedDb se puede usar para una búsqueda vectorial.
|
|
|
cosine |
KNN | Vista previa |
|
|
Pinecone | Pinecone es una base de datos de vectores nativa de la nube completamente administrada diseñada para una búsqueda de similitud de alto rendimiento. |
|
|
cosine euclidean dot-product |
ANN | Vista previa |
|
|
Weaviate | Weaviate es una base de datos de vectores de código abierto que se enfoca en la flexibilidad y la modularidad. Weaviate admite varios tipos de datos y ofrece capacidades de gráficos integradas. |
|
|
cosine dot-product L2 squared hamming manhattan |
Compatibilidad con ANN y búsqueda híbrida | Vista previa |
|
|
Búsqueda de vectores | Vector Search es el servicio de base de datos de vectores de Vertex AI. Vector Search está optimizado para tareas de aprendizaje automático y se integra con otros servicios de Google Cloud. |
|
|
cosine dot-product |
ANN | Vista previa |
|
|
Vertex AI Feature Store | Vertex AI Feature Store es un servicio administrado para organizar, almacenar y entregar atributos de aprendizaje automático. Vertex AI Feature Store está optimizado para tareas de aprendizaje automático y se integra con otros servicios de Google Cloud. |
|
|
cosine dot-product L2 squared |
ANN | Vista previa |
|
¿Qué sigue?
- Para obtener más información sobre cómo elegir modelos de incorporación, consulta Cómo usar modelos de incorporación con RAG Engine.
- Para obtener más información sobre RAG Engine, consulta Descripción general de RAG Engine.