Opciones de base de datos vectorial en el motor de RAG

En esta página, se presentan las opciones de una base de datos vectorial compatible en el motor de RAG. También puedes ver cómo conectar una base de datos de vectores (almacenamiento de vectores) a tu corpus de RAG.

Un problema común con los LLM es que no comprenden el conocimiento privado, es decir, los datos de tu organización. Con RAG Engine, puedes enriquecer el contexto del LLM con información privada adicional, ya que el modelo puede reducir las alucinaciones y responder preguntas con mayor precisión.

Las bases de datos vectoriales desempeñan un papel fundamental en la recuperación de aplicaciones de RAG. Las bases de datos vectoriales ofrecen una forma especializada de almacenar y consultar incorporaciones vectoriales, que son representaciones matemáticas de texto o de otros datos que capturan el significado y las relaciones semánticas. Las incorporaciones vectoriales permiten que los sistemas de RAG encuentren con rapidez y precisión la información más relevante dentro de una amplia base de conocimiento, incluso cuando se trata de consultas complejas o con matices. Cuando se combinan con un modelo de incorporación, las bases de datos vectoriales pueden ayudar a superar las limitaciones de los LLM y proporcionar respuestas más precisas, relevantes y completas.

Bases de datos vectoriales compatibles

Cuando se crea un corpus de RAG, RAG Engine ofrece RagManagedDb como la opción predeterminada de una base de datos de vectores, que no requiere aprovisionamiento ni administración adicionales. Para que RAG Engine cree y administre automáticamente la base de datos de vectores por ti, consulta Cómo crear un corpus de RAG.

Además del RagManagedDb predeterminado, RAG Engine te permite aprovisionar y llevar tu base de datos de vectores para usarla en tu corpus de RAG. En este caso, eres responsable del ciclo de vida y la escalabilidad de tu base de datos vectorial.

Compara opciones de bases de datos vectoriales

En esta tabla, se enumeran las opciones de bases de datos de vectores que se admiten en RAG Engine y se proporcionan vínculos a páginas que explican cómo usar las bases de datos de vectores en tu corpus de RAG.

Para identificar qué base de datos de vectores satisface tus necesidades, usa esta tabla para comparar las opciones de bases de datos de vectores:

Base de datos de vectores Descripción Beneficios Desventajas Métricas de distancia admitidas en el motor de RAG Tipo de búsqueda Etapa de lanzamiento en RAG Engine Listo para la producción Ideal para
RagManagedDb (default) RagManagedDb es un servicio de base de datos escalable distribuido regionalmente que ofrece coherencia y alta disponibilidad.

RagManagedDb se puede usar para una búsqueda vectorial.
  • No requiere configuración. Es adecuada para casos de uso de inicio rápido y a pequeña escala.
  • Coherencia y alta disponibilidad
  • Latencia baja.
  • Excelente para cargas de trabajo transaccionales.
  • La capacidad se limita de forma intencional.
  • No se recomienda para casos de uso a gran escala.
cosine KNN Vista previa
  • POC rápido
  • ChatBots
  • Apps de RAG
Pinecone Pinecone es una base de datos de vectores nativa de la nube completamente administrada diseñada para una búsqueda de similitud de alto rendimiento.
  • Comienza a usarla rápidamente.
  • Excelente escalabilidad y rendimiento
  • Enfócate en la búsqueda de vectores con funciones avanzadas, como el filtrado y la búsqueda de metadatos.
  • Puedes elegir entre proveedores de servicios en la nube, como Google Cloud, AWS y Azure.
  • Es coherente con el tiempo, lo que significa que las actualizaciones no se reflejan de inmediato.
  • Puede ser más costosa que las otras opciones.
  • Las cuotas y los límites restringen el escalamiento y el rendimiento.
  • Control limitado sobre la infraestructura subyacente.
cosine

euclidean

dot-product
ANN Vista previa
  • Documentos de gran volumen
  • RAG a escala empresarial
  • Administración de la infraestructura de bases de datos vectoriales
  • Clientes existentes de Pinecone
Weaviate Weaviate es una base de datos de vectores de código abierto que se enfoca en la flexibilidad y la modularidad.

Weaviate admite varios tipos de datos y ofrece capacidades de gráficos integradas.
  • Weaviate ofrece código abierto y una comunidad vibrante.
  • Son muy flexibles y personalizables.
  • Admite diversos tipos y módulos de datos para diferentes modalidades, como texto e imágenes.
  • Puedes elegir entre proveedores de servicios en la nube, como Google Cloud, AWS y Azure.
  • Es coherente con el tiempo, lo que significa que las actualizaciones no se reflejan de inmediato.
  • Puede ser más complejo de configurar y administrar.
  • El rendimiento puede variar según la configuración.
cosine

dot-product

L2 squared

hamming

manhattan
Compatibilidad con ANN y búsqueda híbrida Vista previa
  • Documentos de gran volumen
  • RAG a escala empresarial
  • Administración de la infraestructura de bases de datos vectoriales
  • Clientes existentes de Weaviate
Búsqueda de vectores Vector Search es el servicio de base de datos de vectores de Vertex AI.

Vector Search está optimizado para tareas de aprendizaje automático y se integra con otros servicios de Google Cloud.
  • La Búsqueda de vectores se integra en Vertex AI y otros servicios de Google Cloud.
  • La infraestructura de Google Cloud admite la escalabilidad y la confiabilidad.
  • Usa precios de pago por uso.
  • Es coherente con el tiempo, lo que significa que las actualizaciones no se reflejan de inmediato.
  • Es un servicio nuevo con funciones en evolución.
  • Dependencia de proveedores con Google Cloud.
  • Puede ser costoso según tus casos de uso.
cosine

dot-product
ANN Vista previa
  • Documentos de gran volumen
  • RAG a escala empresarial
  • Administración de la infraestructura de bases de datos vectoriales
  • Clientes existentes de Google Cloud o cualquier persona que quiera usar varios servicios de Google Cloud
Vertex AI Feature Store

Vertex AI Feature Store es un servicio administrado para organizar, almacenar y entregar atributos de aprendizaje automático.

Vertex AI Feature Store está optimizado para tareas de aprendizaje automático y se integra con otros servicios de Google Cloud.

  • Vertex AI Feature Store se integra en Vertex AI y otros servicios de Google Cloud.
  • La infraestructura de Google Cloud admite la escalabilidad y la confiabilidad.
  • Aprovecha la infraestructura existente de BigQuery como Vertex AI Feature Store, que proporciona una solución rentable y escalable.
  • Después de que se realiza la sincronización manual, los cambios en la tienda en línea estarán disponibles.
  • Dependencia de proveedores con Google Cloud.
cosine

dot-product

L2 squared
ANN Vista previa
  • Documentos de gran volumen
  • RAG a escala empresarial
  • Administración de la infraestructura de bases de datos vectoriales
  • Clientes existentes de Google Cloud o clientes que desean usar varios servicios de Google Cloud

¿Qué sigue?