Opções de base de dados vetorial no Vertex AI RAG Engine

Esta página apresenta as bases de dados vetoriais suportadas no Vertex AI RAG Engine. Também pode ver como associar uma base de dados vetorial (armazenamento de vetores) ao seu corpus de RAG.

As bases de dados vetoriais desempenham um papel crucial na ativação da obtenção para aplicações RAG. As bases de dados vetoriais oferecem uma forma especializada de armazenar e consultar incorporações vetoriais, que são representações matemáticas de texto ou outros dados que captam o significado semântico e as relações. As incorporações vetoriais permitem que os sistemas RAG encontrem rapidamente e com precisão as informações mais relevantes numa vasta base de conhecimentos, mesmo quando lidam com consultas complexas ou com nuances. Quando combinadas com um modelo de incorporação, as bases de dados vetoriais podem ajudar a superar as limitações dos GMLs e fornecer respostas mais precisas, relevantes e abrangentes.

Bases de dados vetoriais suportadas

Ao criar um corpus RAG, o motor RAG da Vertex AI oferece o RagManagedDbpronto para a empresa como a base de dados vetorial predefinida, que não requer aprovisionamento nem gestão adicionais. A RagManagedDb oferece opções de pesquisa KNN e ANN e permite mudar para um nível básico para uma prototipagem e experimentação rápidas. Para saber mais sobre como escolher uma estratégia de obtenção no RagManagedDb ou para atualizar o nível, consulte Use o RagManagedDb com a RAG. Para que o motor RAG da Vertex AI crie e faça a gestão automaticamente da base de dados vetorial, consulte o artigo Crie um corpus RAG.

Além da RagManagedDb predefinida, o Vertex AI RAG Engine permite aprovisionar e usar a sua base de dados vetorial no seu corpus RAG. Neste caso, é responsável pelo ciclo de vida e pela escalabilidade da sua base de dados de vetores.

Compare opções de bases de dados vetoriais

Esta tabela apresenta as suas opções de bases de dados vetoriais suportadas no motor RAG do Vertex AI e fornece links para páginas que explicam como usar as bases de dados vetoriais no seu corpus RAG.

Base de dados vetorial   Vantagens   Ideal para   Desvantagens Métricas de distância suportadas Tipo de pesquisa Fase de lançamento
RagManagedDb (predefinição) é um serviço de base de dados escalável distribuído regionalmente que oferece uma consistência muito elevada e uma elevada disponibilidade, e que pode ser usado para uma pesquisa vetorial. fácil simples rápido
  • Não é necessária qualquer configuração.
  • Adequado para exemplos de utilização à escala empresarial e em pequena escala.
  • Consistência muito elevada.
  • Alta disponibilidade.
  • Latência baixa.
  • Excelente para cargas de trabalho transacionais.
  • CMEK ativada.
  • Gerar documentos de grande volume.
  • Criar RAG à escala empresarial.
  • Desenvolver uma validação de conceito rápida.
  • Fornecer um aprovisionamento e uma manutenção com custos gerais baixos.
  • Usar com bots de chat.
  • Criar aplicações RAG.
  • Para uma capacidade de memorização ideal, a funcionalidade de ANN requer que o índice seja reconstruído após alterações importantes aos seus dados.
cosine KNN (predefinição) e ANN Disponível de forma geral
A pesquisa vetorial é o serviço de base de dados vetorial no Vertex AI otimizado para tarefas de aprendizagem automática.
  • Integra-se com outros Google Cloud serviços.
  • A escalabilidade e a fiabilidade são suportadas pela Google Cloud infraestrutura.
  • Usa preços de pagamento mediante utilização.
  • Gerar documentos de grande volume.
  • Criar RAG à escala empresarial.
  • Gerir a infraestrutura da base de dados vetorial.
  • Clientes Google Cloud existentes ou qualquer pessoa que queira usar vários Google Cloud serviços.
  • As atualizações não são refletidas imediatamente.
  • Dependência de fornecedor com Google Cloud.
  • Pode ser mais caro consoante os seus exemplos de utilização.
cosine

dot-product
ANN Disponível de forma geral
O Vertex AI Feature Store é um serviço gerido para organizar, armazenar e publicar funcionalidades de aprendizagem automática.
  • Integra-se com o Vertex AI e outros Google Cloud serviços.
  • A escalabilidade e a fiabilidade são suportadas pela Google Cloud infraestrutura.
  • Tiram partido da infraestrutura do BigQuery existente.
  • Gerar documentos de grande volume.
  • Criar RAG à escala empresarial.
  • Gerir a infraestrutura da base de dados vetorial.
  • Clientes Google Cloud existentes ou clientes que pretendem usar vários Google Cloud serviços.
  • As alterações só estão disponíveis na loja online após a realização de uma sincronização manual.
  • Dependência de fornecedor com Google Cloud.
cosine

dot-product

L2 squared
ANN Pré-visualização
Weaviate é uma base de dados de vetores de código aberto flexível e modular.
  • Suporta vários tipos de dados e oferece capacidades de gráficos incorporadas.
  • Oferece código aberto e uma comunidade dinâmica.
  • Altamente flexíveis e personalizáveis.
  • Suporta diversos tipos de dados e módulos para diferentes modalidades, como texto e imagens.
  • Pode escolher entre fornecedores de nuvem, como Google Cloud, AWS e Azure.
  • Gerar documentos de grande volume.
  • Criar RAG à escala empresarial.
  • Gerir a infraestrutura da base de dados vetorial.
  • Clientes existentes do Weaviate.
  • As atualizações não são refletidas imediatamente.
  • Pode ser mais complexo de configurar e gerir.
  • O desempenho pode variar consoante a configuração.
cosine

dot-product

L2 squared

hamming

manhattan
ANN + Hybrid search support Pré-visualização
Pinecone é uma base de dados vetorial nativa da nuvem totalmente gerida, concebida para uma pesquisa de similaridade de elevado desempenho.
  • Comece rapidamente.
  • Excelente escalabilidade e desempenho.
  • Concentre-se na pesquisa vetorial com funcionalidades avançadas, como a filtragem e uma pesquisa de metadados.
  • Pode escolher entre fornecedores de nuvem, como Google Cloud, AWS e Azure.
  • Gerar documentos de grande volume.
  • Criar RAG à escala empresarial.
  • Gerir a infraestrutura da base de dados vetorial.
  • Clientes existentes do Pinecone.
  • As atualizações não são refletidas imediatamente.
  • Pode ser mais caro do que outras opções.
  • As quotas e os limites restringem a escala e o desempenho.
  • Controlo limitado sobre a infraestrutura subjacente.
cosine

euclidean

dot-product
ANN Disponível de forma geral

O que se segue?