Esta página apresenta as bases de dados vetoriais suportadas no Vertex AI RAG Engine. Também pode ver como associar uma base de dados vetorial (armazenamento de vetores) ao seu corpus de RAG.
As bases de dados vetoriais desempenham um papel crucial na ativação da obtenção para aplicações RAG. As bases de dados vetoriais oferecem uma forma especializada de armazenar e consultar incorporações vetoriais, que são representações matemáticas de texto ou outros dados que captam o significado semântico e as relações. As incorporações vetoriais permitem que os sistemas RAG encontrem rapidamente e com precisão as informações mais relevantes numa vasta base de conhecimentos, mesmo quando lidam com consultas complexas ou com nuances. Quando combinadas com um modelo de incorporação, as bases de dados vetoriais podem ajudar a superar as limitações dos GMLs e fornecer respostas mais precisas, relevantes e abrangentes.
Bases de dados vetoriais suportadas
Ao criar um corpus RAG, o motor RAG da Vertex AI oferece o RagManagedDb
pronto para a empresa como a base de dados vetorial predefinida, que não requer aprovisionamento nem gestão adicionais.
A RagManagedDb
oferece opções de pesquisa KNN e ANN e
permite mudar para um nível básico para uma prototipagem e experimentação rápidas.
Para saber mais sobre como escolher uma estratégia de obtenção no RagManagedDb
ou para atualizar o nível, consulte Use o RagManagedDb
com a RAG. Para que o motor RAG da Vertex AI crie e faça a gestão automaticamente da base de dados vetorial, consulte o artigo Crie um corpus RAG.
Além da RagManagedDb
predefinida, o Vertex AI RAG Engine
permite aprovisionar e usar a sua base de dados vetorial no seu corpus RAG. Neste caso, é responsável pelo ciclo de vida e pela escalabilidade da sua base de dados de vetores.
Compare opções de bases de dados vetoriais
Esta tabela apresenta as suas opções de bases de dados vetoriais suportadas no motor RAG do Vertex AI e fornece links para páginas que explicam como usar as bases de dados vetoriais no seu corpus RAG.
Base de dados vetorial | Vantagens | Ideal para | Desvantagens | Métricas de distância suportadas | Tipo de pesquisa | Fase de lançamento |
---|---|---|---|---|---|---|
RagManagedDb (predefinição) é um serviço de base de dados escalável distribuído regionalmente que oferece uma consistência muito elevada e uma elevada disponibilidade, e que pode ser usado para uma pesquisa vetorial.
fácil simples rápido |
|
|
|
cosine |
KNN (predefinição) e ANN | Disponível de forma geral |
A pesquisa vetorial é o serviço de base de dados vetorial no Vertex AI otimizado para tarefas de aprendizagem automática. |
|
|
|
cosine dot-product |
ANN | Disponível de forma geral |
O Vertex AI Feature Store é um serviço gerido para organizar, armazenar e publicar funcionalidades de aprendizagem automática. |
|
|
|
cosine dot-product L2 squared |
ANN | Pré-visualização |
Weaviate é uma base de dados de vetores de código aberto flexível e modular. |
|
|
|
cosine dot-product L2 squared hamming manhattan |
ANN + Hybrid search support | Pré-visualização |
Pinecone é uma base de dados vetorial nativa da nuvem totalmente gerida, concebida para uma pesquisa de similaridade de elevado desempenho. |
|
|
|
cosine euclidean dot-product |
ANN | Disponível de forma geral |
O que se segue?
- Para criar um corpus RAG, consulte o exemplo de criação de um corpus RAG.
- Para listar todos os conjuntos de dados RAG, consulte o exemplo de como listar conjuntos de dados RAG.