Esta página apresenta as opções de um banco de dados de vetor com suporte no RAG Engine. Você também pode conferir como conectar um banco de dados vetorial (armazenamento vetorial) ao seu corpus RAG.
Um problema comum com os LLMs é que eles não entendem o conhecimento particular, ou seja, os dados da sua organização. Com o RAG Engine, é possível enriquecer o contexto do LLM com mais informações particulares, porque o modelo pode reduzir a alucinação artificial e responder a perguntas com mais precisão.
Os bancos de dados de vetores desempenham um papel crucial na recuperação de aplicativos de RAG. Os bancos de dados vetoriais oferecem uma maneira especializada de armazenar e consultar embeddings vetoriais, que são representações matemáticas de texto ou outros dados que capturam significado e relações semânticas. As inclusões de vetor permitem que os sistemas de RAG encontrem de forma rápida e precisa as informações mais relevantes em uma vasta base de conhecimento, mesmo ao lidar com consultas complexas ou sutis. Quando combinados com um modelo de inserção, os bancos de dados vetoriais podem ajudar a superar as limitações dos LLMs e fornecer respostas mais precisas, relevantes e abrangentes.
Bancos de dados de vetores com suporte
Ao criar um corpus de RAG, o RAG Engine oferece RagManagedDb
como a escolha
padrão de um banco de dados vetorial, que não requer provisionamento ou
gerenciamento adicional. Para que o RAG Engine crie e gerencie automaticamente o banco de dados de vetores, consulte Criar um corpus
RAG.
Além do RagManagedDb
padrão, o RAG Engine permite provisionar
e trazer seu banco de dados vetorial para uso no corpus de RAG. Nesse caso,
você é responsável pelo ciclo de vida e pela capacidade de escalonamento do banco de dados de vetores.
Comparar opções de banco de dados de vetor
Esta tabela lista as opções de bancos de dados vetoriais com suporte no RAG Engine e fornece links para páginas que explicam como usar os bancos de dados vetoriais no seu corpus RAG.
Para identificar qual banco de dados vetorial atende às suas necessidades, use esta tabela para comparar as opções de banco de dados vetorial:
Banco de dados de vetores | Descrição | Vantagens | Desvantagens | Métricas de distância com suporte no RAG Engine | Tipo de pesquisa | Etapa de lançamento no mecanismo RAG | Pronto para Production | Ideal para |
---|---|---|---|---|---|---|---|---|
RagManagedDb (default) |
O RagManagedDb é um serviço de banco de dados escalonável e distribuído regionalmente que oferece consistência e alta disponibilidade.RagManagedDb pode ser usado para uma pesquisa vetorial.
|
|
|
cosine |
KNN | Visualizar |
|
|
Pinecone (link em inglês) | O Pinecone é um banco de dados de vetores nativo da nuvem totalmente gerenciado, projetado para uma pesquisa de similaridade de alto desempenho. |
|
|
cosine euclidean dot-product |
ANN | Visualizar |
|
|
Weaviate | O Weaviate é um banco de dados vetorial de código aberto com foco em flexibilidade e modularidade. O Weaviate oferece suporte a vários tipos de dados e recursos de gráfico integrados. |
|
|
cosine dot-product L2 squared hamming manhattan |
Suporte para ANN e pesquisa híbrida | Visualizar |
|
|
Vector Search | A Vector Search é o serviço de banco de dados vetorial da Vertex AI. A Vector Search é otimizada para tarefas de machine learning e se integra a outros serviços do Google Cloud. |
|
|
cosine dot-product |
ANN | Visualizar |
|
|
Vertex AI Feature Store | O Feature Store da Vertex AI é um serviço gerenciado para organizar, armazenar e disponibilizar recursos de machine learning. A Feature Store da Vertex AI é otimizada para tarefas de machine learning e se integra a outros serviços do Google Cloud. |
|
|
cosine dot-product L2 squared |
ANN | Visualizar |
|
A seguir
- Para saber mais sobre como escolher modelos de embedding, consulte Usar modelos de embedding com o RAG Engine.
- Para saber mais sobre o RAG Engine, consulte Visão geral do RAG Engine.