Escolha um índice vetorial

Selecione uma versão da documentação:

Esta página descreve as estratégias de pesquisa vetorial de IA do AlloyDB e explica quando usar cada estratégia. Por predefinição, o AlloyDB usa a pesquisa de k-vizinhos mais próximos (KNN) para encontrar vetores semelhantes a uma consulta. Os índices vetoriais implementam uma estratégia de pesquisa denominada vizinho mais próximo aproximado (ANN). Quando cria um índice vetorial, a IA do AlloyDB usa ANN, que oferece um melhor desempenho do que KNN. Tenha em atenção que, quando seleciona um índice vetorial, tem de equilibrar a latência da consulta e a recordação.

A recolha mede a eficácia com que uma pesquisa obtém todos os itens relevantes para uma determinada consulta. Por exemplo, imagine que tem 100 incorporações, cada uma a representar uma entidade na sua base de dados. Consulta as suas incorporações com um vetor de destino e limita-o a 10 resultados. Uma pesquisa de vetores KNN encontra os 10 vetores mais próximos exatos através de um método de cálculo de força bruta, o que resulta numa taxa de recolha de 100%. O AlloyDB AI usa este método por predefinição se não for criado nem escolhido um índice de pesquisa vetorial. Quando cria um índice vetorial no AlloyDB for PostgreSQL, este usa normalmente a ANN, que pode particionar vetores de acordo com a semelhança para facilitar uma obtenção mais rápida. Como resultado, ao usar a ANN, os 10 vetores devolvidos no exemplo anterior podem não ser exatamente os 10 vetores mais próximos em termos de distância. Se apenas 8 dos 10 vetores obtidos forem os mais próximos no espaço do vetor de consulta, a sua capacidade de memorização é de 80%.

A latência da consulta define a rapidez com que os resultados da pesquisa são gerados. Por exemplo, a latência é calculada com base no tempo gasto numa pesquisa para devolver os vetores depois de enviar uma consulta.

Escolha a sua estratégia de pesquisa

Quando faz uma pesquisa vetorial no AlloyDB, escolha uma das seguintes estratégias de pesquisa:

Estratégia de pesquisa Descrição Exemplos de utilização
K-vizinhos mais próximos (KNN) Um algoritmo que encontra os pontos de dados dos k vizinhos mais próximos de um determinado ponto de dados de consulta. Quando realiza uma pesquisa vetorial sem criar um índice, é realizada uma pesquisa KNN por predefinição.
  • A sua aplicação é muito sensível à precisão e precisa das correspondências mais próximas exatas.
  • Tem menos de 100 000 vetores.
Vizinhos mais próximos aproximados (ANN) Um algoritmo que encontra aproximadamente os pontos de dados mais próximos. A RAA divide os pontos de dados de clientes existentes em pequenos grupos com base em semelhanças.
  • A sua aplicação requer uma latência baixa.
  • Ter mais de 100 000 vetores.

A Google recomenda que crie um índice vetorial para otimizar o desempenho das suas consultas de pesquisa vetorial. Para mais informações sobre como o índice ANN é usado para pesquisas de similaridade, consulte o artigo Crie índices e consulte vetores com o ScaNN.

O que se segue?