A recolha mede a eficácia com que uma pesquisa obtém todos os itens relevantes para uma determinada consulta. Por exemplo, imagine que tem 100 incorporações, cada uma a representar uma entidade na sua base de dados. Consulta as suas incorporações com um vetor de destino e limita-o a 10 resultados. Uma pesquisa de vetores KNN encontra os 10 vetores mais próximos exatos através de um método de cálculo de força bruta, o que resulta numa taxa de recolha de 100%. O AlloyDB AI usa este método por predefinição se não for criado nem escolhido um índice de pesquisa vetorial. Quando cria um índice vetorial no AlloyDB for PostgreSQL, este usa normalmente a ANN, que pode particionar vetores de acordo com a semelhança para facilitar uma obtenção mais rápida. Como resultado, ao usar a ANN, os 10 vetores devolvidos no exemplo anterior podem não ser exatamente os 10 vetores mais próximos em termos de distância. Se apenas 8 dos 10 vetores obtidos forem os mais próximos no espaço do vetor de consulta, a sua capacidade de memorização é de 80%.
A latência da consulta define a rapidez com que os resultados da pesquisa são gerados. Por exemplo, a latência é calculada com base no tempo gasto numa pesquisa para devolver os vetores depois de enviar uma consulta.
Escolha a sua estratégia de pesquisa
Quando faz uma pesquisa vetorial no AlloyDB, escolha uma das seguintes estratégias de pesquisa:
Estratégia de pesquisa | Descrição | Exemplos de utilização |
K-vizinhos mais próximos (KNN) | Um algoritmo que encontra os pontos de dados dos k vizinhos mais próximos de um determinado ponto de dados de consulta. Quando realiza uma pesquisa vetorial sem criar um índice, é realizada uma pesquisa KNN por predefinição. |
|
Vizinhos mais próximos aproximados (ANN) | Um algoritmo que encontra aproximadamente os pontos de dados mais próximos. A RAA divide os pontos de dados de clientes existentes em pequenos grupos com base em semelhanças. |
|
A Google recomenda que crie um índice vetorial para otimizar o desempenho das suas consultas de pesquisa vetorial. Para mais informações sobre como o índice ANN é usado para pesquisas de similaridade, consulte o artigo Crie índices e consulte vetores com o ScaNN.