Métricas do índice vetorial

Esta página lista as métricas relacionadas aos índices de vetores gerados no AlloyDB Omni. É possível conferir essas métricas usando a visualização pg_stat_ann_indexes, disponível quando você instala a extensão alloydb_scann.

Para mais informações sobre como conferir as métricas, consulte Conferir métricas de índice vetorial.

Métricas de usabilidade

As métricas de usabilidade incluem métricas que ajudam a entender o estado da utilização do índice com métricas, como configuração do índice e número de verificações de índice.

Nome da métrica Tipo de dado Descrição
relid OID Identificador exclusivo da tabela que contém o índice vetorial
indexrelid OID Identificador exclusivo do índice vetorial
schemaname NAME Nome do esquema proprietário do índice
relname NAME Nome da tabela que contém o índice
indexrelname NAME Nome do índice
indextype NAME Tipo do índice. Esse valor é sempre definido como alloydb_scann
indexconfig TEXT[] Configuração, como contagem de folhas e quantizador, definida para o índice quando ele foi criado
indexsize TEXT Tamanho do índice
indexscan BIGINT Número de verificações de índice iniciadas no índice
partitioncount BIGINT Número de partições (nós folha) na árvore.

Métricas de ajuste

As métricas de ajuste oferecem insights sobre a otimização de índice atual, permitindo que você aplique recomendações para melhorar a performance das consultas.

Nome da métrica Tipo de dado Descrição
insertcount BIGINT Número de operações de inserção no índice. Essa métrica também inclui o número de linhas que existiam antes da criação do índice.
updatecount BIGINT Número de operações de atualização no índice. Essa métrica não considera atualizações HOT.
deletecount BIGINT Número de operações de exclusão no índice.
distribution JSONB Distribuições de vetores em todas as partições do índice.

Os seguintes campos mostram a distribuição:
  • maximum (INT8): número máximo de vetores em todas as partições.
  • minimum (INT8): número mínimo de vetores em todas as partições.
  • average (FLOAT) : número médio de vetores em todas as partições.
  • outliers (INT8[]): outliers principais em todas as partições. Esse valor mostra os 20 principais outliers.

Observação:devido às características inerentes do algoritmo de clusterização K-means, sempre haverá algum grau de variância na distribuição de vetores entre as partições, mesmo quando o índice é criado inicialmente.

Recomendação de ajuste com base nas métricas

Mutação
As métricas insertcount, updatecount e deletecount mostram juntas as mudanças ou mutações no vetor do índice.
O índice é criado com um número específico de vetores e partições. Quando operações como inserção, atualização ou exclusão são realizadas no índice de vetor, elas afetam apenas o conjunto inicial de partições em que os vetores residem. Como resultado, o número de vetores em cada partição varia com o tempo, o que pode afetar o recall, o QPS ou ambos.
Se você encontrar problemas de lentidão ou precisão, como QPS baixo ou recall ruim, nas suas consultas de pesquisa de ANN ao longo do tempo, revise essas métricas. Um número alto de mutações em relação ao número total de vetores pode indicar a necessidade de reindexação.
Distribuição
A métrica distribution mostra as distribuições de vetores em todas as partições.
Quando você cria um índice, ele é criado com um número específico de vetores e partições fixas. O processo de particionamento e a distribuição subsequente ocorrem com base nessa consideração. Se outros vetores forem adicionados, eles serão particionados entre as partições atuais, resultando em uma distribuição diferente em comparação com a distribuição quando o índice foi criado. Como a distribuição final não considera todos os vetores simultaneamente, o recall, o QPS ou ambos podem ser afetados.
Se você notar um declínio gradual na performance das suas consultas de pesquisa de rede neural artificial, como tempos de resposta mais lentos ou redução na acurácia dos resultados (medida por QPS ou recall), verifique essa métrica e faça a reindexação.