pg_stat_ann_indexes
que está disponible cuando instalas la extensión alloydb_scann
.
Para obtener más información sobre cómo ver las métricas, consulta Cómo ver las métricas del índice vectorial.
Métricas de usabilidad
Las métricas de usabilidad incluyen métricas que te ayudan a comprender el estado de la utilización del índice, como la configuración del índice y la cantidad de análisis del índice.
Nombre de la métrica | Tipo de datos | Descripción |
---|---|---|
relid |
OID |
Identificador único de la tabla que contiene el índice de vectores |
indexrelid |
OID |
Identificador único del índice de vectores |
schemaname |
NAME |
Nombre del esquema propietario del índice |
relname |
NAME |
Nombre de la tabla que contiene el índice |
indexrelname |
NAME |
Nombre del índice |
indextype |
NAME |
Es el tipo de índice. Este valor siempre se establece en alloydb_scann . |
indexconfig |
TEXT[] |
Es la configuración, como el recuento de hojas y el cuantificador, que se definió para el índice cuando se creó. |
indexsize |
TEXT |
Tamaño del índice |
indexscan |
BIGINT |
Cantidad de análisis de índice iniciados en el índice |
partitioncount |
BIGINT |
Es la cantidad de particiones (nodos hoja) en el árbol. |
Métricas de ajuste
Las métricas de ajuste proporcionan estadísticas sobre la optimización actual del índice, lo que te permite aplicar recomendaciones para mejorar el rendimiento de las consultas.
Nombre de la métrica | Tipo de datos | Descripción |
---|---|---|
insertcount |
BIGINT |
Cantidad de operaciones de inserción en el índice. Esta métrica también incluye la cantidad de filas que existían antes de que se creara el índice. |
updatecount |
BIGINT |
Cantidad de operaciones de actualización en el índice. Esta métrica no tiene en cuenta las actualizaciones de HOT. |
deletecount |
BIGINT |
Cantidad de operaciones de eliminación en el índice. |
distribution |
JSONB |
Son las distribuciones de vectores en todas las particiones del índice. En los siguientes campos, se muestra la distribución:
Nota: Debido a las características inherentes del algoritmo de agrupamiento K-means, siempre habrá cierto grado de varianza en la distribución de los vectores en las particiones, incluso cuando se cree el índice inicialmente. |
Ajuste de la recomendación según las métricas
- Mutación
- Las métricas
insertcount
,updatecount
ydeletecount
juntas muestran los cambios o las mutaciones en el vector del índice. - El índice se crea con una cantidad específica de vectores y particiones. Cuando se realizan operaciones como insertar, actualizar o borrar en el índice de vectores, solo se ven afectadas las particiones iniciales en las que residen los vectores. Por lo tanto, la cantidad de vectores en cada partición fluctúa con el tiempo, lo que puede afectar la recuperación, las QPS o ambas.
- Si, con el tiempo, tienes problemas de lentitud o precisión, como un QPS bajo o una recuperación deficiente, en tus búsquedas de ANN, considera revisar estas métricas. Una gran cantidad de mutaciones en relación con la cantidad total de vectores podría indicar la necesidad de volver a indexar.
- Distribución
- La métrica
distribution
muestra las distribuciones de vectores en todas las particiones. - Cuando creas un índice, este se crea con una cantidad específica de vectores y particiones fijas. El proceso de partición y la distribución posterior se realizan en función de esta consideración. Si se agregan vectores adicionales, se particionan entre las particiones existentes, lo que genera una distribución diferente en comparación con la distribución cuando se creó el índice. Dado que la distribución final no considera todos los vectores de forma simultánea, es posible que se vean afectados el recall, las QPS o ambos.
- Si observas una disminución gradual en el rendimiento de tus búsquedas de ANN, como tiempos de respuesta más lentos o menor precisión en los resultados (medidos por QPS o recuperación), considera revisar esta métrica y volver a indexar.