En este documento se describe cómo ajustar los índices para conseguir un rendimiento de las consultas más rápido y una mejor recuperación en AlloyDB Omni.
Ajustar un índice de IVF
Ajustar los valores que definas para los parámetros lists
, ivf.probes
y quantizer
puede ayudarte a optimizar el rendimiento de tu aplicación:
Parámetro de ajuste | Descripción | Tipo de parámetro |
---|---|---|
lists |
Número de listas creadas durante la creación del índice. El punto de partida para definir este valor es (rows)/1000 para un máximo de un millón de filas y sqrt(rows) para más de un millón de filas. |
Creación de índices |
quantizer |
El tipo de cuantificador que quieras usar para el árbol de K-means. El valor predeterminado es SQ8 para mejorar el rendimiento de las consultas. Ponlo a FLAT para recordar mejor. |
Creación de índices |
ivf.probes |
el número de listas más cercanas que se pueden explorar durante la búsqueda. El punto de partida de este valor es sqrt(lists) . |
Tiempo de ejecución de la consulta |
En el siguiente ejemplo se muestra un índice IVF
con los parámetros de ajuste definidos:
SET LOCAL ivf.probes = 10;
CREATE INDEX my-ivf-index ON my-table
USING ivf (vector_column cosine)
WITH (lists = 100, quantizer = 'SQ8');
Analizar las consultas
Usa el comando EXPLAIN ANALYZE
para analizar las estadísticas de tus consultas, tal como se muestra en la siguiente consulta SQL de ejemplo.
EXPLAIN ANALYZE SELECT result-column
FROM my-table
ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
LIMIT 1;
La respuesta de ejemplo QUERY PLAN
incluye información como el tiempo empleado, el número de filas analizadas o devueltas y los recursos utilizados.
Limit (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
-> Index Scan using my-scann-index on my-table (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms
Ver métricas de índice vectorial
Puede usar las métricas de índice vectorial para revisar el rendimiento de su índice vectorial, identificar áreas de mejora y ajustar su índice en función de las métricas, si es necesario.
Para ver todas las métricas del índice vectorial, ejecuta la siguiente consulta SQL, que usa la vista
pg_stat_ann_indexes
:
SELECT * FROM pg_stat_ann_indexes;
Para obtener más información sobre la lista completa de métricas, consulta el artículo Métricas del índice de Vector.