En este documento, se muestra cómo usar embeddings almacenados para generar índices y consultar embeddings. Para obtener más información sobre el almacenamiento de embeddings, consulta Almacena embeddings de vectores.
Puedes crear índices ScaNN
, IVF
, IVFFlat
y HNSW
con AlloyDB.
Antes de comenzar
Antes de comenzar a crear índices, debes completar los siguientes requisitos previos.
Los vectores de incorporación se agregan a una tabla en tu base de datos de AlloyDB.
Se instaló la versión
0.5.0
o posterior de la extensiónvector
basada enpgvector
, que Google extendió para AlloyDB.CREATE EXTENSION IF NOT EXISTS vector;
Para generar índices
ScaNN
, instala la extensiónalloydb_scann
además de la extensiónvector
.CREATE EXTENSION IF NOT EXISTS alloydb_scann;
Crea un índice
Puedes crear uno de los siguientes tipos de índices para las tablas de tu base de datos.
Crea un índice de ScaNN
AlloyDB alloydb_scann
, una extensión de PostgreSQL desarrollada por Google que implementa un índice de vecinos más cercanos altamente eficiente potenciado por el algoritmo ScaNN.
El índice ScaNN
es un índice de cuantificación basado en un árbol para la búsqueda de vecinos más cercanos aproximados. Proporciona un tiempo de compilación de índice más bajo y una huella de memoria más pequeña en comparación con HNSW
. Además, proporciona una QPS más rápida en comparación con HNSW
según la carga de trabajo.
Índice de árbol ScaNN
de dos niveles
Para aplicar un índice de árbol de dos niveles con el algoritmo ScaNN a una columna que contiene embeddings de vectores almacenadas, ejecuta la siguiente consulta DDL:
CREATE INDEX INDEX_NAME ON TABLE
USING scann (EMBEDDING_COLUMN DISTANCE_FUNCTION)
WITH (num_leaves=NUM_LEAVES_VALUE);
Reemplaza lo siguiente:
INDEX_NAME
: El nombre del índice que deseas crear, por ejemplo,my-scann-index
. Los nombres de los índices se comparten en toda la base de datos. Asegúrate de que cada nombre de índice sea único para cada tabla de tu base de datos.TABLE
: Es la tabla a la que se agregará el índice.EMBEDDING_COLUMN
: Es una columna que almacena datosvector
.DISTANCE_FUNCTION
: Es la función de distancia que se usará con este índice. Elige una de estas opciones:Distancia de L2:
l2
Producto escalar:
dot_product
Distancia de coseno:
cosine
NUM_LEAVES_VALUE
: Es la cantidad de particiones que se aplicarán a este índice. Se puede establecer en cualquier valor entre 1 y 1048576. Para obtener más información sobre cómo decidir este valor, consulta Cómo ajustar un índice deScaNN
.
Índice de árbol ScaNN
de tres niveles
Para crear un índice de árbol de tres niveles con el algoritmo de ScaNN en una columna que contiene embeddings de vectores almacenados, ejecuta la siguiente consulta en DDL:
CREATE INDEX INDEX_NAME ON TABLE
USING scann (EMBEDDING_COLUMN DISTANCE_FUNCTION)
WITH (num_leaves=NUM_LEAVES_VALUE, max_num_levels = MAX_NUM_LEVELS);
Reemplaza lo siguiente:
MAX_NUM_LEVELS
: Es la cantidad máxima de niveles del árbol de agrupamiento de K-means. Se establece en1
(predeterminado) para la cuantificación basada en árboles de dos niveles y en2
para la cuantificación basada en árboles de tres niveles.
Después de crear el índice, puedes ejecutar consultas de búsqueda de vecinos más cercanos que lo utilicen siguiendo las instrucciones en Realiza una consulta de vecino más cercano con texto determinado.
Los parámetros del índice deben establecerse para lograr un equilibrio adecuado entre las QPS y la recuperación. Para obtener más información sobre cómo ajustar el índice ScaNN
, consulta Cómo ajustar un índice ScaNN
.
Para crear este índice en una columna de embedding que use el tipo de datos real[]
en lugar de vector
, convierte la columna en el tipo de datos vector
:
CREATE INDEX INDEX_NAME ON TABLE
USING scann (CAST(EMBEDDING_COLUMN AS vector(DIMENSIONS)) DISTANCE_FUNCTION)
WITH (num_leaves=NUM_LEAVES_VALUE, max_num_levels = MAX_NUM_LEVELS);
Reemplaza DIMENSIONS
por el ancho dimensional de la columna de embedding. Para obtener más información sobre cómo encontrar las dimensiones, consulta la función vector_dims
en Funciones de vectores.
Para ver el progreso de la indexación, usa la vista pg_stat_progress_create_index
:
SELECT * FROM pg_stat_progress_create_index;
La columna phase
muestra el estado actual de la creación del índice, y la fase building index: tree training
desaparece después de que se crea el índice.
Para ajustar tu índice en función de un equilibrio entre la recuperación objetivo y el QPS, consulta Cómo ajustar un índice de ScaNN
.
Analiza tu tabla indexada
Después de crear el índice ScaNN
, debes ejecutar el comando ANALYZE
para actualizar las estadísticas sobre tus datos.
ANALYZE TABLE;
Ejecuta una consulta
Una vez que hayas almacenado y, también, indexado las embeddings en tu base de datos, puedes comenzar a realizar consultas con la funcionalidad de consulta de pgvector
. No puedes ejecutar búsquedas masivas con la extensión alloydb_scann
.
Para encontrar los vecinos semánticos más cercanos a un vector de embedding, puedes ejecutar la siguiente consulta de ejemplo, en la que estableces la misma función de distancia que usaste durante la creación del índice.
SELECT * FROM TABLE
ORDER BY EMBEDDING_COLUMN DISTANCE_FUNCTION_QUERY ['EMBEDDING']
LIMIT ROW_COUNT
Reemplaza lo siguiente:
TABLE
: la tabla que contiene la embedding con la que se compara el texto.INDEX_NAME
: Es el nombre del índice que deseas usar, por ejemplo,my-scann-index
.EMBEDDING_COLUMN
: la columna que contiene las incorporaciones almacenadas.DISTANCE_FUNCTION_QUERY
: Es la función de distancia que se usará con esta consulta. Elige una de las siguientes opciones según la función de distancia que se usó para crear el índice:Distancia de L2:
<->
Producto interno:
<#>
Distancia de coseno:
<=>
EMBEDDING
: Es el vector de incorporación del que deseas encontrar los vecinos semánticos almacenados más cercanos.ROW_COUNT
: cantidad de filas que se mostrarán.Especifica
1
si solo deseas la mejor coincidencia.
Para obtener más información sobre otros ejemplos de consultas, consulta Consultas.
También puedes usar la función embedding()
para traducir el texto a un vector. Aplicas el vector a uno de los operadores de vecino más cercano pgvector
, <->
para la distancia L2, para encontrar las filas de la base de datos con las embeddings semánticamente más similares.
Debido a que embedding()
devuelve un array real
, debes convertir de forma explícita la llamada embedding()
en vector
para usar estos valores con operadores pgvector
.
CREATE EXTENSION IF NOT EXISTS google_ml_integration;
CREATE EXTENSION IF NOT EXISTS vector;
SELECT * FROM TABLE
ORDER BY EMBEDDING_COLUMN::vector
<-> embedding('MODEL_IDVERSION_TAG', 'TEXT')
LIMIT ROW_COUNT
Reemplaza lo siguiente:
MODEL_ID
: el ID del modelo que se consultará.Si usas Vertex AI Model Garden, especifica
text-embedding-005
como el ID del modelo. Estos son los modelos basados en la nube que AlloyDB puede usar para las incorporaciones de texto. Para obtener más información, consulta Incorporaciones de texto.Opcional:
VERSION_TAG
: Es la etiqueta de la versión del modelo que se consultará. Agrega@
a la etiqueta.Si usas uno de los modelos en inglés
text-embedding
con Vertex AI, especifica una de las etiquetas de versión (por ejemplo,text-embedding-005
) que se indican en Versiones del modelo.Google recomienda enfáticamente que siempre especifiques la etiqueta de versión. Si no especificas la etiqueta de versión, AlloyDB siempre usará la versión del modelo más reciente, lo que podría generar resultados inesperados.
TEXT
: es el texto que se traducirá en una embedding de vector.
¿Qué sigue?
- Un ejemplo de flujo de trabajo de embeddings
- Ajusta el rendimiento de las consultas vectoriales
- Métricas del índice de vectores