La cobertura mide la eficacia con la que una búsqueda recupera todos los elementos relevantes para una consulta determinada. Por ejemplo, imagina que tienes 100 inserciones, cada una de las cuales representa una entidad de tu base de datos. Consultas tus inserciones con un vector de destino y lo limitas a 10 resultados. Una búsqueda vectorial KNN encuentra los 10 vectores más cercanos exactos mediante un método de cálculo de fuerza bruta, lo que da como resultado un recuerdo del 100 %. AlloyDB AI usa este método de forma predeterminada si no se crea o elige ningún índice de búsqueda de vectores. Cuando creas un índice vectorial en AlloyDB para PostgreSQL, normalmente se usa ANN, que puede particionar vectores según su similitud para facilitar la recuperación más rápida. Por lo tanto, al usar ANN, es posible que los 10 vectores devueltos en el ejemplo anterior no sean exactamente los 10 vectores más cercanos. Si solo 8 de los 10 vectores recuperados son los más cercanos en el espacio a tu vector de consulta, tu recall será del 80%.
La latencia de las consultas define la rapidez con la que se generan los resultados de búsqueda. Por ejemplo, la latencia se calcula en función del tiempo que se tarda en realizar una búsqueda para devolver los vectores después de enviar una consulta.
Elige tu estrategia de búsqueda
Cuando realices una búsqueda de vectores en AlloyDB, elige una de las siguientes estrategias de búsqueda:
Estrategia de búsqueda | Descripción | Casos prácticos |
Vecinos más cercanos (KNN) | Algoritmo que busca los k puntos de datos más cercanos a un punto de datos de consulta determinado. Cuando realizas una búsqueda vectorial sin crear un índice, se lleva a cabo una búsqueda de los k vecinos más cercanos de forma predeterminada. |
|
Vecinos más cercanos aproximados (ANN) | Algoritmo que busca los puntos de datos más cercanos. Las RNA dividen los puntos de datos de los clientes en grupos pequeños en función de las similitudes. |
|
Google recomienda que crees un índice vectorial para optimizar el rendimiento de tus consultas de búsqueda vectorial. Para obtener más información sobre cómo se usa el índice ANN en las búsquedas de similitud, consulta Crear índices y consultar vectores con ScaNN.