Descripción general de Búsqueda de Vectores de Vertex AI

La búsqueda vectorial se basa en la tecnología de búsqueda vectorial desarrollada por la investigación de Google. Con Búsqueda de Vectores, puedes aprovechar la misma infraestructura que proporciona una base para los productos de Google, como la Búsqueda de Google, YouTube y Play.

Introducción

La Búsqueda de Vectores puede buscar entre miles de millones de elementos similares o relacionados de manera semántica. Un servicio de coincidencia de similitud vectorial tiene muchos casos de uso, como la implementación de motores de recomendaciones, los motores de búsqueda, los chatbots y la clasificación de texto.

Consulta sobre el vestido

Un caso de uso posible para Búsqueda de Vectores es un minorista en línea que tiene un inventario de cientos de miles de artículos de ropa. En esta situación, la API de incorporaciones multimodales podría ayudar a crear incorporaciones de estos elementos y usar la Búsqueda de Vectores para que coincidan con las consultas de texto a las imágenes más semánticamente similares. Por ejemplo, pueden buscar “vestido de verano amarillo” y, luego, la Búsqueda de Vectores devolverá y mostrará los elementos más similares. La Búsqueda de Vectores puede buscar a gran escala, con consultas por segundo (QPS) altas, recuperación alta, latencia baja y rentabilidad.

El uso de incorporaciones no se limita a palabras o texto. Puedes generar incorporaciones semánticas para muchos tipos de datos, incluidas imágenes, audio, video y preferencias del usuario. Para generar una incorporación multimodal con Vertex AI, consulta Obtén incorporaciones multimodales.

Cómo usar la Búsqueda de Vectores para coincidencias semánticas

La coincidencia semántica se puede simplificar en unos pocos pasos. Primero, debes generar representaciones de incorporación de muchos elementos (que se realizan fuera de la Búsqueda de Vectores). En segundo lugar, debes subir tus incorporaciones a Google Cloud y, luego, vincular los datos a la Búsqueda de Vectores. Después de agregar tus incorporaciones a la Búsqueda de Vectores, puedes crear un índice para ejecutar consultas a fin de obtener recomendaciones o resultados.

Genera una incorporación

Genera una incorporación para tu conjunto de datos. Esto implica el procesamiento previo de los datos de una manera que facilita la búsqueda de vecinos más cercanos aproximados (ANN). Puedes hacerlo fuera de Vertex AI o puedes usar la IA generativa en Vertex AI para crear una incorporación. Con la IA generativa en Vertex AI, puedes crear incorporaciones de texto y multimodales.

Agrega tu incorporación a Cloud Storage

Sube tu incorporación a Cloud Storage para que puedas llamarla desde el servicio de Búsqueda de Vectores.

Subir a la Búsqueda de Vectores

Conecta tus incorporaciones a la Búsqueda de Vectores para realizar la búsqueda de vecino más cercano. Crea un índice a partir de tu incorporación, que puedes implementar en un extremo de índice para consultar. La consulta muestra los vecinos más cercanos aproximados. Para crear un índice, consulta Administra índices. Para implementar tu índice en un extremo, consulta Implementa y administra extremos de índice.

Evalúe los resultados

Después de tener los resultados del vecino más cercano aproximado, puedes evaluarlos para ver qué tan bien satisfacen tus necesidades. Si los resultados no son lo suficientemente precisos, puedes ajustar los parámetros del algoritmo o habilitar el escalamiento para admitir más consultas por segundo. Para ello, actualiza el archivo de configuración, que configura el índice. Para obtener más información, consulta Configura parámetros de índice.

Terminología de Búsqueda de Vectores

En esta lista, se incluye terminología importante que deberás comprender para usar Vector Search:

  • Vectores: Un vector es una lista de valores de números de punto flotante que tienen magnitud y dirección. Se puede usar para representar cualquier tipo de datos, como números, puntos en el espacio y direcciones.
  • Incorporación: una incorporación es un tipo de vector que se usa para representar datos de una manera que captura su significado semántico. Por lo general, las incorporaciones se crean con técnicas de aprendizaje automático y, a menudo, se usan en el procesamiento de lenguaje natural (PLN) y otras aplicaciones de aprendizaje automático.
  • índice: es una colección de vectores implementados juntos para la búsqueda de similitud. Los vectores pueden agregarse o quitarse de un índice. Las consultas de búsqueda de similitud se emiten a un índice específico y buscan los vectores en ese índice.
  • Verdad fundamental: Un término que se refiere a la verificación del aprendizaje automático para la exactitud en el mundo real, como un conjunto de datos de verdad fundamental.
  • Recuperación: Es el porcentaje de vecinos más cercanos que muestra el índice que en realidad son vecinos más cercanos. Por ejemplo, si una consulta de vecino más cercano a 20 vecinos más cercanos mostró 19 de los vecinos más cercanos de “verdad fundamental”, la recuperación será 19/20*100 = 95%.

  • Restringir: La funcionalidad que limita las búsquedas a un subconjunto del índice mediante reglas booleanas. La restricción también se conoce como “filtrado”. Con la búsqueda vectorial, puedes usar el filtrado numérico y el filtrado de atributos de texto.

¿Qué sigue?