La búsqueda vectorial se basa en la tecnología de búsqueda vectorial desarrollada por la investigación de Google. Con la Búsqueda de Vectores, puedes beneficiarte de la misma investigación y tecnología que proporciona una base para los productos de Google, como la Búsqueda de Google, YouTube y Play.
Introducción
La Búsqueda de Vectores puede buscar entre miles de millones de elementos similares o relacionados de manera semántica. Los servicios de coincidencia de similitud de vectores tienen muchos casos de uso, como la implementación de motores de recomendaciones, motores de búsqueda, chatbots y clasificación de texto.
Un caso de uso posible para Búsqueda de Vectores es un minorista en línea que tiene un inventario de cientos de miles de artículos de ropa. En esta situación, la API de incorporaciones multimodales podría ayudar a crear incorporaciones de estos elementos y usar la Búsqueda de Vectores para que coincidan con las consultas de texto a las imágenes más semánticamente similares. Por ejemplo, pueden buscar “vestido de verano amarillo” y, luego, la Búsqueda de Vectores devolverá y mostrará los elementos más similares. La Búsqueda de Vectores puede buscar a gran escala, con consultas por segundo (QPS) altas, recuperación alta, latencia baja y rentabilidad.
El uso de incorporaciones no se limita a palabras o texto. Puedes generar incorporaciones semánticas para muchos tipos de datos, incluidas imágenes, audio, video y preferencias del usuario.
Para generar una incorporación multimodal con Vertex AI, consulta Obtén incorporaciones multimodales.
Cómo usar la Búsqueda de Vectores para coincidencias semánticas
La coincidencia semántica se puede simplificar en pocos pasos. Primero, debes generar representaciones de incorporación de muchos elementos (que se realizan fuera de la Búsqueda de Vectores). En segundo lugar, debes subir tus incorporaciones a Google Cloud y, luego, vincular los datos a la Búsqueda de Vectores. Después de agregar tus incorporaciones a la Búsqueda de Vectores, puedes crear un índice para ejecutar consultas a fin de obtener recomendaciones o resultados.
Genera una incorporación
Genera una incorporación para tu conjunto de datos. Esto implica el procesamiento previo de los datos de una manera que facilita la búsqueda de vecinos más cercanos aproximados (ANN). Puedes hacerlo fuera de Vertex AI o puedes usar la IA generativa en Vertex AI para crear una incorporación. Con la IA generativa en Vertex AI, puedes crear incorporaciones de texto y multimodales.
Agrega tu incorporación a Cloud Storage
Sube tu incorporación a Cloud Storage para que puedas llamarla desde el servicio de Búsqueda de Vectores.
Subir a la Búsqueda de Vectores
Conecta tus incorporaciones a la Búsqueda de Vectores para realizar la búsqueda de vecino más cercano. Crea un índice a partir de tu incorporación, que puedes implementar en un extremo de índice para consultar. La consulta muestra los vecinos más cercanos aproximados.
Para crear un índice, consulta Administra índices.
Para implementar tu índice en un extremo, consulta Implementa y administra extremos de índice.
Evalúe los resultados
Después de tener los resultados del vecino más cercano aproximado, puedes evaluarlos para ver qué tan bien satisfacen tus necesidades. Si los resultados no son lo suficientemente precisos, puedes ajustar los parámetros del algoritmo o habilitar el escalamiento para admitir más consultas por segundo. Para ello, actualiza el archivo de configuración, que configura el índice. Para obtener más información, consulta Configura parámetros de índice.
Terminología de Búsqueda de Vectores
En esta lista, se incluye terminología importante que deberás comprender para usar Vector Search:
- Vectores: Un vector es una lista de valores de números de punto flotante que tienen magnitud y dirección. Se puede usar para representar cualquier tipo de datos, como números, puntos en el espacio y direcciones.
- Incorporación: una incorporación es un tipo de vector que se usa para representar datos de una manera que captura su significado semántico. Por lo general, las incorporaciones se crean con técnicas de aprendizaje automático y, a menudo, se usan en el procesamiento de lenguaje natural (PLN) y otras aplicaciones de aprendizaje automático.
- Embeddings densos: Los embeddings densos representan el significado semántico del texto con arrays que contienen principalmente valores distintos de cero. Con embeddings densos, se pueden mostrar resultados de búsqueda similares en función de la similitud semántica.
- Embeddings dispersos: Los embeddings dispersos representan la sintaxis de texto con arrays de alta dimensión que contienen muy pocos valores distintos de cero en comparación con los embeddings densos. Los embeddings dispersos suelen usarse para las búsquedas de palabras clave.
- Búsqueda híbrida: La búsqueda híbrida usa embeddings densos y dispersos, lo que te permite realizar búsquedas basadas en una combinación de búsqueda de palabras clave y búsqueda semántica. La búsqueda vectorial admite la búsqueda basada en embeddings densos. Como funciones de vista preliminar pública, la búsqueda vectorial admite embeddings dispersos y la búsqueda híbrida.
- índice: es una colección de vectores implementados juntos para la búsqueda de similitud. Los vectores pueden agregarse a un índice o quitarse de este. Las consultas de búsqueda de similitud se emiten a un índice específico y buscan los vectores en ese índice.
- Verdad fundamental: Un término que se refiere a la verificación del aprendizaje automático para la exactitud en el mundo real, como un conjunto de datos de verdad fundamental.
Recuperación: Es el porcentaje de vecinos más cercanos que muestra el índice que en realidad son vecinos más cercanos. Por ejemplo, si una consulta de vecino más cercano a 20 vecinos más cercanos mostró 19 de los vecinos más cercanos de “verdad fundamental”, la recuperación será 19/20*100 = 95%.
Restringir: La funcionalidad que limita las búsquedas a un subconjunto del índice mediante reglas booleanas. La restricción también se conoce como “filtrado”. Con Vector Search, puedes usar el filtrado numérico y el filtrado de atributos de texto.
¿Qué sigue?
- Comienza en menos de una hora con la guía de inicio rápido de Vector Search.
- Consulta los requisitos previos y las incorporaciones en Antes de comenzar
- Aprende a configurar el formato y la estructura de los datos de entrada.
- Consulta otros instructivos de notebooks de Búsqueda de Vectores en la Descripción general de instructivos
- Obtén más información sobre cómo exportar incorporaciones de Spanner a Búsqueda de vectores