Présentation de Vertex AI Vector Search

Vector Search est basé sur la technologie de recherche vectorielle développée par Google Research. Il vous permet d'exploiter l'infrastructure qui est à la base des produits Google, tels que la recherche Google, YouTube et Play.

Introduction

Vector Search peut effectuer des recherches à partir de milliards d'éléments sémantiquement similaires ou présentant des relations sémantiques. Un service de mise en correspondance des similarités vectorielles présente de nombreux cas d'utilisation tels que l'implémentation de moteurs de recommandations, de moteurs de recherche, de chatbots et de classification de texte.

Requête concernant des robes

Voici un cas d'utilisation possible de Vector Search : un marchand en ligne qui dispose d'un inventaire de centaines de milliers d'articles vestimentaires. Dans ce scénario, l'API de représentations vectorielles continues multimodales peut l'aider à créer des représentations vectorielles continues de ces articles et utiliser Vector Search pour les mettre en correspondance avec des requêtes textuelles sur les images les plus sémantiquement similaires. Par exemple, il peut rechercher "robe d'été jaune", puis Vector Search affiche les articles les plus similaires. Vector Search peut effectuer des recherches à grande échelle, avec un nombre élevé de requêtes par seconde (RPS), un taux de rappel élevé, une faible latence et une meilleure rentabilité.

L'utilisation de représentations vectorielles continues ne se limite pas aux mots ou au texte. Vous pouvez générer des représentations vectorielles continues sémantiques pour de nombreux types de données, y compris des images, des sons, des vidéos ou des préférences utilisateur. Pour générer une représentation vectorielle continue multimodale avec Vertex AI, consultez la page Obtenir des représentations vectorielles continues multimodales.

Utiliser Vector Search pour la mise en correspondance sémantique

La mise en correspondance sémantique peut être simplifiée en quelques étapes. Tout d'abord, vous devez générer des représentations vectorielles continues de nombreux éléments (en dehors de Vector Search). Ensuite, vous importez vos représentations vectorielles continues dans Google Cloud, puis vous associez vos données à Vector Search. Une fois vos représentations vectorielles continues ajoutées à Vector Search, vous pouvez créer un index pour exécuter des requêtes afin d'obtenir des recommandations ou des résultats.

Générer une représentation vectorielle continue

Générez une représentation vectorielle continue pour votre ensemble de données. Cela implique de prétraiter les données de manière à faciliter la recherche des voisins approximatifs les plus proches (ANN). Vous pouvez le faire en dehors de Vertex AI ou utiliser l'IA générative sur Vertex AI pour créer une représentation vectorielle continue. L'IA générative sur Vertex AI vous permet de créer des représentations vectorielles continues de texte et multimodales.

Ajouter une représentation vectorielle continue à Cloud Storage

Importez votre représentation vectorielle continue dans Cloud Storage afin de pouvoir l'appeler depuis le service Vector Search.

Effectuer une importation dans Vector Search

Associez vos représentations vectorielles continues à Vector Search pour effectuer une recherche des plus proches voisins. Vous devez créer un index à partir de votre représentation vectorielle continue que vous pouvez déployer sur un point de terminaison d'index de manière à l'interroger. La requête renvoie les voisins approximatifs les plus proches. Pour créer un index, consultez la page Gérer les index. Pour déployer votre index sur un point de terminaison, consultez la page Déployer et gérer des points de terminaison d'index.

Évaluer les résultats

Une fois que vous avez obtenu les résultats des voisins approximatifs les plus proches, vous pouvez les évaluer pour voir dans quelle mesure ils répondent à vos besoins. Si les résultats ne sont pas suffisamment précis, vous pouvez ajuster les paramètres de l'algorithme ou activer le scaling pour accepter un plus grand nombre de requêtes par seconde. Pour ce faire, mettez à jour le fichier de configuration dans lequel votre index est défini. Pour en savoir plus, consultez Configurer les paramètres d'index.

Terminologie de Vector Search

Cette liste contient certains termes clés que vous devez comprendre pour utiliser Vector Search :

  • Vecteur : un vecteur est une liste de valeurs flottantes ayant une magnitude et une direction. Il permet de représenter n'importe quel type de données, comme des nombres, des points dans l'espace et des directions.
  • Représentation vectorielle continue : une représentation vectorielle continue est un type de vecteur utilisé pour représenter les données de manière à capturer leur signification sémantique. Les représentations vectorielles continues sont généralement créées à l'aide de techniques de machine learning et sont souvent utilisées dans le traitement du langage naturel (TLN) et d'autres applications de machine learning.
  • Index : ensemble de vecteurs déployés pour la recherche de similarités. Les vecteurs peuvent être ajoutés à un index ou supprimés de celui-ci. Les requêtes de recherche de similarités sont émises sur un index spécifique et recherchent les vecteurs de cet index.
  • Vérité terrain : terme faisant référence à la vérification de l'exactitude du machine learning par rapport au monde réel (par exemple, un ensemble de données de vérité terrain).
  • Rappel : pourcentage de voisins les plus proches renvoyés par l'index qui sont de vrais voisins les plus proches. Par exemple, si une requête de 20 voisins les plus proches renvoie un résultat de 19 voisins les plus proches de "vérité terrain", le rappel est de 19 / 20 x 100 = 95 %.

  • Restreindre : fonctionnalité qui limite les recherches à un sous-ensemble de l'index à l'aide de règles booléennes. La restriction est également appelée "filtrage". Vector Search vous permet d'utiliser le filtrage numérique et le filtrage des attributs de texte.

Étapes suivantes