Découvrez la puissance de la technologie de recherche vectorielle de pointe avec la démonstration interactive de Vector Search. S'appuyant sur des ensembles de données réels, la démonstration fournit un exemple réaliste qui vous aidera à comprendre le fonctionnement de la recherche vectorielle, à explorer la recherche sémantique et hybride, et à voir le reclassement en action. Envoyez une brève description d'un animal, d'une plante, d'un produit d'e-commerce ou d'un autre article, et laissez la recherche vectorielle faire le reste.
Essayer
Testez les différentes options de la démonstration pour prendre une longueur d'avance sur la recherche vectorielle et comprendre les principes de base de cette technologie.
Pour exécuter:
Dans le champ de texte Requête, décrivez les éléments pour lesquels vous souhaitez effectuer une requête (par exemple,
vintage 1970s pinball machine
). Vous pouvez également cliquer sur Générer une requête pour générer automatiquement une description.Cliquez sur Envoyer.
Pour en savoir plus sur ce que vous pouvez faire dans la démonstration, consultez la section Interface utilisateur.
Interface utilisateur
Cette section décrit les paramètres de l'interface utilisateur que vous pouvez utiliser pour contrôler les résultats de la recherche vectorielle et leur classement.
Ensemble de données
Utilisez le menu déroulant Dataset (Ensemble de données) pour choisir l'ensemble de données sur lequel Vector Search exécutera votre requête. Pour en savoir plus sur chacun d'eux, consultez Ensembles de données.
Requête
Dans le champ Requête, ajoutez une description ou un ou plusieurs mots clés pour spécifier les éléments que vous souhaitez que Vector Search recherche. Vous pouvez également cliquer sur Générer une requête pour générer automatiquement une description.
Modifier
Plusieurs options sont disponibles pour modifier les résultats de la recherche vectorielle:
Cliquez sur Lignes, puis sélectionnez le nombre maximal de résultats de recherche que vous souhaitez que Vector Search renvoie.
Sélectionnez Utiliser des embeddings denses si vous souhaitez que Vector Search renvoie des résultats sémantiquement similaires.
Sélectionnez Utiliser des embeddings clairsemés si vous souhaitez que Vector Search renvoie des résultats en fonction de la syntaxe textuelle de votre requête. Tous les ensembles de données disponibles ne sont pas compatibles avec les modèles d'encapsulation clairsemée.
Sélectionnez à la fois Utiliser des embeddings denses et Utiliser des embeddings clairsemés si vous souhaitez que Vector Search utilise la recherche hybride. Tous les ensembles de données ne sont pas compatibles avec ce modèle. La recherche hybride combine des éléments d'embeddings denses et clairsemés, ce qui peut améliorer la qualité des résultats de recherche. Pour en savoir plus, consultez la section À propos de la recherche hybride.
Dans le champ Alpha RRF, saisissez une valeur comprise entre 0,0 et 1,0 pour spécifier l'effet de classement du RRF.
Pour réorganiser les résultats de recherche, sélectionnez ranking_api dans le menu déroulant Réorganisation ou Aucune pour désactiver la réorganisation.
Métriques
Une fois une requête exécutée, vous obtenez des métriques de latence qui décomposent le temps nécessaire pour que les différentes étapes de la recherche soient effectuées.
Traitement des requêtes
Lorsqu'une requête est traitée, les événements suivants se produisent:
Génération d'un embedding de requête:un embedding est généré pour le texte de requête spécifié.
Requête Vector Search:la requête est exécutée avec l'index Vector Search.
Récupération de Vertex AI Feature Store:les caractéristiques sont lues (par exemple, le nom de l'article, la description ou l'URL de l'image) à partir de Vertex AI Feature Store à l'aide de la liste des ID d'article renvoyés par la recherche vectorielle.
Ré-ordre:les éléments récupérés sont triés à l'aide d'API de classement qui utilisent le texte de la requête, le nom et la description de l'élément pour calculer le score de pertinence.
Embeddings
Multimodal:recherche sémantique multimodale sur les images d'articles. Pour en savoir plus, consultez Qu'est-ce que la recherche multimodale : les LLM avec vision modifient les entreprises.
Texte (similarité sémantique) : recherche sémantique sur le texte des noms et des descriptions des articles en fonction de la similarité sémantique. Pour en savoir plus, consultez Vertex AI Embeddings for Text: faciliter l'ancrage des LLM.
Texte (système de questions-réponses) : recherche sémantique de texte sur les noms et les descriptions des articles, avec une qualité de recherche améliorée par type de tâche QUESTION_ANSWERING. Il est adapté aux applications de type questions/réponses. Pour en savoir plus sur les embeddings de type de tâche, consultez la section Améliorer votre cas d'utilisation de l'IA générative avec des embeddings et des types de tâches Vertex AI.
Résultats clairsemés (recherche hybride) : recherche par mot clé (basée sur des jetons) sur les noms et les descriptions des articles, générée avec l'algorithme TF-IDF. Pour en savoir plus, consultez la section À propos de la recherche hybride.
Ensembles de données
La démonstration interactive inclut plusieurs ensembles de données sur lesquels vous pouvez exécuter des requêtes. Les ensembles de données diffèrent les uns des autres par le modèle d'encapsulation, la prise en charge des représentations vectorielles continues sporadiques, les dimensions d'encapsulation et le nombre d'éléments stockés.
Ensemble de données | Modèle d'embedding | Modèle d'embedding creux | Dimensions d'embedding | Nombre d'éléments |
---|---|---|---|---|
Mercari Multimodal + Embeddings creux | Embedding multimodal | TF-IDF (nom et description de l'article) |
1408 | ~3 millions |
Texte Mercari (similarité sémantique) + embeddings sparsifs | text-embedding-005 ) (type de tâche: SEMANTIC_SIMILARITY) |
TF-IDF (nom et description de l'article) |
768 | ~3 millions |
Texte Mercari (réponse aux questions) + embeddings creux | text-embedding-005 ) (type de tâche: QUESTION_ANSWERING) |
TF-IDF (nom et description de l'article) |
768 | ~3 millions |
Embeddings multimodaux et creux pour les fleurs du GBIF | Embedding multimodal | TF-IDF (nom et description de l'article) |
1408 | ~3,3 millions |
Embeddings multimodaux pour les animaux du GBIF | Embedding multimodal | N/A | 1408 | ~7 millions |
Étapes suivantes
Maintenant que vous connaissez la démonstration, vous êtes prêt à en savoir plus sur l'utilisation de la recherche vectorielle.
Guide de démarrage rapide:utilisez un exemple d'ensemble de données pour créer et déployer un indice en 30 minutes ou moins.
Avant de commencer:découvrez comment préparer des représentations vectorielles continues et choisissez le type de point de terminaison sur lequel déployer votre index.