Filtrer les recherches par pertinence au niveau du document

Lorsque vous effectuez une recherche dans votre application Vertex AI Search, vous pouvez appliquer un seuil de pertinence afin que seuls les documents sont renvoyés sous forme de résultats. Cette page explique comment spécifier un seuil de pertinence afin de réduire le nombre de documents requêtes.

À propos du filtrage en fonction de la pertinence au niveau des documents

Chaque document renvoyé par une requête de recherche se voit attribuer un niveau de pertinence, qui indique la pertinence du document renvoyé par rapport à la requête. Lorsque vous créez un via un appel d'API, vous pouvez définir un seuil de pertinence. Définir un seuil de pertinence élevé peut réduire le nombre de documents renvoyés par une requête.

Par exemple, si vous trouvez que la recherche renvoie trop de documents pertinence insuffisante pour vos utilisateurs, définissez le seuil de pertinence sur élevé à limiter les résultats à ceux qui sont les plus pertinents. Si le réglage élevé est trop restrictif, optez pour le réglage moyen.

Types de données et applications compatibles avec le filtre de pertinence au niveau des documents

Le filtre de pertinence au niveau du document peut être appliqué aux data stores contenant les types de données suivants:

  • Données de site Web avec indexation avancée de site Web
  • Données non structurées génériques
  • Données structurées génériques

Le filtre de pertinence au niveau du document ne fonctionne pas avec les data stores avec indexation de base de sites Web, les données multimédias ou les données de santé.

De plus, le filtre de pertinence au niveau du document ne peut pas être utilisé avec les applications de recherche combinée. Mélangée les applications de recherche sont des applications connectées à plusieurs data stores.

Autres types de filtres

Le filtre de pertinence au niveau du document n'est pas le seul moyen de filtrer les données renvoyées par les requêtes. Vous pouvez également utiliser des expressions de filtre pour filtrer les résultats en fonction des métadonnées (dans l'indexation avancée des sites Web et les données non structurées avec des datastores de métadonnées) et des valeurs de champ (dans les datastores de données structurées).

Pour en savoir plus, consultez les pages suivantes :

Si vous utilisez à la fois une expression de filtre et le filtre de pertinence au niveau du document, l'expression de filtre est d'abord appliqué aux résultats, puis le filtre de pertinence au niveau du document est appliqué.

Avant de commencer

Assurez-vous d'avoir créé une application et un data store, et d'avoir ingéré des données. dans votre data store. Pour en savoir plus, consultez Créer une application de recherche. Consultez également la section Types de données et applications compatibles avec le filtre de pertinence au niveau du document.

Pour filtrer les résultats par pertinence, procédez comme suit:

  1. Recherchez votre ID d'application. Si vous disposez déjà de votre ID d'application, passez à l'étape suivante.

    1. Dans la console Google Cloud, accédez à la page Agent Builder.

      Accéder à "Applications"

    2. Sur la page Applications, recherchez le nom de votre application et récupérez son ID dans la colonne ID.

  2. Pour filtrer la recherche par pertinence au niveau du document, utilisez le champ relevanceThreshold avec la méthode engines.servingConfigs.search.

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    
    • PROJECT_ID : ID de votre projet Google Cloud
    • APP_ID : ID de l'application Vertex AI Search que vous souhaitez interroger.
    • QUERY: texte de la requête à rechercher.
    • RELEVANCE_THRESHOLD : l'une des valeurs suivantes : HIGH, MEDIUM, LOW ou LOWEST.
  3. Testez plusieurs requêtes avec différents seuils pour déterminer les meilleurs paramètres de seuil pour vos données et votre application.