Filtrer les recherches par pertinence au niveau du document

Lorsque vous effectuez une recherche dans votre application Vertex AI Search, vous pouvez appliquer un seuil de pertinence afin que seuls les documents qui atteignent ce seuil soient renvoyés en tant que résultats. Cette page explique comment spécifier un seuil de pertinence afin de réduire le nombre de documents renvoyés dans les requêtes.

À propos du filtrage par pertinence au niveau du document

Chaque document renvoyé par une requête de recherche est associé à un niveau de pertinence, qui indique la pertinence du document renvoyé par rapport à la requête. Lorsque vous effectuez une requête via un appel d'API, vous pouvez définir un seuil de pertinence. Définir un seuil de pertinence élevé peut réduire le nombre de documents renvoyés par une requête.

Par exemple, si vous constatez que la recherche renvoie trop de documents dont la pertinence est insuffisante pour vos utilisateurs, définissez le seuil de pertinence sur "Élevé" pour n'afficher que les résultats les plus pertinents. Si le niveau élevé est trop restrictif, essayez le niveau moyen.

Types de données et applications compatibles avec le filtre de pertinence au niveau du document

Le filtre de pertinence au niveau du document peut être appliqué aux data stores contenant les types de données suivants:

  • Données sur les sites Web avec l'indexation avancée de site Web
  • Données non structurées génériques
  • Données structurées génériques

Le filtre de pertinence au niveau du document ne fonctionne pas avec les data stores avec indexation de base de sites Web, les données multimédias ou les données de santé.

De plus, le filtre de pertinence au niveau du document ne peut pas être utilisé avec les applications de recherche combinée. Les applications de recherche combinée sont des applications connectées à plusieurs data stores.

Autres types de filtres

Le filtre de pertinence au niveau du document n'est pas le seul moyen de filtrer les données renvoyées par les requêtes. Vous pouvez également utiliser des expressions de filtre pour filtrer les résultats en fonction des métadonnées (dans l'indexation avancée des sites Web et les données non structurées avec des datastores de métadonnées) et des valeurs de champ (dans les datastores de données structurées).

Pour en savoir plus, consultez les sections suivantes :

Si vous utilisez à la fois une expression de filtre et le filtre de pertinence au niveau du document, l'expression de filtre est d'abord appliquée aux résultats, puis le filtre de pertinence au niveau du document.

Avant de commencer

Assurez-vous d'avoir créé une application et data store, et d'avoir ingéré des données dans votre data store. Pour en savoir plus, consultez Créer une application de recherche. Consultez également la section Types de données et applications compatibles avec le filtre de pertinence au niveau du document.

Pour filtrer par pertinence, procédez comme suit:

  1. Recherchez votre ID d'application. Si vous disposez déjà de votre ID d'application, passez à l'étape suivante.

    1. Dans la console Google Cloud , accédez à la page Agent Builder.

      Accédez à "Applications".

    2. Sur la page Applications, recherchez le nom de votre application et obtenez son ID dans la colonne ID.

  2. Pour filtrer la recherche par pertinence au niveau du document, utilisez le champ relevanceThreshold avec la méthode engines.servingConfigs.search.

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    
    • PROJECT_ID: ID de votre projet Google Cloud .
    • APP_ID: ID de l'application Vertex AI Search que vous souhaitez interroger.
    • QUERY: texte de la requête à rechercher.
    • RELEVANCE_THRESHOLD: l'une des valeurs suivantes : HIGH, MEDIUM, LOW ou LOWEST.
  3. Testez plusieurs requêtes avec différents seuils pour déterminer les meilleurs paramètres de seuil pour vos données et votre application.