Si vous disposez d'une application de recommandations qui utilise des données structurées, vous pouvez utiliser des champs de document pour filtrer les résultats de vos recommandations. Cette page vous explique comment utiliser des champs de document pour filtrer une recommandation sur un ensemble spécifique de documents. Bien que les exemples présentés sur cette page concernent des recommandations de médias, les principes sont les mêmes pour les recommandations génériques. Pour en savoir plus sur des recommandations de médias, consultez Présentation de Vertex AI Search pour contenus multimédias.
Filtrer les recommandations et les mises à jour du data store
Après toute mise à jour du magasin de données, vous devrez attendre jusqu'à huit heures pendant que le modèle est réentraîné. En effet, le modèle doit connaître les valeurs actuelles des métadonnées du document, ainsi que les champs configurés comme filtrables. Vous devez attendre que les modifications apportées au document et au schéma se propagent. Contrairement à la recherche, le filtrage n'est pas effectué en temps réel pour les recommandations.
Filtres et paramètres de diversification (recommandations de médias uniquement)
En plus des filtres, le paramètre de diversification d'une application affecte également Résultats renvoyés dans une réponse à une recommandation de médias. Les effets des filtres et de la diversification sont combinés. La diversification est fait en premier et le filtrage est effectué en second.
Combiner une diversité élevée basée sur des règles et un filtrage d'attributs basé sur des catégories entraîne souvent une sortie vide. En effet, une grande diversité limite l'application renvoyant un résultat pour chaque catégorie.
Par exemple, vous pouvez recommander des films inspirés de Toy Story. Vous définissez le niveau de diversité basé sur des règles sur "Élevé". Étant donné que le niveau de diversité est élevé, même si de nombreux films peuvent être recommandés, un seul (par exemple, WALL·E) est renvoyé dans la catégorie des films pour enfants. Lorsque le filtre pour les films pour enfants est appliqué, seul WALL·E est renvoyé en tant que recommandation.
Pour obtenir des informations générales sur la diversité, consultez la page Diversifier les médias. recommandations.
Avant de commencer
Assurez-vous d'avoir créé une application de recommandations et un datastore. Pour en savoir plus, consultez Créer des applications multimédias ou Créer un datastore de recommandations générique.
Exemples de documents
Consultez ces exemples de documents multimédias. Vous pouvez vous reporter à ces exemples de documents lorsque vous lisez cette page.
{"id":"1","schemaId":"default_schema","structData":{"title":"Toy Story (1995)","categories":["Adventure","Animation","Children","Comedy","Fantasy"],"uri":"http://mytestdomain.movie/content/1","available_time":"2023-01-01T00:00:00Z","media_type":"movie"}}
{"id":"88125","schemaId":"default_schema","structData":{"title":"Harry Potter and the Deathly Hallows: Part 2 (2011)","categories":["Action","Adventure","Drama","Fantasy","Mystery","IMAX"],"uri":"http://mytestdomain.movie/content/88125","available_time":"2023-01-01T00:00:00Z","media_type":"movie"}}
{"id":"2857","schemaId":"default_schema","structData":{"title":"Yellow Submarine (1968)","categories":["Adventure","Animation","Comedy","Fantasy","Musical"],"uri":"http://mytestdomain.movie/content/2857","available_time":"2023-01-01T00:00:00Z","media_type":"movie"}}
{"id":"60069","schemaId":"default_schema","structData":{"title":"WALL·E (2008)","categories":["Adventure","Animation","Children","Romance","Sci-Fi"],"uri":"http://mytestdomain.movie/content/60069","available_time":"2023-01-01T00:00:00Z","media_type":"movie"}}
Expressions de filtre
Utilisez des expressions de filtre pour définir vos filtres de recommandations.
Syntaxe des expressions de filtre
Le formulaire Backus–Naur étendu suivant résume l'expression du filtre. que vous pouvez utiliser pour définir vos filtres de recommandations.
# A single expression or multiple expressions that are joined by "AND" or "OR". filter = expression, { " AND " | "OR", expression }; # An expression can be prefixed with "-" or "NOT" to express a negation. expression = [ "-" | "NOT " ], # A parenthesized expression | "(", expression, ")" # A simple expression applying to a textual field. # Function "ANY" returns true if the field contains any of the literals. textual_field, ":", "ANY", "(", literal, { ",", literal }, ")" # OR filter by "available" available, ":", "true", # A literal is any double-quoted string. You must escape backslash (\) and # quote (") characters. literal = double-quoted string; textual_field = see the tables below;
Restrictions concernant les expressions de filtre
Les restrictions suivantes s'appliquent aux expressions de filtre pour les recommandations:
- La profondeur des opérateurs
AND
etOR
entre parenthèses est limitée. Les expressions logiques du filtre doivent avoir une forme normale conjonctive (CNF). L'approche logique compatible la plus complexe peut être une liste de clauses connectées àAND
qui ne contiennent queOR
tels que:(... OR ... OR ...) AND (... OR ...) AND (... OR ...)
- Les expressions peuvent être annulées à l'aide du mot clé
NOT
ou de-
. Cette fonctionne avec les expressionsANY()
comportant un seul argument. - Les restrictions
available
doivent être définies au niveau le plus élevé. Ils ne peuvent pas servir fait partie d'une clauseOR
ou d'une négation (NOT
). Vous ne pouvez utiliser queavailable: true
. - Le nombre maximal de termes dans la clause
AND
de premier niveau est de 20. - Une clause
OR
peut comporter jusqu'à 100 arguments inclus dansANY()
. . Si une clauseOR
comporte plusieurs expressionsANY()
, leurs arguments sont tous comptabilisés dans cette limite. Par exemple,categories: ANY("drama", "comedy") OR categories: ANY("adventure")
comporte trois arguments.
Exemples d'expressions de filtre
Le tableau suivant présente des exemples d'expressions de filtre valides et non valides. Il indique également les raisons pour lesquelles les exemples non valides ne le sont pas.
Expression | Valide | Remarques |
---|---|---|
language_code: ANY("en", "fr") |
Oui | |
NOT language_code: ANY("en") |
Oui | |
NOT language_code: ANY("en", "fr") |
Non | Annule une ANY() avec plusieurs arguments. |
language_code: ANY("en", "fr") OR categories: ANY("drama") |
Oui | |
(language_code: ANY("en") OR language_code: ANY("fr")) AND categories: ANY("drama") |
Oui | |
(language_code: ANY("en") AND language_code: ANY("fr")) OR categories: ANY("drama") |
Non | Pas en forme normale conjonctive. |
(language_code: ANY("en")) AND (available: true) |
Oui | |
(language_code: ANY("en")) OR (available: true) |
Non | Combine available dans une expression OR avec d'autres conditions. |
L'expression de filtre suivante permet de filtrer les documents appartenant à la catégorie "Drame" ou "Action", qui ne sont pas en anglais et qui sont disponibles :
categories: ANY("drama", "action") AND NOT language_code: ANY("en") AND available: true
Limites de filtrage
Chaque champ de document filtrable consomme de la mémoire dans chacun de vos modèles. Les limites suivantes permettent d'éviter les effets négatifs sur les performances de diffusion :
Vous pouvez définir jusqu'à 10 champs personnalisés comme filtrables dans votre schéma.
Si plus de 10 champs personnalisés sont détectés lors de l'entraînement de l'application, seuls 10 champs sont utilisés.
Votre schéma peut contenir jusqu'à 100 000 000 valeurs de champ filtrables.
Vous pouvez estimer le nombre total de valeurs de champ filtrables dans votre schéma en multipliant le nombre de documents de votre schéma par le nombre de champs filtrables. Si vous dépassez ces limites, voici ce qui se produit:
- Vous ne pouvez pas définir d'autres champs comme filtrables.
- Échec de l'entraînement de l'application.
Filtrer les recommandations
Pour filtrer les recommandations de contenus multimédias, procédez comme suit:
Recherchez votre ID de data store. Si vous disposez déjà de l'ID de votre data store, passez à l'étape suivante.
Dans la console Google Cloud, accédez à la page Agent Builder et cliquez sur Data Stores dans le menu de navigation.
Cliquez sur le nom de votre data store.
Sur la page Données de votre data store, obtenez l'ID du data store.
Déterminez le ou les champs de document que vous souhaitez filtrer. Par exemple, pour les documents de la section Avant de commencer, vous pouvez utiliser le champ
categories
comme filtre.Pour rendre le champ
categories
filtrable, procédez comme suit :Dans la console Google Cloud, accédez à la page Agent Builder.
Cliquez sur votre application de recommandations.
Cliquez sur l'onglet Schéma. Cet onglet affiche les paramètres de champ actuels.
Cliquez sur Modifier.
Si ce n'est pas déjà le cas, cochez la case Filtrable dans la ligne catégories, puis cliquez sur Enregistrer.
Attendez six heures pour que la modification de votre schéma soit prise en compte. Au bout de six heures, vous pouvez passer à l'étape suivante.
Pour obtenir une recommandation et filtrer sur le champ
categories
, exécutez le code suivant dans la ligne de commande :curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -d '{ "userEvent": { "eventType": "EVENT_TYPE", "userPseudoId": "USER_PSEUDO_ID", "documents": { "id": "DOCUMENT_ID" } }, "params": { "returnDocument": true, "attributeFilteringSyntax": true, "strictFiltering": true }, "filter": "FILTER" }' \ "https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/servingConfigs/SERVING_CONFIG_ID:recommend"
- PROJECT_ID : ID de votre projet.
- DATA_STORE_ID: ID de votre data store.
- DOCUMENT_ID: ID du document que vous souhaitez prévisualiser recommandations. Utilisez l'ID que vous avez utilisé pour ce document au moment de l'ingestion de vos données.
- EVENT_TYPE : type d'événement utilisateur. Pour connaître les valeurs
eventType
, consultez UserEvent. - USER_PSEUDO_ID: identifiant pseudonymisé de l'utilisateur. Vous pouvez utiliser un cookie HTTP pour ce champ, qui identifie de manière unique un visiteur sur un seul appareil. Ne définissez pas ce champ sur le même pour plusieurs utilisateurs. Cela combinerait leurs historiques d'événements et dégraderait la qualité du modèle. N'ajoutez pas d'informations permettant d'identifier personnellement l'utilisateur dans ce champ.
- SERVING_CONFIG_ID : ID de votre configuration de diffusion. Votre l'ID de configuration de diffusion est identique à l'ID de moteur. Vous devez donc utiliser cet ID ici.
- FILTER : champ de texte qui vous permet de filtrer sur un ensemble de champs spécifié à l'aide de la syntaxe d'expression de filtre. La valeur par défaut est vide ce qui signifie qu'aucun filtre n'est appliqué.
Par exemple, supposons que vous souhaitiez obtenir une recommandation pour un événement utilisateur de lecture multimédia spécifique et que vous souhaitiez filtrer les résultats de la recommandation pour n'inclure que les documents qui : (1) appartiennent à la catégorie "Enfants" et (2) sont actuellement disponibles. Pour ce faire, vous devez inclure les déclarations suivantes lors de votre appel:
"eventType": "media-play"
"filter": "categories: ANY(\"Children\") AND available: true"
Pour en savoir plus, consultez la section sur la méthode
recommend
.Cliquez pour voir un exemple de réponse.
Si vous effectuez une requête de recommandation comme celle qui précède, vous devriez obtenir une réponse semblable à celle-ci. Notez que la réponse inclut les deux documents dont la valeur
categories
estChildren
et une valeuravailability_start_time
qui est postérieure à la date actuelle.{ "results": [ { "id":"1", "schemaId":"default_schema", "structData":{"title":"Toy Story (1995)","categories":["Adventure","Animation","Children","Comedy","Fantasy"],"uri":"http://mytestdomain.movie/content/1", "availability_start_time":"2023-01-01T00:00:00Z", "media_type":"movie" } }, { "id":"60069", "schemaId":"default_schema", "structData":{"title":"WALL·E (2008)","categories":["Adventure","Animation","Children","Romance","Sci-Fi"],"uri":"http://mytestdomain.movie/content/60069", "availability_start_time":"2023-01-01T00:00:00Z", "media_type":"movie" } } ], "attributionToken": "ChMzMDk3NTQ4MzQxOTcxOTE0ODM1GglhZi10ZXN0LTEiDmFmLXRlc3QtMTE0NTE0KAAwBg", "debugInfo": { "fallbackModelInvoked": false } }