Cette page explique comment configurer les champs de schéma pour configurer une application pour les données structurées, pour les données non structurées avec des métadonnées ou pour les données de site Web avec des attributs structurés personnalisés.
Les paramètres de champ permettent de déterminer comment Vertex AI Search utilise les champs dans ses résultats. Vous pouvez utiliser l'onglet Schéma de la consoleGoogle Cloud pour configurer les paramètres des champs.
La configuration des paramètres de champ n'est disponible que pour les applications dont les data stores contiennent des données structurées ou des données non structurées avec des métadonnées.
Paramètres des champs
Les paramètres de champ suivants sont disponibles pour de nombreux types de champs dans vos données de recherche ou de recommandations, mais pas pour tous les types de données. Un schéma contient plusieurs paramètres de champ pour les champs individuels. Le tableau suivant contient les paramètres qui peuvent être appliqués à un champ dans un schéma. Il est fortement recommandé d'utiliser des données structurées pour les paramètres de champ suivants :
Paramètre | Définition | Objectif | Exemple de cas d'utilisation |
---|---|---|---|
Indexable | Définir des champs comme indexables permet d'effectuer des opérations telles que le filtrage, l'amplification et le facettage sur des champs structurés dans un document. Les champs de type |
Marquer un champ comme Notez que le fait de marquer un champ comme | Dans un data store'hôtel, vous pouvez définir un champ, tel que hotel_chain , comme indexable. Cela vous permet d'appliquer des opérations de classement, de filtrage et de boosting sur hotel_chain . Par exemple, vous pouvez appliquer un filtre pour que la recherche n'affiche que les résultats contenant la chaîne hôtelière filtrée. |
Inclus dans l'index de recherche | Les champs les plus susceptibles d'être liés aux recherches sont désignés par Seuls les champs contenant des valeurs textuelles peuvent être marqués comme inclus dans l'index de recherche. Ainsi, un champ de prix numérique peut être indexable (pour le filtrage ou la segmentation), mais ne peut pas être utilisé pour la recherche en texte intégral. | Définir un champ sur Inclus dans l'index de recherche améliore le rappel pour ce champ dans les requêtes de recherche, ce qui permet aux utilisateurs de trouver du contenu, comme des pages Web, en interrogeant le texte de ces champs. Si vous marquez un champ comme pouvant faire l'objet d'une recherche, vous pouvez appliquer un classement. Par conséquent, si vous marquez un nombre excessif de champs comme pouvant faire l'objet d'une recherche, cela peut avoir un impact négatif sur la précision de la recherche en sursaturant l'algorithme de classement et en renvoyant trop de résultats. Cela peut entraîner des résultats de recherche non pertinents. | Le système de demandes d'assistance d'un fournisseur d'accès à Internet stocke chaque demande sous la forme d'un document structuré.
Si ces documents contiennent des champs de texte dans lesquels il est possible d'effectuer des recherches, tels que |
Ajout d'attributs dynamique | Fournit des filtres contextuels pour mieux cibler l'utilisateur dans une recherche. Définir un champ comme Dynamic Facetable permet au système de générer automatiquement des filtres interactifs (facettes) en fonction des valeurs uniques présentes dans le champ. | Définir un champ sur Dynamic
facetable permet aux utilisateurs d'affiner dynamiquement les résultats de recherche en sélectionnant des catégories ou des attributs directement dérivés de vos données ingérées, sans avoir à prédéfinir manuellement toutes les options de filtrage possibles. Cela permet à l'utilisateur d'affiner sa recherche pour trouver des contenus Web très spécifiques. | Les pages d'une base de connaissances interne à l'entreprise, telles que les règles RH, sont ingérées avec des données telles que department , document_type ou last_modified_date . Si ces champs sont tagués comme dynamic facetable , une recherche d'employé pour un terme tel que remboursement de frais génère dynamiquement des filtres interactifs basés sur les résultats pertinents trouvés. Dans ce cas, l'interface Web peut afficher des facettes pour Service : Finances, Voyages, Type de document : Règlement, FAQ ou Date de dernière modification : Ce trimestre, L'année dernière. |
Récupérable | Lorsqu'une requête de recherche correspond à un contenu, le moteur de recherche peut extraire les valeurs des champs récupérables pour les afficher ou les utiliser dans l'application. Cela signifie que les informations du document d'origine sont affichées dans les résultats de recherche. Les champs clés (identifiants uniques des documents) sont configurés comme récupérables. | Les champs récupérables fournissent un contexte de recherche en distinguant les champs dont les valeurs peuvent être affichées de ceux qui ne doivent être utilisés que dans la logique de recherche, mais dont les valeurs brutes ne sont pas destinées à être affichées à l'utilisateur final. | Pour une recherche de produits sur le site d'un marchand, product_id , name , price et image_url sont des champs que vous souhaitez généralement définir comme récupérables. En revanche, le internal_tracking_code peut être indexé et filtrable à des fins administratives uniquement, mais ne peut pas être récupéré dans les résultats de recherche publics. |
À compléter | Permet d'utiliser le contenu d'un champ comme suggestions de requêtes de recherche. Pour en savoir plus, consultez Configurer la saisie semi-automatique. | Ce paramètre permet d'utiliser les valeurs de ce champ pour fournir des suggestions de requêtes en temps réel à mesure que les utilisateurs saisissent du texte. Cette fonctionnalité aide vos utilisateurs à trouver du contenu pertinent et accélère le processus de recherche. Certains facteurs, tels que l'utilisation du filtrage en langage naturel, peuvent avoir un impact sur ces performances. | Si le champ completable est défini sur product_name , brand et category , lorsque l'utilisateur saisit Tech, les suggestions de saisie semi-automatique peuvent afficher :
|
Filtrable | Permet aux recommandations d'utiliser un champ pour filtrer les résultats recommandés, en déterminant les résultats de recherche que vos utilisateurs voient. Pour en savoir plus sur le filtrage des recommandations, consultez Filtrer les recommandations. | Définir un champ sur Filterable permet de personnaliser les recommandations pour les utilisateurs. Notez que des limites de filtrage s'appliquent. |
Un paramètre de filtre par langue et par genre (drame) pourrait ressembler à ceci : language_code: ANY("en", "fr") OR categories: ANY("drama") . |
Différences entre les paramètres couramment utilisés
Il existe des différences clés entre les paramètres de champ "Indexable", "Inclus dans l'index de recherche" et "Récupérable". Le tableau récapitule ces différences.
Fonctionnalité | Indexable | Inclus dans l'index de recherche | Récupérable |
---|---|---|---|
Rôle principal | Rend le contenu du champ disponible pour le moteur de recherche | Permet d'effectuer des requêtes en texte intégral sur le contenu des champs | Autorise le renvoi de la valeur du champ dans les résultats de recherche |
Analyse | Le contenu est traité et placé dans un index. | Subit généralement une analyse lexicale approfondie. | La valeur est stockée telle quelle pour l'affichage. |
Peut-il s'agir de… ? | |||
...inclus dans l'index de recherche ? | Oui (souvent une condition requise) | ND | Pas nécessairement (peut être récupérable sans être inclus dans l'index de recherche) |
… récupérable ? | Pas nécessairement | Pas nécessairement | ND |
...filtrable/triable/ajoutable en tant qu'attribut ? | Oui (généralement une condition préalable pour ceux-ci aussi) | Non directement. Il s'agit d'attributs distincts souvent basés sur un champ indexable. | Non directement. Ces attributs sont liés à la façon dont le champ est indexé et interrogé, et pas seulement affiché. |
En pratique, de nombreux champs essentiels à l'expérience utilisateur (tels que les titres, les descriptions et les informations d'identification) sont souvent définis sur indexable
, searchable
et retrievable
.
Limites
Les paramètres de champ présentent les limites suivantes :
- Vous pouvez configurer jusqu'à 50 champs comme indexables, pouvant faire l'objet d'une recherche ou pouvant être utilisés pour créer des facettes dynamiques.
- Vous pouvez configurer jusqu'à 30 champs comme récupérables.
- Pour configurer un champ en tant que champ à facettes dynamiques, il doit d'abord être configuré comme indexable.
- La modification du paramètre d'indexation nécessite une réindexation des données, ce qui peut prendre des heures, en particulier pour les grands data stores.
Si vous configurez des champs pour une application de recherche de contenus multimédias et que vous souhaitez obtenir des informations détaillées sur les champs du schéma, consultez À propos des documents multimédias et des data stores.
Modifier les paramètres des champs
Pour modifier les paramètres d'un champ :
Dans la console Google Cloud , accédez à la page Applications d'IA.
Cliquez sur le nom de l'application que vous souhaitez modifier.
Cliquez sur Data (Données).
Cliquez sur l'onglet Schéma. Cet onglet affiche les paramètres de champ actuels.
Cliquez sur Modifier.
Sélectionnez ou désélectionnez les paramètres de champ que vous devez modifier. Certains paramètres de champ ne sont pas acceptés. Par exemple, les champs numériques ne peuvent pas être définis sur Consultable.
Cliquez sur Enregistrer pour appliquer les modifications.
Étapes suivantes
- Mettre à jour un schéma pour des données structurées
- Configurer les résultats de recherche
- Afficher les résultats de recherche