Si l'indexation avancée de sites Web est activée dans votre datastore, vous pouvez utiliser les types de données structurées suivants pour enrichir votre indexation :
Cette page présente ces deux types de données structurées pour vos pages Web et explique comment ajouter des attributs structurés personnalisés à votre schéma de data store.
À propos des dates de page prédéfinies inférées par Google
Lorsque Google explore les pages Web de votre entrepôt de données de site Web, il infère les données de page à l'aide des propriétés qui s'appliquent à votre contenu. Vertex AI Search ajoute ces propriétés de données de page déduites à votre du schéma. Ces données déduites inclut les propriétés de date prédéfinies suivantes, également appelées dates de publication:
datePublished
: date et heure de la première publication de la pagedateModified
: date et heure de la dernière modification de la page
Ces propriétés sont indexées automatiquement. Vous pouvez utiliser directement ces propriétés de date pour enrichir votre recherche sans les ajouter à votre schéma. Pour ajouter des dates de signature à votre site Web, consultez Influencez vos dates de signature dans la recherche Google.
Pour comprendre comment inclure ces propriétés de date prédéfinies dans votre recherche comme les expressions de filtre et les spécifications d'optimisation, consultez Exemple de cas d'utilisation avec une date de page déduite par Google.
À propos des champs de date et heure personnalisés sur une page Web
Vous pouvez ajouter des champs de date et d'heure personnalisés à vos pages Web. Ces tags peuvent être utilisés avec
l'indexation avancée
Ajoutez des attributs de données structurées personnalisés au schéma du data store.
Voici un exemple montrant où ajouter
Une balise Meta de date et d'heure personnalisée nommée lastModified
sur votre page Web
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Your web page title</title>
<!-- Vertex AI Search can use this date. -->
<meta name="lastModified" content="2022-07-01">
</head>
<body>
</body>
</html>
Pour savoir comment inclure ces balises de date et heure personnalisées dans vos requêtes de recherche, par exemple dans les expressions de filtre et les spécifications de boost, consultez l'exemple de cas d'utilisation d'un attribut de date et heure personnalisé.
À propos des attributs de données structurées personnalisés
Vous pouvez ajouter des attributs de données structurées à votre site Web en tant que balises meta
et PageMaps
et utilisez-les pour enrichir votre indexation. Pour utiliser des attributs structurés personnalisés pour l'indexation, vous devez mettre à jour votre schéma.
Exemple de cas d'utilisation pour les balises meta
Supposons que vous disposiez d'un grand nombre de pages Web pertinentes pour différents services de votre organisation. Vous pouvez utiliser des balises meta
pour ajouter des libellés aux pages pertinentes pour chaque service. Vous pouvez ensuite utiliser les tags indexés
des filtres dans vos requêtes. Cela vous permet de limiter les résultats de recherche aux pages Web
contenant une étiquette qui correspond à l'un des services spécifiés.
Ce processus peut se résumer comme suit :
- Ajoutez les balises
meta
suivantes à un sous-ensemble de vos pages Web:- Informations utiles pour les services d'ingénierie et IT :
<meta name="department" content="eng, infotech">
- Contenu pertinent pour les services des finances et des ressources humaines:
<meta name="department" content="finance, human resources">
- Informations utiles pour les services d'ingénierie et IT :
- Réexplorez les pages mises à jour.
- Ajoutez
department
au schéma de votre data store en tant que tableau indexable, comme décrit ci-dessus. dans la section Ajouter des attributs de données structurées personnalisés au schéma de data store.
Une fois votre schéma mis à jour, votre entrepôt de données est automatiquement réindexé.
Une fois la réindexation terminée, vous pouvez utiliser le filtre department
dans un
expression de filtre pour réorganiser ou filtrer la recherche
résultats. Par exemple, lorsque des utilisateurs du
service financier émettent des requêtes,
les résultats de recherche peuvent être améliorés grâce au department
.
filter défini sur finance
.
Exemples de tags meta
sur une page Web
Voici un exemple de balises meta
que vous pouvez ajouter à votre page Web. Ces balises peuvent être utilisées avec l'indexation avancée
lorsque vous
Ajoutez des attributs de données structurées personnalisés au schéma du data store.
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Your web page title</title>
<!-- Robots instructions for crawlers and for Vertex AI Search. -->
<meta name="robots" content="index,follow">
<!-- Vertex AI Search can use custom datetime fields to filter, boost, and order. -->
<meta name="lastModified" content="2024-09-06">
<!-- Vertex AI Search can filter by category or tags. -->
<meta name="category" content="archived">
<meta name="tags" content="legacy,interesting,faq">
<!-- Vertex AI Search can index these common HTML tags. -->
<meta name="description" content="A description of your web page's content.">
<meta name="author" content="Your name or organization">
<meta name="keywords" content="relevant,keywords,separated,by,commas">
<link rel="canonical" href="https://www.yourwebsite.com/this-page">
<meta property="og:title" content="Your Webpage Title">
<meta property="og:description" content="A description of your webpage's content.">
<meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
<meta property="og:url" content="https://www.yourwebsite.com/this-page">
<meta property="og:type" content="website">
<meta name="twitter:card" content="summary_large_image">
<meta name="twitter:title" content="Your customized Webpage Title">
<meta name="twitter:description" content="A description of your webpage's content.">
<meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>
Exemple de cas d'utilisation de PageMaps
Supposons que vous ayez plusieurs pages Web proposant des recettes alimentaires. Vous pouvez ajouter Des données PageMap au contenu HTML de chaque page Vous pouvez ensuite utiliser le PageMap indexé comme filtres dans vos requêtes. Par exemple, si vous avez l'intention d'optimiser ou redescendre les pages Web en fonction des évaluations des recettes, vous pouvez suivre ce processus:
Ajoutez des données PageMaps semblables à celles-ci à vos pages Web :
<html> <head> ... <!-- <PageMap> <DataObject type="document"> <Attribute name="title">Baked potatoes</Attribute> <Attribute name="author">Dana A.</Attribute> <Attribute name="description">Homestyle baked potatoes in oven. This recipe uses Russet potatoes.</Attribute> <Attribute name="rating">4.9</Attribute> <Attribute name="lastUpdate">2015-01-01</Attribute> </DataObject> </PageMap> --> </head> ... </html>
Réindexez les pages mises à jour.
Ajoutez
rating
à votre schéma de data store en tant que tableau indexable, comme décrit dans la section Ajouter des attributs de données structurées personnalisés au schéma de data store.
Une fois votre schéma mis à jour, votre entrepôt de données est automatiquement réindexé.
Une fois la réindexation terminée, vous pouvez utiliser l'attribut rating
dans une
expression de filtre pour réorganiser ou filtrer la recherche
résultats. Par exemple, lorsque les utilisateurs recherchent des recettes, boostez les résultats de recherche les mieux notés en utilisant rating
comme attribut numérique personnalisé.
Exemple de cas d'utilisation des données schema.org
Supposons que vous possédiez un site Web d'avis et que ses pages Web soient annotées avec des données schema.org au format JSON-LD dans la balise HTML script
. Vous pouvez ensuite utiliser les annotations indexées comme filtres dans vos requêtes. Par exemple, si vous souhaitez mettre en avant ou masquer des pages Web en fonction des notes globales, vous pouvez suivre cette procédure :
Ajoutez les annotations schema.org pour le contenu des avis similaires aux suivantes à vos pages Web. Pour afficher d'autres types de modèles schema.org disponibles, consultez la section Schémas:
<script type="application/ld+json"> { "@context": "https://schema.org", "@type": "Review", "aggregateRating": { "@type": "Average Rating", "ratingValue": 3.5, "reviewCount": 11 }, "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.", "name": "A Christmas Carol", "image": "christmas-carol-first-ed.jpg", "review": [ { "@type": "Review", "author": "Alex T.", "datePublished": "2000-01-01", "reviewBody": "Read this in middle school and have loved this ever since.", "name": "Worth all the adaptations", "reviewRating": { "@type": "Rating", "bestRating": 5, "ratingValue": 5, "worstRating": 1 } } ] } </script>
Réexplorez les pages mises à jour.
Ajoutez le chemin d'accès à
ratingValue
au schéma de votre data store. Utiliser un identifiant comme nom de champ dans le schéma de data store, tel querating_value
, décrits dans le Ajouter des attributs de données structurées personnalisés au schéma de data store .
Une fois votre schéma mis à jour, votre entrepôt de données est automatiquement réindexé.
Une fois l'indexation terminée, vous pouvez utiliser l'attribut rating_value
dans une expression de filtre pour réorganiser ou filtrer les résultats de recherche. Par exemple, lorsque les utilisateurs recherchent des livres, boostez la recherche
les résultats les mieux notés en utilisant la fonction rating_value
comme nombre personnalisé
.
Avant de commencer
Avant de mettre à jour le schéma du datastore, procédez comme suit :
- Activez l'indexation avancée de site Web pour le data store. Pour plus d'informations, consultez Activer l'indexation avancée de site Web.
- Comprendre le fonctionnement des données structurées
- Découvrez comment utiliser PageMaps. Consultez la liste DataObjects reconnus pouvant être ajoutés aux données PageMap.
- Découvrez comment utiliser les balises
meta
. Assurez-vous de ne pas utiliser de balises méta exclues ni de balises méta non compatibles. - Assurez-vous que l'attribut à indexer ne contient aucune des valeurs suivantes :
datePublished
dateModified
siteSearch
- Sachez que vous devez réexplorer vos pages Web après avoir ajouté des données structurées. Cette opération peut prendre plusieurs heures.
- Notez qu'une fois que vous avez ajouté des attributs de données structurées au schéma du dépôt de données, les pages Web de votre dépôt de données sont réindexées automatiquement. L'indexation peut prendre plusieurs heures.
Ajouter des attributs de données structurées personnalisés au schéma du data store
Pour ajouter des attributs de données structurées personnalisés au schéma du data store :
Ajoutez les balises
meta
, les données PageMap et les données schema.org à toutes les pages de votre site Web que vous souhaitez enrichir avec l'indexation de données structurées:- Pour les balises
meta
:- L'attribut
name
de chaque balisemeta
doit être défini sur le champ que vous souhaitez indexer et son attributcontent
sur une chaîne d'une ou plusieurs valeurs séparées par une virgule. - Vertex AI Search est compatible avec les balises
meta
dont le nom correspond au format[a-zA-Z0-9][a-zA-Z0-9-_]*
. Assurez-vous de ne pas utiliser de balises méta exclues ni de balises méta non compatibles.
- L'attribut
- Pour les données PageMap:
- Les données PageMap doivent contenir les éléments suivants : DataObjects reconnus contenant la valeur "Attribute" les noms à indexer. Les noms d'attributs dans les DataObjects doivent être définis sur le champ que vous souhaitez indexer.
- Pour les données schema.org :
- Les annotations doivent être au format JSON-LD, microdonnées ou Formats Jupyter valides. Pour en savoir plus, consultez Formats compatibles.
- Pour les balises
Réexplorez les pages Web mises à jour.
Affichez la définition du schéma de votre entrepôt de données via l'API REST.
Mettez à jour le schéma du datastore via l'API REST. Pour plus pour en savoir plus, consultez À propos de la fourniture de votre propre schéma en tant qu'objet JSON
- Ajoutez des objets pour chaque attribut personnalisé que vous souhaitez rendre accessible à la recherche, récupérable ou indexable.
- Ajoutez l'attribut personnalisé et définissez son
type
surarray
. - Ajoutez le type de données de la valeur de l'attribut personnalisé.
- Indiquez la source de l'attribut personnalisé là où il se trouve dans le
siteSearchStructuredDataSources
. - Pour les données schema.org: indiquez le chemin d'accès de l'attribut dans schema.org
annotation commençant par la chaîne
_root
danssiteSearchSchemaOrgPaths
.
Voici un exemple de mise à jour de schéma pour un site Web :
{ "type": "object", "properties": [{ "CUSTOM_ATTRIBUTE": { "type": "array", "items": { "type": "DATA_TYPE", "searchable": true, "retrievable": true, "indexable": true, "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"] } } } { "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": { "type": "array", "items": { "type": "DATA_TYPE_SCHEMA_ORG_FIELD", "searchable": true, "retrievable": true, "indexable": true, "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"] } } }], "$schema": "https://json-schema.org/draft/2020-12/schema" }
Remplacez les éléments suivants :
CUSTOM_ATTRIBUTE
: valeur de l'attributname
. Exemple :- Pour une balise
meta
définie comme<meta name="department" content="eng, infotech">
, utilisezdepartment
. - Pour un attribut PageMap défini comme
<Attribute name="rating">4.9</Attribute>
, utilisezrating
.
- Pour une balise
DATA_TYPE
: type de données de l'attributname
. Doit être une chaîne, un nombre ou une date et une heure. Exemple :- Pour une balise
meta
définie comme<meta name="department" content="eng, infotech">
, utilisezstring
. - Pour un attribut PageMap défini sur
<Attribute name="rating">4.9</Attribute>
, utilisernumber
- Pour un attribut PageMap défini comme
<Attribute name="lastPublished">2015-01-01</Attribute>
, utilisezdatetime
.
Pour en savoir plus, consultez la page
FieldType
.- Pour une balise
STRUCTURED_DATA_SOURCE_N
: tableau composé d'une ou de deux des sources de données structurées suivantes, dans lesquelles l'attributCUSTOM_ATTRIBUTE
peut être trouvé :- Si l'attribut personnalisé se trouve sous la forme d'une balise
meta
, spécifiezMETATAG
- Si l'attribut personnalisé est disponible en tant qu'attribut PageMap, indiquez
PAGEMAP
- Si l'attribut personnalisé est disponible en tant que données schema.org, spécifiez
SCHEMA_ORG
. - Si le champ
siteSearchStructuredDataSources
est absent ou n'est pas renseigné, les valeurs des trois sources de données sont fusionnées dans un tableau.
- Si l'attribut personnalisé se trouve sous la forme d'une balise
IDENTIFIER_FOR_SCHEMA_ORG_FIELD
: une valeur personnalisée pour désigner le champ schema.org. Il ne doit pas nécessairement être identique au nom du champ dans l'annotation schema.org de votre page Web. Par exemple : si le chemin d'accès du champ est_root.nutrition.calories
, l'identifiant peut êtrecalorific_value
ounutrition_value
DATA_TYPE_SCHEMA_ORG_FIELD
: type de données du schema.org. Doit être une chaîne, un nombre ou une date et une heure. Exemple :- Pour un champ schema.org défini comme "calories":"240 calories",
utiliser
string
- Pour un champ schema.org défini comme "calories" : 240,
utiliser
number
- Pour un champ schema.org défini comme "FoundingDate" : "1991-05-01",
utiliser
datetime
Pour en savoir plus, consultez la page
FieldType
.- Pour un champ schema.org défini comme "calories":"240 calories",
utiliser
PATH_TO_THE_SCHEMA_ORG_FIELD
: chemin d'accès à un seul champ du champ schema.org auquel vous devez accéder. Il est spécifié à l'aide de séparateurs de points après chaque niveau imbriqué. Vous devez spécifier le chemin complet nécessaire pour accéder au champ requis. Par exemple, si un champratingValue
est imbriqué dans le champaggregateRating
, vous pouvez spécifier le chemin sous la forme_root.aggregateRating.ratingValue
.
Une fois le schéma du site Web modifié, le site Web est automatiquement réindexé. Il s'agit d'une opération de longue durée qui peut prendre plusieurs heures.
Étape suivante
Utilisez les métadonnées indexées pour les éléments suivants:
- Commandes de diffusion, telles que le boosting, la rétrogradation et le filtrage
- Affichage sous forme de facettes dans les résultats de recherche
- Filtrer les résultats de recherche
- Optimiser les résultats de recherche