Utilizzare i dati strutturati per l'indicizzazione avanzata dei siti web

Se l'indicizzazione avanzata dei siti web è attivata nel tuo datastore, puoi utilizzare i seguenti tipi di dati strutturati per arricchire l'indicizzazione:

Questa pagina illustra entrambi i tipi di dati strutturati per le tue pagine web e descrive come aggiungere attributi strutturati personalizzati allo schema del tuo datastore.

Informazioni sulle date delle pagine predefinite dedotte da Google

Quando esegue la scansione delle pagine web nel datastore del tuo sito web, Google deducono i dati delle pagine utilizzando le proprietà che si applicano ai tuoi contenuti. Vertex AI Search aggiunge queste proprietà dei dati di pagina dedotte allo schema. Questi dati dedotti includono le seguenti proprietà di data predefinite, chiamate anche date di firma:

  • datePublished: la data e l'ora della prima pubblicazione della pagina
  • dateModified: la data e l'ora dell'ultima modifica della pagina

Queste proprietà vengono indicizzate automaticamente. Puoi utilizzare direttamente queste proprietà della data per arricchire la ricerca senza aggiungerle allo schema. Per aggiungere le date di pubblicazione al tuo sito web, consulta Influenzare le date di pubblicazione nella Ricerca Google.

Per capire come includere queste proprietà di data predefinite nelle richieste di ricerca, ad esempio nelle espressioni di filtro e nelle specifiche di boost, consulta Esempio di caso d'uso che utilizza una data della pagina dedotta da Google.

Informazioni sui campi data/ora personalizzati in una pagina web

Puoi aggiungere campi data e ora personalizzati alle tue pagine web. Questi tag possono essere utilizzati con l'indicizzazione avanzata quando aggiungi attributi dei dati strutturati personalizzati allo schema dello spazio dati.
Ecco un esempio che mostra dove aggiungere un meta tag data e ora personalizzato denominato lastModified nella pagina web.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Vertex AI Search can use this date. -->
    <meta name="lastModified" content="2022-07-01">
</head>
<body>
    </body>
</html>

Per capire come includere questi tag data e ora personalizzati nelle richieste di ricerca, ad esempio nelle espressioni di filtro e nelle specifiche di boost, consulta Esempio di caso d'uso che utilizza un attributo data e ora personalizzato.

Informazioni sugli attributi dei dati strutturati personalizzati

Puoi aggiungere attributi dei dati strutturati come tag meta e PageMap alle tue pagine web e utilizzarli per arricchire l'indicizzazione. Per utilizzare gli attributi strutturati personalizzati per l'indicizzazione, devi aggiornare lo schema.

Esempio di caso d'uso per i tag meta

Supponiamo che tu abbia un numero elevato di pagine web pertinenti per vari reparti della tua organizzazione. Puoi utilizzare i tag meta per etichettare le pagine pertinenti per ogni reparto. Puoi quindi utilizzare i tag indicizzati come filtri nelle query. In questo modo puoi limitare i risultati di ricerca alle pagine web contenenti un'etichetta corrispondente a uno dei reparti specificati.

Questa procedura si può riassumere come segue:

  1. Aggiungi i seguenti tag meta a un sottoinsieme delle tue pagine web:
    • Informazioni pertinenti per i reparti di ingegneria e IT: <meta name="department" content="eng, infotech">
    • Per i reparti finanziari e delle RU: <meta name="department" content="finance, human resources">
  2. Esegui nuovamente la scansione delle pagine aggiornate.
  3. Aggiungi department allo schema del tuo datastore come array indicizzato come descritto nella sezione Aggiungere attributi di dati strutturati personalizzati allo datastore store.

Dopo aver aggiornato lo schema, l'indice del tuo datastore viene rigenerato automaticamente. Al termine dell'indicizzazione, puoi utilizzare il filtro department in un'espressione di filtro per riordinare o filtrare i risultati di ricerca. Ad esempio, quando gli utenti del reparto finanza effettuano query, i risultati di ricerca possono essere resi più pertinenti per loro impostando il department filtro su finance.

Esempi di tag meta in una pagina web

Ecco un esempio di tag meta che puoi aggiungere alla tua pagina web. Questi tag possono essere utilizzati con l'indicizzazione avanzata quando aggiungi attributi dei dati strutturati personalizzati allo schema dello spazio dati.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Robots instructions for crawlers and for Vertex AI Search. -->
    <meta name="robots" content="index,follow">

    <!-- Vertex AI Search can use custom datetime fields to filter, boost, and order. -->
    <meta name="lastModified" content="2024-09-06">

    <!-- Vertex AI Search can filter by category or tags. -->
    <meta name="category" content="archived">
    <meta name="tags" content="legacy,interesting,faq">

    <!-- Vertex AI Search can index these common HTML tags. -->
    <meta name="description" content="A description of your web page's content.">
    <meta name="author" content="Your name or organization">
    <meta name="keywords" content="relevant,keywords,separated,by,commas">
    <link rel="canonical" href="https://www.yourwebsite.com/this-page">
    <meta property="og:title" content="Your Webpage Title">
    <meta property="og:description" content="A description of your webpage's content.">
    <meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
    <meta property="og:url" content="https://www.yourwebsite.com/this-page">
    <meta property="og:type" content="website">
    <meta name="twitter:card" content="summary_large_image">
    <meta name="twitter:title" content="Your customized Webpage Title">
    <meta name="twitter:description" content="A description of your webpage's content.">
    <meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>

Esempio di caso d'uso per PageMaps

Supponiamo che tu abbia diverse pagine web che contengono ricette di cucina. Puoi aggiungere i dati PageMap ai contenuti HTML di ogni pagina. Puoi quindi utilizzare i nomi degli attributi PageMap indicizzati come filtri nelle query. Ad esempio, se intendi migliorare o nascondere le pagine web a seconda delle valutazioni delle ricette, puoi seguire questa procedura:

  1. Aggiungi alle tue pagine web dati PageMap simili ai seguenti:

    <html>
    <head>
    ...
    <!--
    <PageMap>
        <DataObject type="document">
            <Attribute name="title">Baked potatoes</Attribute>
            <Attribute name="author">Dana A.</Attribute>
            <Attribute name="description">Homestyle baked potatoes in oven. This
            recipe uses Russet potatoes.</Attribute>
            <Attribute name="rating">4.9</Attribute>
            <Attribute name="lastUpdate">2015-01-01</Attribute>
        </DataObject>
    </PageMap>
    -->
    </head>
    ...
    </html>
    
  2. Esegui nuovamente la scansione delle pagine aggiornate.

  3. Aggiungi rating allo schema del tuo datastore come array indicizzato come descritto nella sezione Aggiungere attributi di dati strutturati personalizzati allo datastore store.

Dopo aver aggiornato lo schema, l'indice del tuo datastore viene rigenerato automaticamente. Al termine dell'indicizzazione, puoi utilizzare l'attributo rating in un'espressione di filtro per riordinare o filtrare i risultati di ricerca. Ad esempio, quando gli utenti cercano ricette, metti in evidenza i risultati di ricerca con le valutazioni più alte utilizzando rating come attributo numerico personalizzato.

Esempio di caso d'uso per i dati di schema.org

Supponiamo che tu abbia un sito web di recensioni e che le sue pagine web siano annotate con i dati di schema.org in formato JSON-LD all'interno del tag HTML script. Puoi quindi utilizzare le annotazioni indicizzate come filtri nelle query. Ad esempio, se intendi migliorare o nascondere le pagine web in base alle valutazioni aggregate, puoi seguire questa procedura:

  1. Aggiungi alle tue pagine web le annotazioni schema.org per i contenuti delle recensioni simili alle seguenti. Per visualizzare altri tipi di modelli schema.org disponibili, consulta la sezione Schemi:

    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "Review",
      "aggregateRating": {
        "@type": "Average Rating",
        "ratingValue": 3.5,
        "reviewCount": 11
      },
      "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.",
      "name": "A Christmas Carol",
      "image": "christmas-carol-first-ed.jpg",
      "review": [
        {
          "@type": "Review",
          "author": "Alex T.",
          "datePublished": "2000-01-01",
          "reviewBody": "Read this in middle school and have loved this ever since.",
          "name": "Worth all the adaptations",
          "reviewRating": {
            "@type": "Rating",
            "bestRating": 5,
            "ratingValue": 5,
            "worstRating": 1
          }
        }
      ]
    }
    </script>
    
  2. Esegui nuovamente la scansione delle pagine aggiornate.

  3. Aggiungi il percorso a ratingValue allo schema del tuo datastore. Utilizza un identificatore come nome del campo nello schema dello datastore, ad esempio rating_value come descritto nella sezione Aggiungere attributi dei dati strutturati personalizzati allo datastore dati.

Dopo aver aggiornato lo schema, l'indice del tuo datastore viene rigenerato automaticamente. Al termine dell'indicizzazione, puoi utilizzare l'attributo rating_value in un'espressione di filtro per riordinare o filtrare i risultati di ricerca. Ad esempio, quando gli utenti cercano libri, metti in evidenza i risultati di ricerca con le valutazioni più alte utilizzando rating_value come attributo numerico personalizzato.

Prima di iniziare

Prima di aggiornare lo schema dell'datastore, svolgi i seguenti passaggi:

  • Attiva l'indicizzazione avanzata dei siti web per il datastore. Per ulteriori informazioni, consulta Attivare l'indicizzazione avanzata dei siti web.
  • Scopri come funzionano i dati strutturati.
  • Scopri come utilizzare PageMaps. Esamina l'elenco dei DataObject riconosciuti che possono essere aggiunti ai dati PageMap.
  • Scopri come utilizzare i tag meta. Assicurati di non utilizzare meta tag esclusi o non supportati.
  • Assicurati che l'attributo da indicizzare non abbia nessuno dei seguenti valori:
    • datePublished
    • dateModified
    • siteSearch
  • Tieni presente che, dopo aver aggiunto i dati strutturati alle tue pagine web, devi eseguire nuovamente la scansione delle pagine. L'operazione potrebbe richiedere diverse ore.
  • Tieni presente che, dopo aver aggiunto gli attributi dei dati strutturati allo schema del datastore, le pagine web nel datastore vengono reindicizzate automaticamente. La ricorsione dell'indice è un'operazione che richiede molto tempo e potrebbe richiedere diverse ore.

Aggiungere attributi dei dati strutturati personalizzati allo schema datastore#39;archivio

Per aggiungere attributi dei dati strutturati personalizzati allo schema del datastore:

  1. Aggiungi i tag meta, i dati di PageMap e i dati di schema.org a tutte le pagine del tuo sito web che vuoi arricchire con l'indicizzazione dei dati strutturati:

    • Per i tag meta:
      • Per ogni tag meta, l'attributo name deve essere impostato sul campo che vuoi indicizzare e l'attributo content su una stringa di uno o più valori separati da virgola.
      • Vertex AI Search supporta i tag meta con nomi che corrispondono al pattern [a-zA-Z0-9][a-zA-Z0-9-_]*. Assicurati di non utilizzare meta tag escludenti o non supportati.
    • Per i dati PageMap:
      • I dati di PageMap devono essere costituiti da DataObject riconosciuti contenenti nomi di attributi che vuoi indicizzare. I nomi degli attributi all'interno di DataObjects devono essere impostati sul campo che vuoi indicizzare.
    • Per i dati di schema.org:
      • Le annotazioni devono essere in formato JSON-LD, microdati o RDFa valido. Per ulteriori informazioni, vedi Formati supportati.
  2. Esegui nuovamente la scansione delle pagine web aggiornate.

  3. Visualizza la definizione dello schema per il tuo datastore tramite l'API REST.

  4. Aggiorna lo datastore dati tramite l'API REST. Per ulteriori informazioni, consulta Informazioni su come fornire il tuo schema come oggetto JSON.

    1. Aggiungi oggetti per ogni attributo personalizzato che vuoi rendere disponibile per la ricerca, recuperabile o indicizzato.
    2. Aggiungi l'attributo personalizzato e imposta il relativo type su array.
    3. Aggiungi il tipo di dati del valore dell'attributo personalizzato.
    4. Specifica l'origine dell'attributo personalizzato, dove può essere trovato nel siteSearchStructuredDataSources campo.
    5. Per i dati di schema.org: specifica il percorso dell'attributo nell'annotazione schema.org che inizia con la stringa _root nel campo siteSearchSchemaOrgPaths.

    Di seguito è riportato un esempio di aggiornamento dello schema per un sito web:

    {
      "type": "object",
      "properties": [{
        "CUSTOM_ATTRIBUTE": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"]
          }
        }
      }
      {
        "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE_SCHEMA_ORG_FIELD",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"]
          }
        }
      }],
      "$schema": "https://json-schema.org/draft/2020-12/schema"
    }

    Sostituisci quanto segue:

    • CUSTOM_ATTRIBUTE: il valore dell'attributo name. Ad esempio:
      • Per un tag meta definito come <meta name="department" content="eng, infotech">, utilizza department
      • Per un attributo PageMap definito come <Attribute name="rating">4.9</Attribute>, utilizza rating
    • DATA_TYPE: il tipo di dati dell'attributo name. Deve essere una stringa, un numero o una data e ora. Ad esempio:

      • Per un tag meta definito come <meta name="department" content="eng, infotech">, utilizza string
      • Per un attributo PageMap definito come <Attribute name="rating">4.9</Attribute>, utilizza number
      • Per un attributo PageMap definito come <Attribute name="lastPublished">2015-01-01</Attribute>, utilizza datetime

      Per ulteriori informazioni, vedi FieldType.

    • STRUCTURED_DATA_SOURCE_N: un array costituito da una o entrambe le seguenti origini dati strutturate in cui è possibile trovare l'attributo CUSTOM_ATTRIBUTE:

      • Se l'attributo personalizzato è disponibile come tag meta, specifica METATAG
      • Se l'attributo personalizzato è disponibile come attributo PageMap, specifica PAGEMAP
      • Se l'attributo personalizzato è disponibile come dato schema.org, specifica SCHEMA_ORG
      • Se il campo siteSearchStructuredDataSources non è presente o viene lasciato vuoto, i valori di tutte e tre le origini dati vengono uniti in un array.
    • IDENTIFIER_FOR_SCHEMA_ORG_FIELD: un identificativo personalizzato per indicare il campo schema.org. Non deve corrispondere al nome del campo nell'annotazione schema.org nella pagina web. Ad esempio, se il percorso del campo è _root.nutrition.calories, l'identificatore può essere calorific_value o nutrition_value

    • DATA_TYPE_SCHEMA_ORG_FIELD: il tipo di dati del campo schema.org. Deve essere una stringa, un numero o una data e ora. Ad esempio:

      • Per un campo schema.org definito come "calorie":"240 calorie", utilizza string
      • Per un campo schema.org definito come "calorie": 240, utilizza number
      • Per un campo schema.org definito come "foundingDate": "1991-05-01", utilizza datetime

      Per ulteriori informazioni, vedi FieldType.

    • PATH_TO_THE_SCHEMA_ORG_FIELD: il percorso a un singolo campo nel campo schema.org a cui è necessario accedere. Viene specificato utilizzando i separatori di punti dopo ogni livello nidificato. Devi specificare il percorso completo necessario per accedere al campo richiesto. Ad esempio, se un campo ratingValue è nidificato nel campo aggregateRating, puoi specificare il percorso come _root.aggregateRating.ratingValue.

Dopo aver aggiornato lo schema del sito web, il sito viene indicizzato di nuovo automaticamente. Si tratta di un'operazione che richiede molto tempo e può durare diverse ore.

Passaggi successivi

Utilizza i metadati indicizzati per: