Usar dados estruturados para indexação avançada de sites

Se a indexação avançada de sites estiver ativada no seu repositório de dados, você poderá usar o seguintes tipos de dados estruturados para enriquecer a indexação:

Esta página apresenta esses dois tipos de dados estruturados para suas páginas da Web e descreve como adicionar atributos estruturados personalizados ao esquema de armazenamento de dados.

Sobre as datas de página predefinidas e inferidas pelo Google

Ao rastrear as páginas da Web na loja de dados do seu site, o Google infere os dados da página usando as propriedades que se aplicam ao seu conteúdo. A Vertex AI para Pesquisa adiciona essas propriedades de dados de página inferidas ao seu esquema. Esses dados inferidos inclui as seguintes propriedades de data predefinidas, que também são chamadas datas de assinatura:

  • datePublished: a data e a hora em que a página foi publicada pela primeira vez
  • dateModified: a data e a hora em que a página foi modificada mais recentemente

Essas propriedades são indexadas automaticamente. Você pode usar essas datas para enriquecer a pesquisa sem adicioná-las ao esquema. Para adicionar datas de autoria ao seu site, consulte Influenciar as datas de autoria na Pesquisa Google.

Para saber como incluir essas propriedades de data predefinidas à sua pesquisa, solicitações, como em expressões de filtro e especificações otimizadas, consulte Exemplo de caso de uso com uma data de página inferida pelo Google.

Sobre campos de data e hora personalizados em uma página da Web

Você pode adicionar campos de data e hora personalizados às suas páginas da Web. Essas tags podem ser usadas com a indexação avançada quando você adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.
Confira um exemplo que mostra onde adicionar uma metatag de data e hora personalizada chamada lastModified na página da Web.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Vertex AI Search can use this date. -->
    <meta name="lastModified" content="2022-07-01">
</head>
<body>
    </body>
</html>

Para entender como incluir essas tags de data/hora personalizadas nas suas solicitações de pesquisa, como em expressões de filtro e especificações de aumento, consulte Exemplo de caso de uso com um atributo de data/hora personalizado.

Sobre os atributos de dados estruturados personalizados

É possível adicionar atributos de dados estruturados à sua Web, como tags meta e PageMaps e use-as para enriquecer a indexação. Para usar atributos estruturados personalizados para indexação, atualize o esquema.

Exemplo de caso de uso para tags meta

Suponha que você tenha um grande número de páginas da web que são relevantes para várias em vários departamentos da organização. É possível usar tags meta para rotular as páginas. relevantes para cada departamento. Em seguida, use as tags indexadas como filtros nas consultas. Isso permite que você restrinja os resultados da pesquisa a páginas da Web contendo um rótulo que corresponda a qualquer um dos departamentos especificados.

Esse processo pode ser resumido da seguinte forma:

  1. Adicione as seguintes tags meta a um subconjunto das suas páginas da Web:
    • Relevante para os departamentos de engenharia e TI: <meta name="department" content="eng, infotech">
    • Relevante para os departamentos financeiro e de RH: <meta name="department" content="finance, human resources">
  2. Refazer a análise das páginas atualizadas.
  3. Adicione department ao esquema do repositório de dados como uma matriz indexável, conforme descrito na seção Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.

Depois de atualizar o esquema, o repositório de dados é reindexado automaticamente. Depois que a reindexação for concluída, você poderá usar o filtro department em um expressão de filtro para reordenar ou filtrar a pesquisa resultados. Por exemplo, quando usuários do departamento financeiro emitem consultas, os resultados da pesquisa podem ser mais relevantes para eles com a department filter definido como finance.

Exemplo de tags meta em uma página da Web

Este é um exemplo de tags meta que podem ser adicionadas sua página da Web. Essas tags podem ser usadas com indexação avançada quando você adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Robots instructions for crawlers and for Vertex AI Search. -->
    <meta name="robots" content="index,follow">

    <!-- Vertex AI Search can use custom datetime fields to filter, boost, and order. -->
    <meta name="lastModified" content="2024-09-06">

    <!-- Vertex AI Search can filter by category or tags. -->
    <meta name="category" content="archived">
    <meta name="tags" content="legacy,interesting,faq">

    <!-- Vertex AI Search can index these common HTML tags. -->
    <meta name="description" content="A description of your web page's content.">
    <meta name="author" content="Your name or organization">
    <meta name="keywords" content="relevant,keywords,separated,by,commas">
    <link rel="canonical" href="https://www.yourwebsite.com/this-page">
    <meta property="og:title" content="Your Webpage Title">
    <meta property="og:description" content="A description of your webpage's content.">
    <meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
    <meta property="og:url" content="https://www.yourwebsite.com/this-page">
    <meta property="og:type" content="website">
    <meta name="twitter:card" content="summary_large_image">
    <meta name="twitter:title" content="Your customized Webpage Title">
    <meta name="twitter:description" content="A description of your webpage's content.">
    <meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>

Exemplo de caso de uso para PageMaps

Suponha que você tenha várias páginas da Web com receitas de comida. É possível adicionar dados do PageMap ao conteúdo HTML de cada página. É possível usar o PageMap indexado nomes de atributos como filtros nas consultas. Por exemplo, se você pretende aumentar ou ocultar páginas da Web dependendo das classificações das receitas, siga este processo:

  1. Adicione dados do PageMap semelhantes aos seguintes às suas páginas da Web:

    <html>
    <head>
    ...
    <!--
    <PageMap>
        <DataObject type="document">
            <Attribute name="title">Baked potatoes</Attribute>
            <Attribute name="author">Dana A.</Attribute>
            <Attribute name="description">Homestyle baked potatoes in oven. This
            recipe uses Russet potatoes.</Attribute>
            <Attribute name="rating">4.9</Attribute>
            <Attribute name="lastUpdate">2015-01-01</Attribute>
        </DataObject>
    </PageMap>
    -->
    </head>
    ...
    </html>
    
  2. Rastreie novamente as páginas atualizadas.

  3. Adicione rating ao esquema do repositório de dados como uma matriz indexável, conforme descrito na seção Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.

Depois de atualizar o esquema, o repositório de dados é reindexado automaticamente. Depois que a reindexação for concluída, será possível usar o atributo rating em um expressão de filtro para reordenar ou filtrar a pesquisa resultados. Por exemplo, quando os usuários pesquisam receitas, aumente os resultados de pesquisa com as classificações mais altas usando rating como um atributo numérico personalizado.

Exemplo de caso de uso para dados do schema.org

Suponha que você tenha um site de avaliações e as páginas da Web dele tenham a anotação dados do schema.org no formato JSON-LD na tag HTML script; Em seguida, use as anotações indexadas como filtros nas suas consultas. Por exemplo, se você pretende para otimizar ou ocultar páginas da Web dependendo das classificações agregadas, siga este processo:

  1. Adicione as anotações do schema.org para conteúdo de avaliação semelhante ao seguinte às suas páginas da Web. Para conferir outros tipos de modelos de schema.org disponíveis, consulte Esquemas:

    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "Review",
      "aggregateRating": {
        "@type": "Average Rating",
        "ratingValue": 3.5,
        "reviewCount": 11
      },
      "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.",
      "name": "A Christmas Carol",
      "image": "christmas-carol-first-ed.jpg",
      "review": [
        {
          "@type": "Review",
          "author": "Alex T.",
          "datePublished": "2000-01-01",
          "reviewBody": "Read this in middle school and have loved this ever since.",
          "name": "Worth all the adaptations",
          "reviewRating": {
            "@type": "Rating",
            "bestRating": 5,
            "ratingValue": 5,
            "worstRating": 1
          }
        }
      ]
    }
    </script>
    
  2. Rastreie novamente as páginas atualizadas.

  3. Adicione o caminho para ratingValue ao esquema do repositório de dados. Use um identificador como o nome do campo no esquema do repositório de dados, como rating_value, conforme descrito na seção Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.

Depois de atualizar o esquema, o repositório de dados é reindexado automaticamente. Depois que a reindexação for concluída, use o atributo rating_value em uma expressão de filtro para reordenar ou filtrar os resultados da pesquisa. Por exemplo, quando os usuários pesquisam livros, aumente os resultados de pesquisa com as classificações mais altas usando rating_value como um atributo numérico personalizado.

Antes de começar

Antes de atualizar o esquema do repositório de dados, faça o seguinte:

  • Ativar a indexação avançada de sites para o repositório de dados. Para mais informações, consulte Ativar a indexação avançada de sites.
  • Entenda como os dados estruturados funcionam.
  • Entenda como usar PageMaps. Analise a lista de DataObjects reconhecidos que podem ser adicionados aos dados do PageMap.
  • Saiba como usar tags meta. Não use todas as metatags excluídas ou incompatíveis.
  • Verifique se o atributo que precisa ser indexado não tem nenhum dos seguintes valores:
    • datePublished
    • dateModified
    • siteSearch
  • Depois de adicionar dados estruturados às suas páginas da Web, você precisa rastrear novamente as páginas. Isso pode levar várias horas.
  • Depois de adicionar atributos de dados estruturados ao repositório de dados as páginas da Web no repositório de dados serão reindexadas automaticamente. A reindexação é uma operação de longa duração que pode levar várias horas.

Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados

Para adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados:

  1. Adicione as tags meta, os dados do PageMap e os dados do schema.org a todas as páginas do seu site que você quer aprimorar com a indexação de dados estruturados:

    • Para tags meta:
      • Cada tag meta precisa ter o atributo name definido para o campo que você indexar e seu atributo content para uma string de um ou mais valores separados por vírgula.
      • A Pesquisa da Vertex AI oferece suporte a tags meta com nomes que correspondem ao padrão [a-zA-Z0-9][a-zA-Z0-9-_]*. Não use metatags excluídas ou sem suporte.
    • Para dados do PageMap:
      • Os dados do PageMap precisam consistir em DataObjects reconhecidos que contenham os nomes de atributo que você quer indexar. Os nomes de atributos nos DataObjects precisam ser definidos para o campo que você quer indexar.
    • Para dados do schema.org:
      • As anotações precisam estar em um formato válido de JSON-LD, microdados ou RDFa. Para mais informações, consulte Formatos compatíveis.
  2. Rastreie novamente as páginas da Web atualizadas.

  3. Confira a definição do esquema do seu repositório de dados na API REST.

  4. Atualize o esquema da loja de dados pela API REST. Para mais informações, consulte Como fornecer seu próprio esquema como um objeto JSON.

    1. Adicione objetos para cada atributo personalizado que você quer tornar pesquisável, recuperável ou indexável.
    2. Adicione o atributo personalizado e defina o type como array.
    3. Adicione o tipo de dados do valor do atributo personalizado.
    4. Especifique a origem do atributo personalizado em que ele pode ser encontrado no siteSearchStructuredDataSources.
    5. Para dados do schema.org: especifique o caminho do atributo na anotação schema.org começando com a string _root no campo siteSearchSchemaOrgPaths.

    Confira a seguir um exemplo de atualização de esquema para um site:

    {
      "type": "object",
      "properties": [{
        "CUSTOM_ATTRIBUTE": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"]
          }
        }
      }
      {
        "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE_SCHEMA_ORG_FIELD",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"]
          }
        }
      }],
      "$schema": "https://json-schema.org/draft/2020-12/schema"
    }

    Substitua:

    • CUSTOM_ATTRIBUTE: o valor do atributo name. Exemplo:
      • Para uma tag meta definida como <meta name="department" content="eng, infotech">, usar department
      • Para um atributo PageMap definido como <Attribute name="rating">4.9</Attribute>, use rating.
    • DATA_TYPE: o tipo de dados do atributo name. Precisa ser string, number ou datetime. Exemplo:

      • Para uma tag meta definida como <meta name="department" content="eng, infotech">, usar string
      • Para um atributo PageMap definido como <Attribute name="rating">4.9</Attribute>, usar number
      • Para um atributo PageMap definido como <Attribute name="lastPublished">2015-01-01</Attribute>, use datetime.

      Para ver mais informações, consulte FieldType.

    • STRUCTURED_DATA_SOURCE_N: uma matriz composta de um ou ambas as fontes de dados estruturados a seguir, em que o O atributo CUSTOM_ATTRIBUTE pode ser encontrado:

      • Se o atributo personalizado puder ser encontrado como uma tag meta, especifique METATAG
      • Se o atributo personalizado puder ser encontrado como um atributo do PageMap, especifique PAGEMAP.
      • Se o atributo personalizado puder ser encontrado como dados de schema.org, especifique SCHEMA_ORG.
      • Se o campo siteSearchStructuredDataSources estiver ausente ou em branco, os valores das três fontes de dados serão mesclados em uma matriz.
    • IDENTIFIER_FOR_SCHEMA_ORG_FIELD: um identificador personalizado para indicar o campo schema.org. Ele não precisa ser igual ao nome do campo na anotação do schema.org na sua página da Web. Por exemplo, se o caminho do campo for _root.nutrition.calories, o identificador poderá ser calorific_value ou nutrition_value.

    • DATA_TYPE_SCHEMA_ORG_FIELD: o tipo de dados do no campo schema.org. Precisa ser string, número ou data/hora. Exemplo:

      • Para um campo do schema.org definido como "calories":"240 calorias", usar string
      • Para um campo schema.org definido como "calories": 240, use number
      • Para um campo schema.org definido como "foundingDate": "1991-05-01", use datetime

      Para ver mais informações, consulte FieldType.

    • PATH_TO_THE_SCHEMA_ORG_FIELD: o caminho para um único no campo schema.org que precisa ser acessado. É especificado usando separadores de pontos após cada nível aninhado. Você deve especificar o completo do caminho necessário para acessar o campo obrigatório. Por exemplo, se um campo ratingValue estiver aninhado no campo aggregateRating, será possível especificar o caminho como _root.aggregateRating.ratingValue.

Depois que você atualiza o esquema do site, ele é reindexado automaticamente. Essa é uma operação de longa duração que pode levar várias horas.

A seguir

Use os metadados indexados para: