Use dados estruturados para a indexação avançada de Websites

Se a indexação avançada de Websites estiver ativada no seu repositório de dados, pode usar os seguintes tipos de dados estruturados para enriquecer a indexação:

Esta página apresenta estes dois tipos de dados estruturados para as suas páginas Web e descreve como adicionar atributos estruturados personalizados ao esquema da sua loja de dados.

Acerca das datas das páginas predefinidas e inferidas pela Google

Ao rastrear as páginas Web no seu arquivo de dados do Website, a Google infere os dados das páginas através das propriedades que se aplicam ao seu conteúdo. O Vertex AI Search adiciona estas propriedades de dados de páginas inferidas ao seu esquema. Estes dados inferidos incluem as seguintes propriedades de data predefinidas, que também são denominadas datas de indicação de autoria:

  • datePublished: a data e a hora em que a página foi publicada pela primeira vez
  • dateModified: a data e a hora em que a página foi modificada mais recentemente

Estas propriedades são indexadas automaticamente. Pode usar diretamente estas propriedades de data para enriquecer a sua pesquisa sem as adicionar ao esquema. Para adicionar datas de autoria ao seu Website, consulte o artigo Influencie as datas de autoria na Pesquisa Google.

Para compreender como incluir estas propriedades de data predefinidas nos seus pedidos de pesquisa, como em expressões de filtro e especificações de aumento, consulte o exemplo de utilização com uma data da página inferida pela Google.

Acerca dos campos de data/hora personalizados numa página Web

Pode adicionar campos de data/hora personalizados às suas páginas Web. Estas etiquetas podem ser usadas com a indexação avançada quando adiciona atributos de dados estruturados personalizados ao esquema do repositório de dados.
Segue-se um exemplo que mostra onde adicionar uma metatag de data/hora personalizada denominada lastModified na sua página Web.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Vertex AI Search can use this date. -->
    <meta name="lastModified" content="2022-07-01">
</head>
<body>
    </body>
</html>

Para compreender como incluir estas etiquetas de data/hora personalizadas nos seus pedidos de pesquisa, como em expressões de filtro e especificações de aumento, consulte o exemplo de utilização com um atributo de data/hora personalizado.

Acerca dos atributos de dados estruturados personalizados

Pode adicionar atributos de dados estruturados como etiquetas meta e mapas de páginas às suas páginas Web e usá-los para enriquecer a indexação. Para usar atributos estruturados personalizados para indexação, tem de atualizar o seu esquema.

Exemplo de utilização de etiquetas meta

Suponhamos que tem um grande número de páginas Web relevantes para vários departamentos na sua organização. Pode usar etiquetas meta para etiquetar as páginas relevantes para cada departamento. Em seguida, pode usar as etiquetas indexadas como filtros nas suas consultas. Isto permite-lhe restringir os resultados da pesquisa a páginas Web que contenham uma etiqueta que corresponda a qualquer um dos departamentos especificados.

Este processo pode ser resumido da seguinte forma:

  1. Adicione as seguintes etiquetas meta a um subconjunto das suas páginas Web:

    • Relevante para os departamentos de engenharia e TI:

      <meta name="department" content="eng, infotech">
      <meta property="og:title" content="Password best practices">
      
    • Relevante para os departamentos de finanças e RH:

      <meta name="department" content="finance, human resources">
      <meta property="og:image" content="https://example.com/images/team-training-contractors.jpg">
      

      Para um exemplo mais elaborado, consulte o artigo Exemplos de etiquetas meta numa página Web.

  2. Volte a rastrear as páginas atualizadas.

  3. Adicione department ao esquema da loja de dados como uma matriz indexável, conforme descrito na secção Adicione atributos de dados estruturados personalizados ao esquema da loja de dados.

Após a atualização do esquema, o arquivo de dados é reindexado automaticamente. Após a reindexação estar concluída, pode usar o filtro department numa expressão de filtro para reordenar ou filtrar os resultados da pesquisa. Por exemplo, quando os utilizadores do departamento financeiro emitem consultas, os resultados da pesquisa podem ser tornados mais relevantes para eles com o department filtro definido como finance.

Exemplo de etiquetas meta numa página Web

Segue-se um exemplo das etiquetas meta que pode adicionar à sua página Web. Estas etiquetas podem ser usadas com a indexação avançada quando adiciona atributos de dados estruturados personalizados ao esquema do repositório de dados.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Robots instructions for crawlers and for Vertex AI Search. -->
    <meta name="robots" content="index,follow">

    <!-- Vertex AI Search can use custom datetime fields to filter, boost, and order. -->
    <meta name="lastModified" content="2024-09-06">

    <!-- Vertex AI Search can filter by category or tags. -->
    <meta name="category" content="archived">
    <meta name="tags" content="legacy,interesting,faq">

    <!-- Vertex AI Search can index these common HTML tags. -->
    <meta name="description" content="A description of your web page's content.">
    <meta name="author" content="Your name or organization">
    <meta name="keywords" content="relevant,keywords,separated,by,commas">
    <link rel="canonical" href="https://www.yourwebsite.com/this-page">
    <meta property="og:title" content="Your Webpage Title">
    <meta property="og:description" content="A description of your webpage's content.">
    <meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
    <meta property="og:url" content="https://www.yourwebsite.com/this-page">
    <meta property="og:type" content="website">
    <meta name="twitter:card" content="summary_large_image">
    <meta name="twitter:title" content="Your customized Webpage Title">
    <meta name="twitter:description" content="A description of your webpage's content.">
    <meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>

Exemplo de utilização dos mapas de páginas

Suponhamos que tem várias páginas Web com receitas de comida. Pode adicionar dados do PageMap ao conteúdo HTML de cada página. Em seguida, pode usar os nomes dos atributos PageMap indexados como filtros nas suas consultas. Por exemplo, se pretender realçar ou ocultar páginas Web consoante as classificações das receitas, pode seguir este processo:

  1. Adicione dados do PageMap semelhantes aos seguintes às suas páginas Web:

    <html>
    <head>
    ...
    <!--
    <PageMap>
        <DataObject type="document">
            <Attribute name="title">Baked potatoes</Attribute>
            <Attribute name="author">Dana A.</Attribute>
            <Attribute name="description">Homestyle baked potatoes in oven. This
            recipe uses Russet potatoes.</Attribute>
            <Attribute name="rating">4.9</Attribute>
            <Attribute name="lastUpdate">2015-01-01</Attribute>
        </DataObject>
    </PageMap>
    -->
    </head>
    ...
    </html>
    
  2. Volte a rastrear as páginas atualizadas.

  3. Adicione rating ao esquema da loja de dados como uma matriz indexável, conforme descrito na secção Adicione atributos de dados estruturados personalizados ao esquema da loja de dados.

Após a atualização do esquema, o arquivo de dados é reindexado automaticamente. Após a reindexação estar concluída, pode usar o atributo rating numa expressão de filtro para reordenar ou filtrar os resultados da pesquisa. Por exemplo, quando os utilizadores pesquisam receitas, aumente os resultados da pesquisa com melhor classificação usando rating como um atributo numérico personalizado.

Exemplo de utilização de dados schema.org

Suponhamos que tem um Website de críticas e que as respetivas páginas Web estão anotadas com dados de schema.org no formato JSON-LD na etiqueta script HTML. Em seguida, pode usar as anotações indexadas como filtros nas suas consultas. Por exemplo, se pretender melhorar ou ocultar páginas Web consoante as classificações agregadas, pode seguir este processo:

  1. Adicione as anotações schema.org para conteúdo de críticas semelhante ao seguinte às suas páginas Web. Para ver outros tipos de modelos schema.org disponíveis, consulte Esquemas:

    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "Review",
      "aggregateRating": {
        "@type": "Average Rating",
        "ratingValue": 3.5,
        "reviewCount": 11
      },
      "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.",
      "name": "A Christmas Carol",
      "image": "christmas-carol-first-ed.jpg",
      "review": [
        {
          "@type": "Review",
          "author": "Alex T.",
          "datePublished": "2000-01-01",
          "reviewBody": "Read this in middle school and have loved this ever since.",
          "name": "Worth all the adaptations",
          "reviewRating": {
            "@type": "Rating",
            "bestRating": 5,
            "ratingValue": 5,
            "worstRating": 1
          }
        }
      ]
    }
    </script>
    
  2. Volte a rastrear as páginas atualizadas.

  3. Adicione o caminho para ratingValue ao esquema da loja de dados. Use um identificador como o nome do campo no esquema da loja de dados, como rating_value, conforme descrito na secção Adicione atributos de dados estruturados personalizados ao esquema da loja de dados.

Após a atualização do esquema, o arquivo de dados é reindexado automaticamente. Após a reindexação estar concluída, pode usar o atributo rating_value numa expressão de filtro para reordenar ou filtrar os resultados da pesquisa. Por exemplo, quando os utilizadores pesquisam livros, aumente os resultados da pesquisa com melhor classificação usando rating_value como um atributo numérico personalizado.

Antes de começar

Antes de atualizar o esquema do arquivo de dados, faça o seguinte:

  • Ative a indexação avançada de Websites para o arquivo de dados. Para mais informações, consulte o artigo Ative a indexação avançada de Websites.
  • Compreenda como funcionam os dados estruturados.
  • Compreenda como usar os PageMaps. Reveja a lista de objetos de dados reconhecidos que podem ser adicionados aos dados do PageMap.
  • Compreenda como usar etiquetas meta. Certifique-se de que não usa meta tags excluídas nem não suportadas.
  • Certifique-se de que o atributo que tem de ser indexado não tem nenhum dos seguintes valores:
    • datePublished
    • dateModified
    • siteSearch
  • Compreenda que, depois de adicionar dados estruturados às suas páginas Web, tem de rastrear novamente as páginas. Este processo pode demorar várias horas.
  • Compreender que, depois de adicionar atributos de dados estruturados ao esquema do repositório de dados, as páginas Web no seu repositório de dados são reindexadas automaticamente. A reindexação é uma operação de longa duração que pode demorar várias horas.

Adicione atributos de dados estruturados personalizados ao esquema da loja de dados

Para adicionar atributos de dados estruturados personalizados ao esquema da loja de dados:

  1. Adicione etiquetas meta, dados do PageMap e dados do schema.org a todas as páginas do seu Website que quer enriquecer com a indexação de dados estruturados:

    • Para etiquetas meta:

      • Cada etiqueta meta tem de ter o respetivo atributo name definido para o campo que quer indexar e o respetivo atributo content para uma string de um ou mais valores separados por vírgulas.
      • A Vertex AI Search suporta etiquetas meta com nomes que correspondem ao padrão [a-zA-Z0-9][a-zA-Z0-9-_]*. Certifique-se de que não usa meta tags excluídas nem meta tags não suportadas.

        Se o nome da etiqueta meta contiver um caráter especial, como dois pontos (:), tem de escolher um identificador diferente no esquema para o representar e, em seguida, especificar o nome exato da etiqueta meta no campo siteSearchMetatagName do esquema.

    • Para dados do PageMap:

      • Os dados do PageMap têm de consistir em objetos de dados reconhecidos que contenham nomes de atributos que quer indexar. Os nomes dos atributos nos DataObjects têm de ser definidos para o campo que quer indexar.
    • Para dados schema.org:

      • As anotações têm de estar num formato JSON-LD, Microdata ou RDFa válido. Para mais informações, consulte o artigo Formatos suportados.
  2. Volte a rastrear as páginas Web atualizadas.

  3. Veja a definição do esquema para o seu repositório de dados através da API REST.

  4. Atualize o esquema do repositório de dados através da Google Cloud consola ou da API. Se optar por fazê-lo através da API, saiba como fornecer o seu próprio esquema como um objeto JSON.

    1. Adicione objetos para cada atributo personalizado que quer tornar pesquisável, recuperável ou indexável.
    2. Adicione o atributo personalizado e defina o respetivo type como array.
    3. Adicione o tipo de dados do valor do atributo personalizado.
    4. Especifique a origem do atributo personalizado onde pode ser encontrado no campo siteSearchStructuredDataSources.
    5. Para dados de schema.org: especifique o caminho do atributo na anotação de schema.org, começando com a string _root no campo siteSearchSchemaOrgPaths.

    Segue-se um exemplo de uma atualização do esquema para um Website:

    {
      "type": "object",
      "properties": {
        "CUSTOM_ATTRIBUTE": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchMetatagName": "METATAG_NAME",
            "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"]
          }
        }
      },
      {
        "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE_SCHEMA_ORG_FIELD",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"]
          }
        }
      },
      "$schema": "https://json-schema.org/draft/2020-12/schema"
    }

    Substitua o seguinte:

    • CUSTOM_ATTRIBUTE: o valor do atributo name. Por exemplo:

      • Para uma etiqueta meta definida como <meta name="department" content="eng, infotech">, use department
      • Para um atributo PageMap definido como <Attribute name="rating">4.9</Attribute>, use rating

      Por vezes, o nome da etiqueta meta que quer adicionar ao esquema não segue o padrão [a-zA-Z0-9][a-zA-Z0-9-_]* e contém carateres especiais, como dois pontos :. Nestes casos, especifique um atributo personalizado representativo do nome da etiqueta meta e, em seguida, especifique o nome da etiqueta meta exato no campo siteSearchMetatagName. Por exemplo, se o nome da etiqueta meta for og:updated_time, use og_updated_time como o identificador no campo CUSTOM_ATTRIBUTE e use og:updated_time no campo METATAG_NAME.

    • DATA_TYPE: o tipo de dados do atributo name. Tem de ser uma string, um número ou uma data/hora. Por exemplo:

      • Para uma etiqueta meta definida como <meta name="department" content="eng, infotech">, use string
      • Para um atributo PageMap definido como <Attribute name="rating">4.9</Attribute>, use number
      • Para um atributo PageMap definido como <Attribute name="lastPublished">2015-01-01</Attribute>, use datetime

      Para mais informações, consulte FieldType.

    • METATAG_NAME: o nome exato da etiqueta meta, tal como se encontra na página Web. Este campo é útil quando o nome da etiqueta meta que quer adicionar ao esquema não segue o padrão [a-zA-Z0-9][a-zA-Z0-9-_]* e contém carateres especiais, como um dois pontos :. Nestes casos, especifique um atributo personalizado representativo do nome da etiqueta meta no campo CUSTOM_ATTRIBUTE e, em seguida, especifique o nome da etiqueta meta exato no campo siteSearchMetatagName. Por exemplo, se o nome da etiqueta meta for og:updated_time, use og_updated_time como identificador no campo CUSTOM_ATTRIBUTE e use og:updated_time no campo METATAG_NAME. Quando adiciona este campo para atualizar o esquema, tem de usar o ponto final v1alpha em vez do ponto final v1 para chamar o método schema.

    • STRUCTURED_DATA_SOURCE_N: uma matriz composta por uma ou ambas as seguintes origens de dados estruturados onde o atributo CUSTOM_ATTRIBUTE pode ser encontrado:

      • Se for possível encontrar o atributo personalizado como uma etiqueta meta, especifique METATAGS
      • Se for possível encontrar o atributo personalizado como um atributo PageMap, especifique PAGEMAP
      • Se o atributo personalizado puder ser encontrado como dados de schema.org, especifique SCHEMA_ORG
      • Se o campo siteSearchStructuredDataSources estiver ausente ou for deixado vazio, os valores de todas as três origens de dados são unidos numa matriz.
    • IDENTIFIER_FOR_SCHEMA_ORG_FIELD: um identificador personalizado para denotar o campo schema.org. Não tem de ser exatamente igual ao nome do campo na anotação schema.org na sua página Web. Por exemplo, se o caminho do campo for _root.nutrition.calories, o identificador pode ser calorific_value ou nutrition_value.

    • DATA_TYPE_SCHEMA_ORG_FIELD: o tipo de dados do campo schema.org. Tem de ser uma string, um número ou uma data/hora. Por exemplo:

      • Para um campo schema.org definido como "calories":"240 calories", use string
      • Para um campo schema.org definido como "calories": 240, use number
      • Para um campo schema.org definido como "foundingDate": "1991-05-01", use datetime

      Para mais informações, consulte FieldType.

    • PATH_TO_THE_SCHEMA_ORG_FIELD: o caminho para um único campo no campo schema.org ao qual é necessário aceder. É especificado com separadores de pontos após cada nível aninhado. Tem de especificar o caminho completo necessário para aceder ao campo obrigatório. Por exemplo, se um campo ratingValue estiver aninhado no campo aggregateRating, pode especificar o caminho como _root.aggregateRating.ratingValue.

Depois de atualizar o esquema do Website, o Website é reindexado automaticamente. Esta é uma operação de longa duração que pode demorar várias horas.

O que se segue?

Use os metadados indexados para o seguinte: