Menggunakan data terstruktur untuk pengindeksan situs lanjutan

Jika pengindeksan situs lanjutan diaktifkan di penyimpanan data, Anda dapat menggunakan jenis data terstruktur berikut untuk memperkaya pengindeksan:

Halaman ini memperkenalkan kedua jenis data terstruktur ini untuk halaman web Anda dan menjelaskan cara menambahkan atribut terstruktur kustom ke skema penyimpanan data Anda.

Tentang tanggal halaman yang telah ditetapkan dan disimpulkan oleh Google

Saat meng-crawl halaman web di penyimpanan data situs Anda, Google menyimpulkan data halaman menggunakan properti yang berlaku untuk konten Anda. Vertex AI Search menambahkan properti data halaman yang disimpulkan ini ke skema Anda. Data yang disimpulkan ini mencakup properti tanggal standar berikut, yang juga disebut tanggal nama penulis:

  • datePublished: tanggal dan waktu saat halaman pertama kali dipublikasikan
  • dateModified: tanggal dan waktu saat halaman terakhir diubah

Properti ini diindeks secara otomatis. Anda dapat langsung menggunakan properti tanggal ini untuk memperkaya penelusuran tanpa menambahkannya ke skema. Untuk menambahkan tanggal publikasi ke situs Anda, lihat Memengaruhi tanggal publikasi di Google Penelusuran.

Untuk memahami cara menyertakan properti tanggal standar ini dalam permintaan penelusuran, seperti dalam ekspresi filter dan spesifikasi pengoptimalan, lihat Contoh kasus penggunaan menggunakan tanggal halaman yang disimpulkan Google.

Tentang kolom tanggal dan waktu kustom di halaman web

Anda dapat menambahkan kolom tanggal dan waktu kustom ke halaman web. Tag tersebut dapat digunakan dengan pengindeksan lanjutan saat Anda menambahkan atribut data terstruktur kustom ke skema penyimpanan data.
Berikut adalah contoh yang menunjukkan tempat untuk menambahkan tag meta tanggal waktu kustom bernama lastModified di halaman web Anda.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Vertex AI Search can use this date. -->
    <meta name="lastModified" content="2022-07-01">
</head>
<body>
    </body>
</html>

Untuk memahami cara menyertakan tag tanggal dan waktu kustom tersebut dalam permintaan penelusuran, seperti dalam ekspresi filter dan spesifikasi pengoptimalan, lihat Contoh kasus penggunaan menggunakan atribut tanggal dan waktu kustom.

Tentang atribut data terstruktur kustom

Anda dapat menambahkan atribut data terstruktur sebagai tag meta dan PageMaps ke halaman web dan menggunakannya untuk memperkaya pengindeksan. Untuk menggunakan atribut terstruktur kustom untuk pengindeksan, Anda harus memperbarui skema.

Contoh kasus penggunaan untuk tag meta

Misalkan Anda memiliki banyak halaman web yang relevan dengan berbagai departemen di organisasi Anda. Anda dapat menggunakan tag meta untuk memberi label pada halaman yang relevan untuk setiap departemen. Kemudian, Anda dapat menggunakan tag yang diindeks sebagai filter dalam kueri. Hal ini memungkinkan Anda membatasi hasil penelusuran ke halaman web yang berisi label yang cocok dengan salah satu departemen yang ditentukan.

Proses ini dapat dirangkum sebagai berikut:

  1. Tambahkan tag meta berikut ke sebagian halaman web Anda:
    • Relevan dengan departemen engineering dan IT: <meta name="department" content="eng, infotech">
    • Relevan dengan departemen keuangan dan SDM: <meta name="department" content="finance, human resources">
  2. Meng-crawl ulang halaman yang diperbarui.
  3. Tambahkan department ke skema penyimpanan data Anda sebagai array yang dapat diindeks seperti yang dijelaskan di bagian Menambahkan atribut data terstruktur kustom ke skema penyimpanan data.

Setelah memperbarui skema, penyimpanan data Anda akan otomatis diindeks ulang. Setelah pengindeksan ulang selesai, Anda dapat menggunakan filter department dalam ekspresi filter untuk mengurutkan ulang atau memfilter hasil penelusuran. Misalnya, saat pengguna dari departemen keuangan membuat kueri, hasil penelusuran dapat dibuat lebih relevan bagi mereka dengan filter department ditetapkan ke finance.

Contoh tag meta di halaman web

Berikut adalah contoh tag meta yang dapat Anda tambahkan ke halaman web. Tag tersebut dapat digunakan dengan pengindeksan lanjutan saat Anda menambahkan atribut data terstruktur kustom ke skema penyimpanan data.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Robots instructions for crawlers and for Vertex AI Search. -->
    <meta name="robots" content="index,follow">

    <!-- Vertex AI Search can use custom datetime fields to filter, boost, and order. -->
    <meta name="lastModified" content="2024-09-06">

    <!-- Vertex AI Search can filter by category or tags. -->
    <meta name="category" content="archived">
    <meta name="tags" content="legacy,interesting,faq">

    <!-- Vertex AI Search can index these common HTML tags. -->
    <meta name="description" content="A description of your web page's content.">
    <meta name="author" content="Your name or organization">
    <meta name="keywords" content="relevant,keywords,separated,by,commas">
    <link rel="canonical" href="https://www.yourwebsite.com/this-page">
    <meta property="og:title" content="Your Webpage Title">
    <meta property="og:description" content="A description of your webpage's content.">
    <meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
    <meta property="og:url" content="https://www.yourwebsite.com/this-page">
    <meta property="og:type" content="website">
    <meta name="twitter:card" content="summary_large_image">
    <meta name="twitter:title" content="Your customized Webpage Title">
    <meta name="twitter:description" content="A description of your webpage's content.">
    <meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>

Contoh kasus penggunaan untuk PageMaps

Misalnya, Anda memiliki beberapa halaman web yang berisi resep makanan. Anda dapat menambahkan data PageMap ke konten HTML setiap halaman. Kemudian, Anda dapat menggunakan nama atribut PageMap yang diindeks sebagai filter dalam kueri. Misalnya, jika Anda ingin meningkatkan atau menyembunyikan halaman web bergantung pada rating resep, Anda dapat mengikuti proses ini:

  1. Tambahkan data PageMap yang mirip dengan berikut ke halaman web Anda:

    <html>
    <head>
    ...
    <!--
    <PageMap>
        <DataObject type="document">
            <Attribute name="title">Baked potatoes</Attribute>
            <Attribute name="author">Dana A.</Attribute>
            <Attribute name="description">Homestyle baked potatoes in oven. This
            recipe uses Russet potatoes.</Attribute>
            <Attribute name="rating">4.9</Attribute>
            <Attribute name="lastUpdate">2015-01-01</Attribute>
        </DataObject>
    </PageMap>
    -->
    </head>
    ...
    </html>
    
  2. Meng-crawl ulang halaman yang diperbarui.

  3. Tambahkan rating ke skema penyimpanan data Anda sebagai array yang dapat diindeks seperti yang dijelaskan di bagian Menambahkan atribut data terstruktur kustom ke skema penyimpanan data.

Setelah memperbarui skema, penyimpanan data Anda akan otomatis diindeks ulang. Setelah pengindeksan ulang selesai, Anda dapat menggunakan atribut rating dalam ekspresi filter untuk mengurutkan ulang atau memfilter hasil penelusuran. Misalnya, saat pengguna menelusuri resep, tingkatkan hasil penelusuran yang memiliki rating tertinggi dengan menggunakan rating sebagai atribut numerik kustom.

Contoh kasus penggunaan untuk data schema.org

Misalnya, Anda memiliki situs ulasan dan halaman webnya dianotasi dengan data schema.org dalam format JSON-LD dalam tag script HTML. Kemudian, Anda dapat menggunakan anotasi yang diindeks sebagai filter dalam kueri. Misalnya, jika Anda ingin meningkatkan atau menyembunyikan halaman web bergantung pada rating gabungan, Anda dapat mengikuti proses ini:

  1. Tambahkan anotasi schema.org untuk konten ulasan yang mirip dengan hal berikut ke halaman web Anda. Untuk melihat jenis template schema.org lainnya yang tersedia, lihat Skema:

    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "Review",
      "aggregateRating": {
        "@type": "Average Rating",
        "ratingValue": 3.5,
        "reviewCount": 11
      },
      "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.",
      "name": "A Christmas Carol",
      "image": "christmas-carol-first-ed.jpg",
      "review": [
        {
          "@type": "Review",
          "author": "Alex T.",
          "datePublished": "2000-01-01",
          "reviewBody": "Read this in middle school and have loved this ever since.",
          "name": "Worth all the adaptations",
          "reviewRating": {
            "@type": "Rating",
            "bestRating": 5,
            "ratingValue": 5,
            "worstRating": 1
          }
        }
      ]
    }
    </script>
    
  2. Meng-crawl ulang halaman yang diperbarui.

  3. Tambahkan jalur ke ratingValue ke skema penyimpanan data Anda. Gunakan ID sebagai nama kolom dalam skema penyimpanan data, seperti rating_value seperti yang dijelaskan di bagian Menambahkan atribut data terstruktur kustom ke skema penyimpanan data.

Setelah memperbarui skema, penyimpanan data Anda akan otomatis diindeks ulang. Setelah pengindeksan ulang selesai, Anda dapat menggunakan atribut rating_value dalam ekspresi filter untuk mengurutkan ulang atau memfilter hasil penelusuran. Misalnya, saat pengguna menelusuri buku, tingkatkan hasil penelusuran yang memiliki rating teratas dengan menggunakan rating_value sebagai atribut numerik kustom.

Sebelum memulai

Sebelum memperbarui skema penyimpanan data, lakukan hal berikut:

  • Aktifkan pengindeksan situs lanjutan untuk penyimpanan data. Untuk informasi selengkapnya, lihat Mengaktifkan pengindeksan situs lanjutan.
  • Memahami cara kerja data terstruktur.
  • Pahami cara menggunakan PageMaps. Tinjau daftar DataObjects yang dikenali yang dapat ditambahkan ke data PageMap.
  • Pahami cara menggunakan tag meta. Pastikan Anda tidak menggunakan tag meta yang dikecualikan atau tidak didukung.
  • Pastikan atribut yang perlu diindeks tidak memiliki nilai berikut:
    • datePublished
    • dateModified
    • siteSearch
  • Pahami bahwa setelah menambahkan data terstruktur ke halaman web, Anda harus meng-crawl ulang halaman tersebut. Proses ini mungkin memerlukan waktu beberapa jam.
  • Pahami bahwa setelah Anda menambahkan atribut data terstruktur ke skema penyimpanan data, halaman web di penyimpanan data akan diindeks ulang secara otomatis. Pengindeksan ulang adalah operasi yang berjalan lama dan mungkin memerlukan waktu beberapa jam.

Menambahkan atribut data terstruktur kustom ke skema penyimpanan data

Untuk menambahkan atribut data terstruktur kustom ke skema penyimpanan data:

  1. Tambahkan tag meta, data PageMap, dan data schema.org ke semua halaman di situs Anda yang ingin Anda perkaya dengan pengindeksan data terstruktur:

    • Untuk tag meta:
      • Setiap tag meta harus memiliki atribut name yang ditetapkan ke kolom yang ingin Anda jadikan indeks dan atribut content-nya ke string dari satu atau beberapa nilai yang dipisahkan koma.
      • Vertex AI Search mendukung tag meta dengan nama yang cocok dengan pola [a-zA-Z0-9][a-zA-Z0-9-_]*. Pastikan Anda tidak menggunakan tag meta yang dikecualikan atau tidak didukung.
    • Untuk data PageMap:
      • Data PageMap harus terdiri dari DataObjects yang dikenali yang berisi nama Atribut yang ingin Anda indeks. Nama Atribut dalam DataObjects harus ditetapkan ke kolom yang ingin Anda indeks.
    • Untuk data schema.org:
      • Anotasi harus dalam format JSON-LD, Microdata, atau RDFa yang valid. Untuk mengetahui informasi selengkapnya, lihat Format yang didukung.
  2. Crawl ulang halaman web yang diperbarui.

  3. Lihat definisi skema untuk penyimpanan data Anda melalui REST API.

  4. Perbarui skema penyimpanan data melalui REST API. Untuk mengetahui informasi selengkapnya, lihat Tentang menyediakan skema Anda sendiri sebagai objek JSON.

    1. Tambahkan objek untuk setiap atribut kustom yang ingin Anda buat dapat ditelusuri, diambil, atau diindeks.
    2. Tambahkan atribut kustom dan tetapkan type-nya ke array.
    3. Tambahkan jenis data nilai atribut kustom.
    4. Tentukan sumber atribut kustom yang dapat ditemukan di kolom siteSearchStructuredDataSources.
    5. Untuk data schema.org: Tentukan jalur atribut dalam anotasi schema.org yang dimulai dengan string _root di kolom siteSearchSchemaOrgPaths.

    Berikut adalah contoh pembaruan skema untuk situs:

    {
      "type": "object",
      "properties": [{
        "CUSTOM_ATTRIBUTE": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"]
          }
        }
      }
      {
        "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE_SCHEMA_ORG_FIELD",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"]
          }
        }
      }],
      "$schema": "https://json-schema.org/draft/2020-12/schema"
    }

    Ganti kode berikut:

    • CUSTOM_ATTRIBUTE: nilai atribut name. Contoh:
      • Untuk tag meta yang ditentukan sebagai <meta name="department" content="eng, infotech">, gunakan department
      • Untuk Atribut PageMap yang ditentukan sebagai <Attribute name="rating">4.9</Attribute>, gunakan rating
    • DATA_TYPE: jenis data atribut name. Harus berupa string, angka, atau tanggal waktu. Contoh:

      • Untuk tag meta yang ditentukan sebagai <meta name="department" content="eng, infotech">, gunakan string
      • Untuk Atribut PageMap yang ditentukan sebagai <Attribute name="rating">4.9</Attribute>, gunakan number
      • Untuk Atribut PageMap yang ditentukan sebagai <Attribute name="lastPublished">2015-01-01</Attribute>, gunakan datetime

      Untuk informasi selengkapnya, lihat FieldType.

    • STRUCTURED_DATA_SOURCE_N: array yang terdiri dari satu atau kedua sumber data terstruktur berikut tempat atribut CUSTOM_ATTRIBUTE dapat ditemukan:

      • Jika atribut kustom dapat ditemukan sebagai tag meta, tentukan METATAG
      • Jika atribut kustom dapat ditemukan sebagai atribut PageMap, tentukan PAGEMAP
      • Jika atribut kustom dapat ditemukan sebagai data schema.org, tentukan SCHEMA_ORG
      • Jika kolom siteSearchStructuredDataSources tidak ada atau dibiarkan kosong, nilai dari ketiga sumber data akan digabungkan dalam array.
    • IDENTIFIER_FOR_SCHEMA_ORG_FIELD: ID kustom untuk menunjukkan kolom schema.org. Nama ini tidak harus sama dengan nama kolom dalam anotasi schema.org di halaman web Anda. Misalnya, jika jalur kolom adalah _root.nutrition.calories, ID-nya dapat berupa calorific_value atau nutrition_value

    • DATA_TYPE_SCHEMA_ORG_FIELD: jenis data kolom schema.org. Harus berupa string, angka, atau tanggal waktu. Contoh:

      • Untuk kolom schema.org yang ditentukan sebagai "calories":"240 calories", gunakan string
      • Untuk kolom schema.org yang ditentukan sebagai "calories": 240, gunakan number
      • Untuk kolom schema.org yang ditentukan sebagai "foundingDate": "1991-05-01", gunakan datetime

      Untuk informasi selengkapnya, lihat FieldType.

    • PATH_TO_THE_SCHEMA_ORG_FIELD: jalur ke satu kolom di kolom schema.org yang perlu diakses. Ini ditentukan menggunakan pemisah titik setelah setiap tingkat bertingkat. Anda harus menentukan jalur lengkap yang diperlukan untuk mengakses kolom yang diperlukan. Misalnya, jika kolom ratingValue disusun bertingkat dalam kolom aggregateRating, Anda dapat menentukan jalurnya sebagai _root.aggregateRating.ratingValue.

Setelah Anda memperbarui skema situs, situs akan diindeks ulang secara otomatis. Ini adalah operasi yang berjalan lama dan dapat memerlukan waktu beberapa jam.

Langkah selanjutnya

Gunakan metadata yang diindeks untuk hal berikut: