Memantau status replika dan status replikasi untuk disk regional


Compute Engine menyimpan salinan setiap disk regional di dua zona Google Cloud. Setiap salinan disebut replika zonal. Saat Anda menulis data ke disk, Compute Engine akan mereplikasi data tersebut secara sinkron ke kedua replika untuk memastikan ketersediaan tinggi (HA). Pada waktu tertentu, status replikasi disk disk regional memberi tahu Anda tentang kemampuan disk untuk menulis secara sinkron ke kedua replika. Status replikasi disk ditentukan oleh status replika dari replika zona disk. Status replika untuk zona menunjukkan status replika zona individual dibandingkan dengan data terbaru di disk. Jika replika zona berisi data disk terbaru, replika tersebut dianggap disinkronkan dengan data disk terbaru. Jika kedua replika zona disinkronkan,Persistent Disk Regional ataudisk Hyperdisk Balanced High Availability Anda dianggap direplikasi sepenuhnya.

Dokumen ini menjelaskan cara memantau status replika disk regional dan status replikasi disknya selama jangka waktu tertentu. Anda dapat menggunakan dokumen ini untuk melakukan hal berikut:

  1. Memeriksa status replika saat ini dan historis dari disk regional Anda.
  2. Gunakan informasi status replika dari titik waktu tertentu untuk menentukan apakah disk Anda direplikasi sepenuhnya.

Untuk mempelajari status replikasi disk dan status replika lebih lanjut, lihat Tentang replikasi disk sinkron.

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan guna melihat status replika menggunakan Cloud Monitoring, minta administrator untuk memberi Anda peran IAM berikut:

  • Untuk melihat metrik disk regional (salah satu dari berikut):

Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Memantau menggunakan konsol Google Cloud

Bagian ini menjelaskan cara memantau status replika dan status replikasi disk volume Hyperdisk Balanced High Availability atau Regional Persistent Disk menggunakan konsol Google Cloud.

Memeriksa apakah replika zona disinkronkan untuk satu disk

Anda dapat menggunakan konsol Google Cloud untuk memeriksa apakah replika zonaonal dari disk regional disinkronkan dengan data disk terbaru.

Untuk melihat informasi mendetail tentang status replika zona yang tepat untuk semua disk regional dalam project, periksa status replika zona menggunakan dasbor Cloud Monitoring.

Konsol

Untuk memantau status replika zona untuk disk regional Anda, lakukan hal berikut:

  1. Di konsol Google Cloud, buka halaman Disks.

    Buka Disk

  2. Di halaman Disk, di kolom Nama, pilih disk yang ingin Anda periksa status replikanya.

    Halaman Manage disk akan terbuka untuk disk yang dipilih dan menampilkan tab Details untuk disk tersebut.

  3. Klik tab Kemampuan observasi.

    Halaman Manage disk menampilkan informasi pemantauan untuk disk.

  4. Untuk melihat informasi status replika historis untuk disk Anda, di tab Observability, buka grafik Regional Persistent Disk Replication Status.

    Grafik menampilkan nilai status replika untuk replika zona Anda selama satu jam sebelumnya dalam bentuk dua garis grafik terpisah.

    Nilai status replika dapat berupa salah satu dari berikut:

    • 0: Replika tidak sinkron dengan data disk terbaru.
    • 1. Replika disinkronkan dengan data disk terbaru.
  5. Untuk memeriksa nilai status replika untuk replika zona Anda pada titik waktu tertentu, lakukan hal berikut:

    • Tahan kursor pada grafik untuk nilai waktu saat Anda ingin memeriksa status replika.
    • Untuk melihat nilai status replika untuk replika zona, buka bagian bawah grafik.
    • Opsional: Untuk melihat nama dan nilai status replika yang ditunjukkan oleh garis grafik, arahkan kursor ke garis grafik untuk nilai waktu tertentu. Grafik ini menyoroti nama dan status khusus waktu replika tersebut di dalam tooltip.
  6. Opsional: Untuk mengubah jangka waktu saat Anda ingin melihat data status replika, pilih jangka waktu di bagian atas tab Observabilitas. Tersedia opsi-opsi berikut:

    • 1 jam: jam sebelumnya. Ini adalah nilai defaultnya.
    • 6 jam: 6 jam sebelumnya.
    • 1 hari: hari sebelumnya.
    • 1 minggu: minggu sebelumnya.
    • 1 bulan: bulan sebelumnya.
    • 6 minggu: 6 minggu sebelumnya.
    • Kustom: jangka waktu tertentu yang Anda pilih. Untuk menentukan periode waktu pemantauan kustom, klik Kustom, lalu lakukan hal berikut:

      • Di kolom Tanggal dan waktu mulai, tentukan awal periode waktu pemantauan Anda. Anda harus menentukan waktu di masa lalu.
      • Di kolom Tanggal dan waktu akhir, tentukan akhir periode waktu pemantauan Anda. Anda harus menentukan waktu di masa lalu.
      • Untuk menyimpan jangka waktu pemantauan kustom, klik Terapkan.

Menentukan apakah disk telah direplikasi sepenuhnya

Setelah menentukan apakah replika zona Anda disinkronkan dengan data disk terbaru atau tidak, Anda dapat menggunakan informasi tersebut untuk menentukan apakah disk Anda direplikasi sepenuhnya atau tidak.

Pada waktu tertentu, disk direplikasi sepenuhnya jika nilai status replika untuk kedua replika zona adalah 1. Jika tidak, periksa status replika yang tepat pada saat itu untuk mengetahui apakah disk Anda degradasi atau melakukan sinkronisasi. Untuk informasi selengkapnya, lihat Memantau menggunakan metrik Cloud Monitoring.

Memantau menggunakan metrik Cloud Monitoring

Anda dapat memeriksa informasi mendetail tentang status replika zona yang tepat untuk semua disk regional menggunakan metrik Regional disk replica state di Cloud Monitoring.

Tentang metrik Regional disk replica state

Anda dapat melihat status replika disk saat ini dan historis dari replika zona Anda di dasbor Cloud Monitoring. Compute Engine mengambil status replika disk Anda setiap menit dan melaporkannya menggunakan metrik Regional disk replica state. Namun, jika terjadi pemadaman layanan di zona tertentu yang memengaruhi instance komputasi tempat replika zona terpasang, Anda tidak akan melihat data metrik Regional disk replica state untuk replika zona mana pun.

Berikut adalah kemungkinan nilai metrik Regional disk replica state. Replika zona Anda selalu berada dalam salah satu status replika disk ini.

  • Synced: Replika tersedia, secara sinkron menerima semua penulisan yang dilakukan ke disk, dan diupdate dengan semua data di disk.
  • CatchingUp: Replika tersedia, tetapi masih mengambil data di disk dari replika lainnya.
  • OutOfSync: Replika tidak tersedia untuk sementara dan tidak sinkron dengan data di disk.

Untuk mengetahui informasi tentang definisi metrik, lihat bagian Metrik Monitoring Compute Engine.

Anda dapat menggunakan data metrik Regional disk replica state untuk melakukan hal berikut:

  • Menentukan status replikasi disk regional Anda.
  • Meninjau histori status replika pada disk regional Anda untuk memahami apakah arsitektur failover Anda berfungsi sebagaimana mestinya dan mengambil tindakan yang diperlukan jika status disk regional Anda berubah.
  • Membuat pemberitahuan berdasarkan data metrik Regional disk replica state, mendeteksi setiap perubahan dalam status replika, dan melakukan tindakan yang diperlukan. Untuk mengetahui informasi selengkapnya tentang cara membuat pemberitahuan berbasis metrik, lihat Cara menambahkan kebijakan pemberitahuan.

Memeriksa data metrik Regional disk replica state

Untuk melihat status replika zona disk regional yang terpasang, buat kueri dan buat diagram sementara untuk metrik Regional disk replica state. Anda dapat melakukannya di Metrics Explorer menggunakan antarmuka berbasis menu, Monitoring Query Language (MQL), atau PromQL.

  1. Di konsol Google Cloud, buka halaman  Metrics explorer:

    Buka Metrics explorer

    Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.

    Halaman Metrics Explorer akan terbuka dan menampilkan tab Queries.

  2. Untuk melihat data status replika untuk setiap replika zonal dalam project, pilih data deret waktu untuk metrik Regional disk replica state, lalu hapus filter agregasi dengan melakukan tindakan berikut di toolbar panel kueri:

    1. Di menu Metric, klik Select a metric, lalu pilih Disk > Disk > Regional disk replica state.

    2. Klik Terapkan.

    3. Di menu Aggregation, pilih Unaggregated by None.

    Diagram akan muncul dan menampilkan data metrik dari jam sebelumnya untuk setiap replika sebagai deret waktu. Anda hanya melihat data metrik untuk replika zona disk yang terpasang.

    Untuk informasi selengkapnya tentang cara memilih deret waktu untuk metrik, lihat Memilih metrik saat menggunakan Metrics Explorer.

  3. Untuk melihat tampilan diagram dan tabel secara bersamaan, klik Keduanya di bagian atas diagram.

  4. Untuk melihat data semua properti disk regional yang tersedia, di bagian atas tampilan tabel, klik Column display options..., pilih semua kolom, lalu klik Ok.

    Dasbor menampilkan kolom berikut untuk setiap baris dalam tabel, bersama dengan nilainya saat ini:

    • disk_id: ID disk
    • zone: Region tempat disk regional dibuat.
    • replica_zone: Zona replika
    • state: Status replika
    • storage_type: Jenis penyimpanan disk
    • value: Nilai untuk status replika

    Untuk melihat data ini pada deret waktu yang sesuai dalam tampilan diagram, tahan kursor pada diagram pada waktu saat ini. Diagram ini menampilkan nilai ini di dalam tooltip.

  5. Untuk memeriksa status replika historis pada titik waktu tertentu, lakukan hal berikut:

    1. Tahan kursor di atas diagram pada nilai waktu tertentu sesuai pilihan Anda. Dasbor menampilkan data metrik untuk semua status replika dari semua replika zona di project Anda pada titik waktu tertentu.

      Dalam tampilan diagram, informasi ini muncul di dalam tooltip.

      Dalam tampilan tabel, informasi ini muncul sebagai baris terpisah.

    2. Perhatikan status replika dan nilai yang sesuai. Pada waktu tertentu, jika status tertentu memiliki nilai 1, replika berada dalam status tersebut.

      Dalam tampilan diagram, periksa status dan nilai replika di dalam tooltip untuk ID disk dan zona replika yang Anda inginkan.

      Dalam tampilan tabel, periksa kolom status dan value untuk ID disk dan zona replika tertentu yang Anda inginkan.

    Untuk mempelajari lebih lanjut arti status replika dan nilainya, lihat Memahami data metrik Regional disk replica state.

  6. Opsional: Untuk melihat informasi status replika untuk label tertentu, di menu Filter, pilih label yang datanya ingin Anda lihat, lalu selesaikan dialog. Anda dapat menambahkan beberapa filter.

    Dasbor hanya menampilkan data metrik untuk label yang difilter. Untuk mengetahui informasi selengkapnya tentang filter, lihat Memfilter data dalam diagram.

    Misalnya, untuk melihat data status replika untuk disk tertentu, lakukan hal berikut:

    1. Di menu Filter, pilih label name.
    2. Di menu Comparator, pilih = (equals).
    3. Di menu Value, pilih nama disk yang Anda inginkan.
  7. Opsional: Untuk menentukan persentase waktu replika disk tertentu disinkronkan, filter data untuk disk dan status tertentu, lalu gunakan menu agregasi:

    1. Di menu Filter, pilih label name.
    2. Di menu Comparator, pilih = (equals).
    3. Di menu Value, pilih nama disk.
    4. Di menu Filter, pilih label status.
    5. Di menu Comparator, pilih = (equals).
    6. Di menu Value, pilih Synced.
    7. Di menu Aggregation, pilih Mean by replica_zone.
    8. Pilih jangka waktu yang datanya ingin Anda lihat.

    Dasbor menampilkan data tentang status synced rata-rata untuk replika disk Anda selama jangka waktu yang ditentukan. Kalikan data ini dengan 100 untuk menentukan persentase waktu replika disinkronkan. Jika nilai untuk nilai rata-rata ditampilkan sebagai 1 untuk jangka waktu tersebut, replika selalu diperbarui dengan data terbaru. Nilai rata-rata yang kurang dari 1 menunjukkan bahwa replika tidak disinkronkan pada suatu waktu selama jangka waktu yang ditentukan.

    Untuk informasi selengkapnya tentang pengelompokan dan perataan, lihat Memilih cara menampilkan data dalam diagram.

  8. Opsional: Untuk mengubah jangka waktu pemantauan data metrik, di bagian atas dasbor, klik 1 jam terakhir, lalu pilih jangka waktu yang Anda inginkan.

    Anda dapat memilih jangka waktu relatif terhadap waktu saat ini, atau menentukan waktu mulai dan waktu berakhir sesuai pilihan Anda. Secara default, Anda akan melihat data metrik untuk satu jam sebelumnya.

MQL

  1. Di konsol Google Cloud, buka halaman  Metrics explorer:

    Buka Metrics explorer

    Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.

    Halaman Metrics Explorer akan terbuka dan menampilkan tab Queries.

  2. Di toolbar panel kueri, klik tombol yang namanya dimulai dengan < >.

  3. Di kolom Language, pilih MQL sebagai bahasa kueri Anda. Kolom ini berada di toolbar yang sama dengan yang memungkinkan Anda memformat kueri.

  4. Opsional: Nonaktifkan tombol Jalankan otomatis.

  5. Masukkan kueri, lalu klik Run query.

    Jika tombol Jalankan otomatis diaktifkan, tombol Jalankan kueri tidak akan ditampilkan.

    Misalnya, untuk melihat data status replika untuk disk bernama disk-1, jalankan kueri berikut:

    fetch gce_disk
    | metric 'compute.googleapis.com/disk/regional/replica_state'
    | filter (metadata.system_labels.name == 'disk-=1')
    | group_by 1m, [value_replica_state_mean: mean(value.replica_state)]
    | every 1m
    

    Sebagai contoh lain, untuk menentukan persentase waktu replika disinkronkan untuk disk yang disebut disk-1, jalankan kueri berikut:

    fetch gce_disk
    | metric 'compute.googleapis.com/disk/regional/replica_state'
    | filter (metadata.system_labels.name == 'disk-1') && (metric.state == 'Synced')
    | group_by 1m, [value_replica_state_mean: mean(value.replica_state)]
    | every 1m
    | group_by [metric.replica_zone],
        [value_replica_state_mean_mean: mean(value_replica_state_mean)]
    
  6. Untuk mengubah jangka waktu pemantauan data metrik, di bagian atas dasbor, klik 1 jam terakhir, pilih jangka waktu dan zona waktu yang Anda inginkan.

    Anda dapat memilih jangka waktu relatif terhadap waktu saat ini, atau menentukan waktu mulai dan waktu berakhir sesuai pilihan Anda. Secara default, Anda akan melihat data metrik untuk satu jam sebelumnya.

PromQL

  1. Di konsol Google Cloud, buka halaman  Metrics explorer:

    Buka Metrics explorer

    Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.

    Halaman Metrics Explorer akan terbuka dan menampilkan tab Queries.

  2. Di toolbar panel kueri, klik tombol yang namanya dimulai dengan < >.

  3. Di kolom Language, pilih PromQL sebagai bahasa kueri Anda. Kolom ini berada di toolbar yang sama dengan yang memungkinkan Anda memformat kueri.

  4. Opsional: Nonaktifkan tombol Jalankan otomatis.

  5. Masukkan kueri, lalu klik Run query.

    Jika tombol Jalankan otomatis diaktifkan, tombol Jalankan kueri tidak akan ditampilkan.

    Misalnya, untuk melihat data status replika untuk disk bernama disk-1, jalankan kueri berikut:

    avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",metadata_system_name="disk-1"}[${__interval}])
    

    Sebagai contoh lain, untuk menentukan persentase waktu replika disinkronkan untuk disk yang disebut disk-1, jalankan kueri berikut:

    avg by (replica_zone)(avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",state="Synced",metadata_system_name="disk-1"}[${__interval}]))
    
  6. Untuk mengubah jangka waktu pemantauan data metrik, di bagian atas dasbor, klik 1 jam terakhir, pilih jangka waktu dan zona waktu yang Anda inginkan.

    Anda dapat memilih jangka waktu relatif terhadap waktu saat ini, atau menentukan waktu mulai dan waktu berakhir sesuai pilihan Anda. Secara default, Anda akan melihat data metrik untuk satu jam sebelumnya.

Menentukan status replika zonal yang tepat menggunakan data metrik

Untuk memahami data metrik Regional disk replica state untuk disk regional, Anda harus memeriksa kolom status dan nilai untuk replika zona di diagram yang dihasilkan. Jika Anda tidak menambahkan filter apa pun ke kueri, hal-hal berikut akan terjadi:

  • Kolom status menampilkan semua kemungkinan status replika disk untuk replika zona, salah satu dari Synced, CatchingUp, dan OutOfSync. Diagram menampilkan setiap status ini dalam bentuk deret waktu untuk semua replika zona dari semua disk regional di project Anda.
  • Kolom nilai menunjukkan apakah replika zona berada dalam status replika disk tertentu atau tidak. Kolom ini menampilkan nilai biner yang sesuai (0 atau 1) untuk setiap nilai status untuk semua replika zona dari semua disk regional di project Anda.

Untuk semua replika zona, jika kolom nilai menampilkan 1 untuk status replika disk tertentu, maka replika zona tersebut berada dalam status tersebut. Jika kolom nilai menampilkan 0 untuk status tertentu, berarti replika tersebut tidak dalam status tersebut. Pada waktu tertentu, replika zona memiliki tepat salah satu status replika disk dengan 1 di kolom nilai. Dua status replika disk lainnya memiliki 0 di kolom value masing-masing.

Untuk setiap replika zona, diagram dan tabel menampilkan entri terpisah untuk setiap status replika disk: Synced, CatchingUp, dan OutOfSync. Kolom value untuk setiap entri adalah nilai biner (0 atau 1) yang menunjukkan apakah replika berada dalam status tersebut atau tidak. Pada waktu tertentu, replika zona memiliki tepat satu status replika dengan nilainya sebagai 1.

Menentukan status replikasi disk yang tepat

Anda dapat menggunakan status replika replika zona untuk menentukan status replikasi disk regional dengan cara berikut:

  • Jika kedua replika zona memiliki 1 sebagai nilai untuk status Synced, disk akan direplikasi sepenuhnya.
  • Jika salah satu replika zona memiliki 1 sebagai nilai untuk status Synced dan replika zona lainnya memiliki 1 sebagai nilai untuk status CatchingUp, maka disk sedang mengejar ketertinggalan.
  • Jika salah satu replika zona memiliki 1 sebagai nilai untuk status Synced dan replika zona lainnya memiliki 1 sebagai nilai untuk status OutOfSync, maka disk mengalami degradasi.

Misalnya, pertimbangkan disk bernama my-disk1 yang memiliki replika di us-central1-a dan us-central1-b. Skenario berikut menunjukkan nilai kolom status dan nilai untuk replika zona untuk setiap kemungkinan status replikasi my-disk1:

Direplikasi sepenuhnya

Dalam skenario ini, replika di us-central1-a dan replika di us-central1-b diperbarui dengan data terbaru di disk. Diagram menampilkan nilai berikut untuk setiap status replika disk untuk replika zona my-disk1:

replica_zone dengan status tersembunyi akhir nilai
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 1
us-central1-b CatchingUp 0
us-central1-b OutOfSync 0

Mengejar ketertinggalan

Dalam skenario ini, replika di us-central1-a diperbarui dengan data di disk dan replika di us-central1-b mengejar ketertinggalan data di disk. Diagram menampilkan nilai berikut untuk setiap status replika disk untuk replika zona my-disk1:

replica_zone dengan status tersembunyi akhir nilai
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 0
us-central1-b CatchingUp 1
us-central1-b OutOfSync 0

Terdegradasi

Dalam skenario ini, replika di us-central1-a diperbarui dengan data di disk dan replika di us-central1-b tidak sinkron. Diagram menampilkan nilai berikut untuk setiap status replika disk untuk replika zona my-disk1:

replica_zone dengan status tersembunyi akhir nilai
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 0
us-central1-b CatchingUp 0
us-central1-b OutOfSync 1

Langkah selanjutnya