Tentang Persistent Disk regional


Persistent Disk Regional adalah opsi penyimpanan yang dapat Anda gunakan untuk mengimplementasikan layanan ketersediaan tinggi (HA) di Compute Engine. Persistent Disk Regional secara sinkron mereplikasi data antara dua zona di region yang sama dan memastikan HA untuk data disk hingga satu kegagalan zona.

Volume Persistent Disk Regional dirancang untuk workload yang memerlukan Toleransi Jumlah Data yang Hilang (RPO) dan Batas Waktu Pemulihan (RTO) yang lebih rendah. Untuk mempelajari RPO dan RTO lebih lanjut, lihat Dasar-dasar perencanaan pemulihan dari bencana (disaster recovery).

Volume Persistent Disk Regional dirancang juga agar berfungsi dengan grup instance terkelola regional.

Dokumen ini memberikan ringkasan tentang Persistent Disk regional dan cara menggunakan volume Persistent Disk regional untuk membangun layanan dengan ketersediaan tinggi (HA).

Jika memutuskan untuk menggunakan Persistent Disk regional, pastikan Anda membandingkan berbagai opsi untuk meningkatkan ketersediaan layanan serta biaya, performa, dan ketahanan untuk berbagai arsitektur layanan.

Replikasi disk zona untuk Persistent Disk regional

Volume Persistent Disk regional memiliki zona utama dan sekunder di dalam region tempatnya menyimpan data disk:

  • Zona utama adalah zona yang sama dengan instance virtual machine (VM) tempat Anda memasang disk.
  • Zona sekunder adalah zona alternatif pilihan Anda dalam region yang sama.

Compute Engine mengelola replika volume Persistent Disk regional Anda di kedua zona ini. Saat Anda menulis data ke disk, Compute Engine akan mereplikasi data tersebut secara sinkron ke replika disk di kedua zona untuk memastikan HA. Data setiap replika zona tersebar di beberapa mesin fisik di dalam zona tersebut untuk memastikan ketahanan. Replika zona memastikan data volume Persistent Disk tetap tersedia dan memberikan perlindungan terhadap gangguan sementara di salah satu zona disk.

Status replika untuk replika zona

Status replika disk untuk Persistent Disk regional menunjukkan status replika zona dibandingkan dengan konten disk. Replika zona untuk Persistent Disk regional selalu berada dalam salah satu status replika disk berikut:

  • Disinkronkan: Replika tersedia, secara sinkron menerima semua operasi tulis yang dilakukan ke disk, dan diupdate dengan semua data pada disk.
  • Menangkap berikutnya: Replika tersedia, tetapi masih mengambil data di disk dari replika lain.
  • Tidak sinkron: Replika tidak tersedia untuk sementara dan tidak sinkron dengan data pada disk.

Untuk mempelajari cara memeriksa dan melacak status replika dari replika zona Anda, lihat Memantau status replika disk untuk volume Persistent Disk regional.

Status replikasi Persistent Disk Regional

Bergantung pada status masing-masing replika zona, volume Persistent Disk regional Anda dapat berada dalam salah satu status replikasi berikut:

  • Direplikasi sepenuhnya. Replika di kedua zona tersedia dan disinkronkan dengan data disk terbaru.
  • Mengejar ketertinggalan Replika zona Anda tersedia, tetapi salah satu replika zona dapat mengakses data disk terbaru.
  • Terdegradasi: Salah satu replika zona tidak sinkron karena terjadi kegagalan atau pemadaman layanan.

Jika volume Persistent Disk regional Anda sedang mengejar ketertinggalan atau menurun, salah satu replika zona tidak diperbarui dengan semua data. Setiap pemadaman selama waktu ini di zona replika yang responsif akan menyebabkan volume Persistent Disk regional tidak tersedia hingga zona replika yang responsif berhasil dipulihkan.

Saat volume Persistent Disk regional Anda meningkat, Google Cloud akan mulai memulihkan replika zona yang mengejar. Google merekomendasikan agar Anda menunggu replika zona yang terpengaruh untuk mengejar data di disk. Setelah replika zona kemudian berpindah ke status yang disinkronkan, volume Persistent Disk regional akan kembali ke status yang direplikasi sepenuhnya. Jika volume Persistent Disk regional terus meningkat atau menurun dalam waktu lama dan tidak memenuhi persyaratan RPO organisasi Anda, sebaiknya ambil snapshot disk dengan salah satu cara berikut:

  • Mengaktifkan snapshot terjadwal.
  • Membuat snapshot manual untuk volume Persistent Disk regional Anda.

Setelah snapshot dibuat, Anda dapat membuat volume Persistent Disk regional baru menggunakan snapshot tersebut. Anda memulihkan data Anda di volume Persistent Disk regional yang baru. Volume baru Anda juga dimulai dalam status yang direplikasi sepenuhnya dengan replikasi data yang aktif.

Untuk mempelajari cara memeriksa status replikasi volume Persistent Disk regional Anda, lihat Menentukan status replikasi Persistent Disk regional.

Checkpoint pemulihan replika Persistent Disk Regional

Checkpoint pemulihan replika adalah atribut Persistent Disk regional yang mewakili titik konsisten error terbaru pada waktu disk yang direplikasi sepenuhnya. Compute Engine secara otomatis membuat dan mempertahankan satu checkpoint pemulihan replika untuk setiap volume Persistent Disk regional. Setelah volume Persistent Disk regional direplikasi sepenuhnya, Compute Engine akan terus memperbarui checkpointnya kira-kira setiap 10 menit untuk memastikan checkpoint tetap diperbarui. Saat volume Persistent Disk regional mengalami penurunan nilai, Compute Engine memungkinkan Anda membuat snapshot standar dari checkpoint pemulihan replika pada disk tersebut. Snapshot standar yang dihasilkan menangkap data dari versi terbaru yang konsisten dengan error dari disk yang direplikasi sepenuhnya.

Dalam skenario yang jarang terjadi, saat disk Anda mengalami penurunan performa, replika zona yang disinkronkan dengan data disk terbaru juga dapat gagal sebelum replika yang tidak sinkron juga dapat mengejar ketertinggalan tersebut. Anda tidak akan dapat memasang paksa disk ke VM di kedua zona tersebut. Volume Persistent Disk regional Anda menjadi tidak tersedia dan Anda harus memigrasikan data ke disk baru. Dalam skenario seperti ini, jika Anda tidak memiliki snapshot standar yang tersedia untuk disk, Anda mungkin masih dapat memulihkan data disk dari replika yang tidak lengkap menggunakan snapshot standar yang dibuat dari checkpoint pemulihan replika.

Compute Engine secara otomatis membuat checkpoint pemulihan replika untuk setiap volume Persistent Disk regional yang terpasang. Anda tidak dikenai biaya tambahan untuk pembuatan checkpoint ini. Namun, Anda dikenai biaya penyimpanan yang berlaku untuk pembuatan snapshot dan VM saat Anda menggunakan checkpoint ini untuk memigrasikan disk ke zona yang berfungsi.

Pelajari lebih lanjut cara memulihkan data Persistent Disk regional Anda menggunakan checkpoint pemulihan replika.

Failover Persistent Disk Regional

Jika terjadi pemadaman layanan di suatu zona, zona tersebut tidak akan dapat diakses dan VM di zona tersebut tidak dapat menjalankan operasi baca atau tulis pada disk-nya. Agar VM dapat terus melakukan operasi baca dan tulis untuk disk, Compute Engine mengizinkan migrasi data disk ke zona lain tempat disk memiliki replika. Proses ini disebut failover Persistent Disk regional. Proses failover ini mencakup pelepasan VM dari replika disk di zona yang terpengaruh, lalu pemasangan kembali VM baru ke replika disk di zona lainnya. Compute Engine mereplikasi data di disk Anda ke region sekunder secara sinkron untuk memastikan failover yang cepat jika terjadi kegagalan replika tunggal.

Failover oleh bidang kontrol regional khusus aplikasi

Bidang kontrol regional spesifik per aplikasi bukan merupakan layanan Google Cloud. Saat mendesain arsitektur layanan dengan ketersediaan tinggi (HA), Anda harus membangun bidang kontrol regional khusus aplikasi Anda sendiri. Bidang kontrol aplikasi ini menentukan VM mana yang harus dilengkapi dengan Persistent Disk regional dan VM mana yang merupakan VM utama saat ini. Saat kegagalan terdeteksi di VM atau database utama volume Persistent Disk regional, bidang kontrol regional khusus aplikasi dari arsitektur layanan HA Anda dapat otomatis memulai failover ke VM standby di zona sekunder. Selama failover, bidang kontrol regional khusus aplikasi akan menambahkan kembali volume Persistent Disk regional ke VM standby di zona sekunder. Compute Engine kemudian mengarahkan semua traffic ke VM tersebut berdasarkan sinyal health check.

Latensi failover secara keseluruhan, tidak termasuk waktu deteksi kegagalan, adalah jumlah latensi berikut:

  • Nol detik untuk memasang kembali volume Persistent Disk regional ke VM standby
  • Waktu yang diperlukan untuk inisialisasi dan pemulihan error aplikasi

Untuk informasi selengkapnya, lihat Memahami bidang kontrol regional khusus aplikasi

Halaman Elemen Penyusun Pemulihan dari Bencana (Disaster Recovery) membahas elemen penyusun yang tersedia di Compute Engine.

Failover dengan penambahan paksa

Salah satu manfaat Persistent Disk regional adalah jika terjadi pemadaman layanan secara zona yang jarang terjadi, Anda juga dapat melakukan failover beban kerja yang berjalan di Persistent Disk regional ke zona lain secara manual. Saat zona asli mengalami gangguan, Anda tidak dapat menyelesaikan operasi pelepasan sampai replika zona tersebut dipulihkan. Dalam skenario ini, Anda mungkin perlu memasang VM baru ke replika zona sekunder tanpa melepaskan VM dari replika zona utama Anda. Proses ini disebut {i>force-attach<i}.

Jika instance VM di zona utama menjadi tidak tersedia, Anda dapat memasang disk secara paksa ke instance VM di zona sekunder. Untuk melakukan tugas ini, Anda harus melakukan salah satu hal berikut:

  • Mulai instance VM lain di zona yang sama dengan volume Persistent Disk regional yang Anda pasang paksa.
  • Mempertahankan instance VM hot standby di zona tersebut. Hot standby adalah instance VM yang sedang berjalan dan identik dengan yang Anda gunakan. Kedua {i>instance<i} tersebut memiliki data yang sama.

Compute Engine mengeksekusi operasi penambahan paksa dalam waktu kurang dari satu menit. Total batas waktu pemulihan (RTO) tidak hanya bergantung pada failover penyimpanan (lampiran paksa volume Persistent Disk regional), tetapi juga pada faktor lain, termasuk hal berikut:

  • Apakah Anda harus membuat instance VM sekunder terlebih dahulu atau tidak
  • Durasi saat sistem file yang mendasarinya mendeteksi {i>hot-attached disk<i}
  • Waktu pemulihan aplikasi terkait

Untuk mengetahui informasi selengkapnya tentang cara melakukan failover pada VM Anda menggunakan penambahan paksa, lihat Melakukan failover volume Persistent Disk regional menggunakan force-attach.

Persistent Disk Regional mendukung ketersediaan workload, yang berarti ada konsekuensi untuk perlindungan data jika kedua replika disk tidak tersedia pada saat yang sama. Untuk mengetahui informasi selengkapnya, lihat Mengelola kegagalan untuk Persistent Disk regional.

Batasan

Bagian berikut mencantumkan batasan yang berlaku untuk Persistent Disk regional.

Batasan umum untuk Persistent Disk regional

  • Anda dapat memasang Persistent Disk regional hanya ke VM yang menggunakan jenis mesin E2, N1, N2, dan N2D.
  • Anda tidak dapat membuat Persistent Disk regional dari image.
  • Saat menggunakan mode hanya baca, Anda dapat memasang Persistent Disk regional seimbang ke maksimum 10 instance VM.
  • Ukuran minimum Persistent Disk standar regional adalah 200 GiB.
  • Anda hanya dapat menambah ukuran volume Persistent Disk regional; Anda tidak dapat mengurangi ukurannya.
  • Volume Persistent Disk regional memiliki karakteristik performa yang berbeda dengan volume Persistent Disk zona. Untuk mengetahui informasi selengkapnya, lihat Performa block storage.
  • Jika Anda membuat Persistent Disk regional dengan meng-clone disk zona, kedua replika zona tidak sepenuhnya disinkronkan pada saat pembuatan. Setelah pembuatan, Anda dapat menggunakan clone disk regional rata-rata dalam waktu 3 menit. Namun, Anda mungkin perlu menunggu selama puluhan menit sebelum disk mencapai status replikasi sepenuhnya dan toleransi durasi kehilangan data (RPO) mendekati nol. Pelajari cara memeriksa apakah Persistent Disk regional Anda telah direplikasi sepenuhnya.

Batasan untuk checkpoint pemulihan replika Persistent Disk regional

  • Checkpoint pemulihan replika adalah bagian dari metadata perangkat dan tidak menampilkan data disk apa pun dengan sendirinya. Anda hanya dapat menggunakan checkpoint sebagai mekanisme untuk membuat snapshot disk Anda yang rusak. Setelah membuat snapshot menggunakan checkpoint, Anda dapat menggunakan snapshot tersebut untuk memulihkan data Anda.
  • Anda dapat membuat snapshot dari checkpoint pemulihan replika hanya jika disk Anda mengalami penurunan performa.
  • Compute Engine memuat ulang checkpoint pemulihan replika disk Anda hanya jika disk telah direplikasi sepenuhnya.
  • Compute Engine hanya mempertahankan satu checkpoint pemulihan replika untuk sebuah disk dan hanya mempertahankan versi terbaru dari checkpoint tersebut.
  • Anda tidak dapat melihat persis pembuatan dan pembaruan stempel waktu dari checkpoint pemulihan replika.
  • Anda dapat membuat snapshot dari checkpoint pemulihan replika hanya dengan menggunakan Compute Engine API.

Langkah selanjutnya