Tentang Replikasi Asinkron Persistent Disk


Replikasi Asinkron Persistent Disk (Replikasi Asinkron PD) memberikan batas titik pemulihan (RPO ) yang rendah dan replikasi block storage dengan batas waktu pemulihan (RTO ) yang rendah untuk pemulihan dari bencana (DR) aktif-pasif lintas region.

Replikasi Asinkron PD adalah opsi penyimpanan yang menyediakan replikasi asinkron data antara dua region. Jika terjadi pemadaman layanan regional, Replikasi Asinkron PD memungkinkan Anda melakukan failover data ke region sekunder dan memulai ulang workload di region tersebut.

Anda dapat menggunakan Replikasi Asinkron PD untuk mengelola replikasi untuk workload Compute Engine di tingkat infrastruktur, bukan di tingkat workload.

Ringkasan

Replikasi Asinkron Persistent Disk mereplikasi data dari disk yang terhubung ke workload yang sedang berjalan, yaitu disk utama, ke disk terpisah yang terletak di region lain. Disk yang menerima data replikasi disebut sebagai disk sekunder.

Region tempat disk utama berada disebut sebagai region primer dan region tempat disk sekunder berada disebut sebagai region sekunder. Region primer dan sekunder disebut sebagai pasangan region.

Setiap disk yang memenuhi persyaratan disk dapat digunakan sebagai disk utama. Setelah memiliki disk primer, Anda dapat membuat disk sekunder yang mereferensikan disk utama dan memulai replikasi dari disk utama ke disk sekunder.

Jika Anda menghentikan replikasi dari disk utama kapan saja, dan ingin memulai ulang replikasi di lain waktu, Anda harus membuat disk sekunder baru untuk memulai ulang replikasi.

Grup konsistensi

Dengan grup konsistensi, Anda dapat melakukan pemulihan dari bencana (DR) dan pengujian DR di beberapa disk. Grup konsistensi adalah kebijakan resource yang melakukan hal-hal berikut:

  • Menyelaraskan replikasi di seluruh disk utama dan memastikan bahwa semua disk berisi data replikasi dari titik waktu umum, yang digunakan untuk DR.
  • Menyelaraskan clone disk dari disk sekunder dan memastikan bahwa semua clone disk berisi data dari titik waktu umum, yang digunakan untuk latihan DR.

Jika Anda ingin menyelaraskan periode replikasi di beberapa disk, tambahkan disk utama ke grup konsistensi. Jika Anda ingin meng-clone beberapa disk dan memastikan clone tersebut memiliki data dari titik waktu yang sama, tambahkan disk sekunder ke grup konsistensi. Grup konsistensi dapat digunakan untuk replikasi atau clone, tetapi tidak keduanya secara bersamaan.

Jika ingin menambahkan disk utama ke grup konsistensi, Anda harus menambahkan disk ke grup konsistensi sebelum memulai replikasi. Anda dapat menambahkan disk sekunder ke grup konsistensi kapan saja.

Failover dan failback

Jika terjadi pemadaman layanan di region utama, Anda bertanggung jawab untuk mengidentifikasi pemadaman layanan serta melakukan failover dan memulai ulang workload Anda menggunakan disk sekunder, di region sekunder. Replikasi Asinkron PD tidak menawarkan pemantauan pemadaman layanan. Anda dapat mengidentifikasi pemadaman layanan menggunakan metrik RPO, health check, metrik khusus aplikasi, dan dengan menghubungi Cloud Customer Care.

Proses failover melibatkan tugas-tugas berikut:

  1. Menghentikan replikasi.
  2. Memasang disk sekunder ke VM di region sekunder.

Setelah melakukan failover disk, Anda bertanggung jawab untuk memvalidasi dan memulai ulang workload aplikasi di region sekunder dan mengonfigurasi ulang alamat jaringan yang digunakan untuk mengakses aplikasi Anda agar mengarah ke region sekunder.

Setelah failover dari region utama ke region sekunder, region sekunder menjadi region utama sementara. Setelah pemadaman layanan atau bencana terselesaikan, Anda dapat memulai failover untuk memulai replikasi dari region sekunder asli (region utama sementara) ke region utama asli. Jika ingin, Anda dapat mengulangi proses ini untuk memindahkan workload kembali ke region utama asli.

Proses failover melibatkan tugas-tugas berikut:

  1. Konfigurasi replikasi antara region utama baru dan region utama asli.

    • Disk sekunder asli kini menjadi disk utama baru, dan Anda mengonfigurasinya untuk mereplikasi disk sekunder baru di region utama asli.
    • Anda dapat membuat kebijakan resource grup konsistensi baru di region utama yang baru sehingga disk utama baru (disk sekunder asli) dapat mereplikasi secara konsisten ke kumpulan disk sekunder baru di region utama asli.
  2. (Opsional) Setelah replikasi awal terjadi, Anda dapat mengulangi proses failover untuk mengembalikan workload ke region utama asli.

Enkripsi disk

Disk utama dan sekunder tidak mendukung kunci enkripsi yang disediakan pelanggan (CSEK). Gunakan kunci enkripsi yang dikelola Google atau kunci enkripsi yang dikelola pelanggan (CMEK). Jika menggunakan CMEK pada disk utama, Anda juga harus menggunakan CMEK pada disk sekunder. Anda dapat menggunakan CMEK yang berbeda di kedua disk.

Penyesuaian disk sekunder

Saat dibuat, disk sekunder akan mewarisi properti disk utama, seperti deskripsi, jenis disk, dan label. Jika disk utama adalah boot disk, disk sekunder mewarisi konfigurasi booting dari disk utama. Konfigurasi booting mencakup informasi tentang arsitektur sistem operasi (OS), lisensi OS, dan fitur OS tamu.

Anda dapat mengubah properti tertentu pada disk sekunder agar berbeda dengan disk utama. Misalnya, disk primer dan sekunder harus memiliki ukuran dan kunci enkripsi yang sama, tetapi Anda dapat menetapkan label tambahan pada disk sekunder.

Untuk boot disk, Anda dapat mengaktifkan opsi keamanan atau jaringan tambahan pada disk sekunder dengan menentukan fitur OS tamu tambahan. Namun, Anda tidak dapat menghapus fitur OS tamu di disk utama. Compute Engine menggabungkan fitur baru yang Anda tentukan dengan fitur OS tamu yang sudah ada di disk utama.

Contoh

Misalkan Anda memiliki boot disk bernama disk-1, dengan fitur OS tamu berikut: [GVNIC, UEFI_COMPATIBLE].

Jika Anda membuat disk sekunder dari disk-1, Anda hanya dapat menentukan fitur tambahan. Anda tidak dapat menghapus fitur UEFI_COMPATIBLE dan GVNIC. Jadi, jika Anda menentukan MULTI_IP_SUBNET saat membuat disk sekunder, fitur baru akan digabungkan dengan fitur disk utama, sehingga fitur OS tamu yang dihasilkan untuk disk sekunder adalah GVNIC,UEFI_COMPATIBLE, dan MULTI_IP_SUBNET.

Untuk mempelajari cara menyesuaikan disk sekunder, lihat Membuat disk sekunder kustom.

Replikasi Asinkron PD dan persistent disk regional

Anda dapat menggunakan Replikasi Asinkron PD dengan persistent disk regional untuk mencapai ketersediaan tinggi (HA) dan pemulihan dari bencana (DR).

Persistent disk regional dapat digunakan sebagai disk utama atau sekunder dalam pasangan disk Replikasi Asinkron PD. Pasangan disk adalah disk utama yang mereplikasi disk sekunder.

Ketika disk regional digunakan sebagai disk utama, replikasi tidak akan terganggu jika salah satu zona disk utama mengalami pemadaman layanan. Disk utama regional terus mereplikasi dari zona responsif ke disk sekunder.

Saat disk regional digunakan sebagai disk sekunder, replikasi akan dijeda jika salah satu zona disk sekunder mengalami pemadaman layanan. Dalam kasus ini, replikasi tidak melanjutkan ke zona responsif disk sekunder. Namun, penggunaan disk regional sebagai disk sekunder dapat mempersiapkan workload Anda untuk HA lintas zona jika terjadi failover saat disk sekunder menjadi disk utama baru.

Batasan

  • Replikasi Asinkron PD hanya didukung untuk Persistent Disk seimbang dan performa (SSD).
  • Disk hanya baca dan disk multi-writer tidak didukung.
  • Setiap disk dapat memiliki ukuran maksimum 32 TiB.
  • Setiap project dapat memiliki maksimal 1.000 pasangan disk di setiap pasangan region.

    Misalnya, project tertentu, project-1 dapat memiliki hingga 1.000 pasangan disk dalam pasangan region Iowa-Oregon. project-1 juga dapat memiliki hingga 1.000 pasangan disk di pasangan wilayah Belgia-Frankfurt.

Region yang didukung

Replikasi Asinkron PD tersedia di semua region di benua berikut:

  • Asia, kecuali Indonesia
  • Eropa
  • Amerika Utara
  • Oseania

Anda dapat mereplikasi disk utama di region tertentu ke disk sekunder di region yang tersedia di benua yang sama. Artinya, Anda dapat membuat pasangan wilayah dari dua wilayah mana pun di benua yang sama.

Misalnya, Anda memiliki disk utama di Frankfurt (europe-west3). Anda dapat mereplikasi disk tersebut ke disk sekunder di mana saja di Eropa, tetapi Anda tidak dapat mereplikasinya ke region di Amerika Utara.

Untuk mengetahui daftar lengkap semua region di Compute Engine, lihat Zona dan region yang tersedia.

Performa

Objektif titik pemulihan (RPO), atau penundaan waktu saat data tersedia di situs sekunder, bergantung pada kecepatan perubahan disk. Replikasi Asinkron PD biasanya mereplikasi data dengan target RPO selama satu menit, untuk maksimal 2 GB blok disk yang diubah per menit dengan blok disk yang direplikasi dengan perincian blok sebesar 4 KB. Jika blok tertentu diubah beberapa kali di antara peristiwa replikasi, hanya perubahan terbaru yang direplikasi ke disk sekunder. Pada tingkat perubahan disk yang lebih tinggi, RPO mungkin lebih dari satu menit dan biasanya meningkat seiring meningkatnya tingkat perubahan disk. RPO tidak dapat dikonfigurasi.

RPO mungkin melebihi satu menit dalam skenario berikut:

  • Saat replikasi disk dimulai. Selama replikasi awal, Replikasi Asinkron PD mereplikasi semua blok yang digunakan pada disk utama ke disk sekunder. Replikasi awal selesai saat metrik disk/async_replication/time_since_last_replication tersedia di Cloud Monitoring.
  • Jika laju perubahan disk lebih besar dari 2 GB blok terkompresi per menit yang diubah. Setelah lonjakan perubahan disk, RPO untuk siklus replikasi berikutnya mungkin melebihi satu menit sementara replikasi mengejar.
  • Jika Anda melepaskan disk dari VM atau memulai ulang VM saat disk mereplikasi. Disk yang sedang menjalani replikasi yang terlepas dari VM mungkin mengalami peningkatan RPO hingga lima menit dalam waktu singkat.

Untuk mempelajari cara melihat RPO bagi disk Anda, lihat Metrik performa Replikasi Asinkron Persistent Disk.

Batas waktu pemulihan (RTO) selama failover bergantung pada waktu yang diperlukan untuk menyelesaikan berbagai tugas yang terlibat dalam kegagalan terkait workload Anda ke region baru. Tugas-tugas seperti menghentikan replikasi dan memasang disk ke VM di region sekunder hanya memerlukan waktu beberapa menit. Anda dapat mempercepat RTO dengan memastikan bahwa Anda memiliki VM yang berjalan di region sekunder sehingga jika terjadi failover, Anda tidak perlu menunggu VM dimulai.

Langkah selanjutnya