Tentang replikasi disk sinkron


Persistent Disk Regional dan Hyperdisk Balanced High Availability adalah opsi penyimpanan yang memungkinkan Anda mengimplementasikan layanan ketersediaan tinggi (HA) di Compute Engine. Persistent Disk Regional dan Hyperdisk Balanced High Availability mereplikasi data secara sinkron antara dua zona di region yang sama dan memastikan HA untuk data disk hingga satu kegagalan zona.

Volume Ketersediaan Tinggi Hyperdisk dan Persistent Disk Regional dirancang untuk workload yang memerlukan Batas Titik Pemulihan (RPO) dan Batas Waktu Pemulihan (RTO) yang lebih rendah. Untuk mempelajari RPO dan RTO lebih lanjut, lihat Dasar-dasar perencanaan pemulihan dari bencana.

Volume Persistent Disk Regional dan Hyperdisk Balanced High Availability dirancang untuk berfungsi dengan grup instance terkelola regional.

Dokumen ini memberikan ringkasan tentang cara membuat layanan HA dengan Persistent Disk Regional dan volume Hyperdisk Balanced High Availability.

Saat memutuskan untuk menggunakan Persistent Disk Regional atau Hyperdisk Balanced High Availability, pastikan Anda membandingkan berbagai opsi untuk meningkatkan ketersediaan layanan serta biaya, performa, dan ketahanan untuk berbagai arsitektur layanan.

Tentang replikasi disk sinkron

Volume Persistent Disk Regional atau Hyperdisk Balanced High Availability (Preview), yang juga disebut sebagai disk yang direplikasi, memiliki zona utama dan sekunder dalam region tempat data disk disimpan:

  • Zona utama adalah zona yang sama dengan zona tempat instance komputasi yang Anda gunakan untuk memasang disk.
  • Zona sekunder adalah zona alternatif pilihan Anda dalam region yang sama.

Compute Engine mempertahankan replika disk Anda di kedua zona ini. Saat Anda menulis data ke disk, Compute Engine akan mereplikasi data tersebut secara sinkron ke replika disk di kedua zona untuk memastikan HA. Data setiap replika zona tersebar di beberapa mesin fisik dalam zona untuk memastikan ketahanan. Replika zona memastikan bahwa data disk tetap tersedia dan memberikan perlindungan terhadap gangguan sementara di salah satu zona disk.

Status replika untuk replika zona

Status replika disk untuk Persistent Disk Regional atau Hyperdisk Balanced High Availability (Pratinjau) menunjukkan status replika zona dibandingkan dengan konten disk. Replika zona untuk disk Anda selalu berada dalam salah satu status replika disk berikut:

  • Sinkron: Replika tersedia, secara sinkron menerima semua penulisan yang dilakukan ke disk, dan diupdate dengan semua data di disk.
  • Melakukan sinkronisasi: Replika tersedia, tetapi masih mengambil data di disk dari replika lainnya.
  • Tidak sinkron: Replika tidak tersedia untuk sementara dan tidak sinkron dengan data di disk.

Untuk mempelajari cara memeriksa dan melacak status replika dari replika zona Anda, lihat Memantau status replika disk.

Status replikasi untuk disk yang direplikasi secara sinkron

Bergantung pada status masing-masing replika zona, volumePersistent Disk Regional atau Hyperdisk Balanced High Availability (Preview) dapat berada dalam salah satu status replikasi berikut:

  • Direplikasi sepenuhnya: Replika di kedua zona tersedia dan disinkronkan dengan data disk terbaru.
  • Mengejar ketertinggalan: Replika zona Anda tersedia, tetapi salah satu replika zona sedang mengejar ketertinggalan dengan data disk terbaru.
  • Terdegradasi: Salah satu replika zona memiliki status out of sync karena terjadi kegagalan atau pemadaman.

Jika status replikasi disk adalah catching up atau degraded, salah satu replika zona tidak diperbarui dengan semua data. Setiap pemadaman selama waktu ini di zona replika yang responsif akan menyebabkan disk tidak tersedia hingga zona replika yang responsif berhasil dipulihkan.

Saat volume Persistent Disk Regional atau Hyperdisk Balanced High Availability Anda sedang mengejar ketertinggalan, Google Cloud akan mulai memulihkan replika zona yang sedang mengejar ketertinggalan. Google merekomendasikan agar Anda menunggu replika zona yang terpengaruh hingga selesai mengejar ketertinggalan data di disk, saat statusnya berubah menjadi Synced. Setelah replika zona kemudian berpindah ke status disinkronkan, status disk yang direplikasi akan kembali ke status Fully replicated.

Jika disk yang direplikasi memiliki status catching up atau degraded selama jangka waktu yang lama dan tidak memenuhi persyaratan RPO organisasi Anda, sebaiknya ambil snapshot replika utama dengan salah satu cara berikut:

  • Mengaktifkan snapshot terjadwal.
  • Buat snapshot manual dari Persistent Disk Regional atau disk Hyperdisk Balanced High Availability.

Setelah membuat snapshot, Anda dapat membuatPersistent Disk Regional atau disk Hyperdisk Balanced High Availability baru menggunakan snapshot tersebut sebagai sumber. Tindakan ini akan memulihkan snapshot ke disk baru. Disk baru Anda juga dimulai dalam status yang direplikasi sepenuhnya dengan replikasi data yang aktif.

Untuk mempelajari cara memeriksa status replikasi Persistent Disk Regional atau disk Hyperdisk Balanced High Availability, lihat Menentukan status replikasi disk.

Checkpoint pemulihan replika

Titik pemeriksaan pemulihan replika adalah atribut disk yang mewakili titik waktu konsisten error terbaru dari disk yang direplikasi sepenuhnya. Compute Engine otomatis membuat dan mempertahankan satu titik pemeriksaan pemulihan replika untuk setiap disk yang direplikasi. Saat disk direplikasi sepenuhnya, Compute Engine terus memuat ulang checkpoint-nya kira-kira setiap 10 menit untuk memastikan bahwa checkpoint tetap diperbarui. Jika status replikasi disk adalah degraded, Compute Engine memungkinkan Anda membuat snapshot standar dari titik pemeriksaan pemulihan replika disk tersebut. Snapshot standar yang dihasilkan mengambil data dari versi terbaru yang konsisten dengan error dari disk yang direplikasi sepenuhnya.

Dalam skenario yang jarang terjadi, saat disk Anda mengalami degradasi, replika zona yang disinkronkan dengan data disk terbaru juga dapat gagal sebelum replika yang tidak sinkron dapat mengejar. Anda tidak akan dapat memaksa pemasangan disk ke instance komputasi di salah satu zona. Disk yang direplikasi tidak akan tersedia lagi dan Anda harus memigrasikan data ke disk baru. Dalam skenario tersebut, jika tidak memiliki snapshot standar yang tersedia untuk disk, Anda mungkin masih dapat memulihkan data disk dari replika yang tidak lengkap menggunakan snapshot standar yang dibuat dari titik pemeriksaan pemulihan replika.

Compute Engine secara otomatis membuat titik pemeriksaan pemulihan replika untuk setiap disk Persistent Disk Regional atau Hyperdisk Balanced High Availability (Pratinjau) yang terpasang. Anda tidak dikenai biaya tambahan untuk pembuatan checkpoint ini. Namun, Anda akan dikenai biaya penyimpanan yang berlaku untuk pembuatan snapshot dan instance compute saat menggunakan checkpoint ini untuk memigrasikan disk yang direplikasi ke zona yang berfungsi.

Pelajari lebih lanjut cara memulihkan data disk yang direplikasi menggunakan titik pemeriksaan pemulihan replika.

Failover disk yang direplikasi

Jika terjadi pemadaman layanan di zona, zona tersebut tidak dapat diakses dan instance komputasi di zona tersebut tidak dapat melakukan operasi baca atau tulis pada disknya. Agar instance dapat terus melakukan operasi baca dan tulis untuk disk yang direplikasi, Compute Engine mengizinkan migrasi data disk ke zona lain tempat disk memiliki replika. Proses ini disebut failover.

Proses failover melibatkan pemisahan replika zona dari instance di zona yang terpengaruh, lalu melampirkan replika zona ke instance baru di zona sekunder. Compute Engine mereplikasi data di disk secara sinkron ke zona sekunder untuk memastikan failover yang cepat jika terjadi kegagalan replika tunggal.

Failover menurut bidang kontrol regional khusus aplikasi

Bidang kontrol regional khusus aplikasi bukan merupakan layanan Google Cloud. Saat mendesain arsitektur layanan HA, Anda harus membuat bidang kontrol regional khusus aplikasi Anda sendiri. Bidang kontrol aplikasi ini menentukan instance mana yang harus memiliki disk yang direplikasi dan instance mana yang merupakan instance utama saat ini.

Saat kegagalan terdeteksi di instance utama atau database disk yang direplikasi, bidang kontrol regional khusus aplikasi dari arsitektur layanan HA Anda dapat otomatis memulai failover ke instance standby di zona sekunder. Selama failover, bidang kontrol regional khusus aplikasi memasang ulang disk yang direplikasi ke instance standby di zona sekunder. Compute Engine kemudian mengarahkan semua traffic ke instance tersebut berdasarkan sinyal health check.

Latensi failover secara keseluruhan, tidak termasuk waktu deteksi kegagalan, adalah jumlah dari latensi berikut:

  • Kurang dari 1 menit untuk memasang disk yang direplikasi ke instance standby
  • Waktu yang diperlukan untuk inisialisasi dan pemulihan error aplikasi

Untuk informasi selengkapnya, lihat Memahami bidang kontrol regional khusus aplikasi.

Halaman Elemen Penyusun Pemulihan dari Bencana membahas elemen penyusun yang tersedia di Compute Engine.

Failover dengan pemasangan paksa

Salah satu manfaat Persistent Disk Regional dan Hyperdisk Balanced High Availability (Pratinjau) adalah jika terjadi pemadaman layanan di zona tertentu, Anda dapat melakukan failover workload secara manual ke zona lain. Jika zona asli mengalami pemadaman layanan, Anda tidak dapat menyelesaikan operasi pelepasan disk hingga replika zona tersebut dipulihkan. Dalam skenario ini, Anda mungkin perlu melampirkan replika zona sekunder ke instance compute baru tanpa melepaskan replika zona utama dari instance utama. Proses ini disebut force-attach.

Jika instance komputasi di zona utama tidak tersedia, Anda dapat memaksa pemasangan disk ke instance di zona sekunder. Untuk melakukan tugas ini, Anda harus melakukan salah satu hal berikut:

  • Mulai instance komputasi lain di zona yang sama dengan disk replika yang Anda pasang secara paksa.
  • Mempertahankan instance komputasi hot standby di zona tersebut. Hot standby adalah instance yang berjalan dan identik dengan instance di zona utama. Kedua instance tersebut memiliki data yang sama.

Compute Engine menjalankan operasi pemasangan paksa dalam waktu kurang dari satu menit. Total tujuan waktu pemulihan (RTO) tidak hanya bergantung pada failover penyimpanan (lampiran paksa disk replika), tetapi juga pada faktor lain, termasuk hal berikut:

  • Apakah Anda harus membuat instance sekunder terlebih dahulu atau tidak
  • Durasi waktu yang diperlukan sistem file pokok untuk mendeteksi disk yang terpasang secara langsung
  • Waktu pemulihan aplikasi terkait

Untuk mengetahui informasi selengkapnya tentang cara melakukan failover instance komputasi menggunakan pemasangan paksa, lihat Melakukan failover disk yang direplikasi menggunakan force-attach.

Persistent Disk Regional dan Hyperdisk Balanced High Availability mendukung ketersediaan workload, yang berarti ada konsekuensi bagi perlindungan data jika kedua replika disk tidak tersedia pada saat yang bersamaan. Untuk informasi selengkapnya, lihat Mengelola kegagalan untuk disk yang direplikasi.

Batasan

Bagian berikut mencantumkan batasan yang berlaku untuk Persistent Disk Regional dan Hyperdisk Balanced High Availability (Pratinjau).

Batasan umum untuk disk yang direplikasi

  • Meksiko, Osaka, dan Montreal memiliki tiga zona yang ditempatkan di satu atau dua pusat data fisik. Karena data yang disimpan di region ini dapat hilang jika terjadi penghancuran pusat data yang jarang terjadi, Anda dapat mempertimbangkan untuk mencadangkan data penting bagi bisnis ke region kedua untuk meningkatkan perlindungan data.
  • Anda dapat memasang Persistent Disk regional hanya ke VM yang menggunakan jenis mesin E2, N1, N2, dan N2D.
  • Anda hanya dapat memasang Hyperdisk Balanced High Availability ke jenis mesin yang didukung.
  • Anda tidak dapat membuat Persistent Disk regional dari image, atau dari disk yang dibuat dari image.
  • Saat menggunakan mode hanya baca, Anda dapat memasang Persistent Disk regional seimbang ke maksimum 10 instance VM.
  • Ukuran minimum Persistent Disk standar regional adalah 200 GiB.
  • Anda hanya dapat meningkatkan ukuran volume Persistent Disk regional atau Hyperdisk Balanced High Availability; Anda tidak dapat mengurangi ukurannya.
  • Volume Persistent Disk Regional dan Hyperdisk Balanced High Availability memiliki karakteristik performa yang berbeda dengan disk zona yang sesuai. Untuk mengetahui informasi selengkapnya, lihat Performa block storage.
  • Anda tidak dapat menggunakan volume Hyperdisk Balanced High Availability yang dalam mode multi-penulis sebagai disk booting.
  • Jika Anda membuat disk yang direplikasi dengan meng-clone disk zona, kedua replika zona tidak sepenuhnya disinkronkan pada saat pembuatan. Setelah pembuatan, Anda dapat menggunakan clone disk regional rata-rata dalam waktu 3 menit. Namun, Anda mungkin perlu menunggu puluhan menit sebelum disk mencapai status replikasi sepenuhnya dan toleransi durasi kehilangan data (RPO) mendekati nol. Pelajari cara memeriksa apakah disk yang direplikasi telah direplikasi sepenuhnya.

Batasan untuk checkpoint pemulihan replika

  • Titik pemeriksaan pemulihan replika adalah bagian dari metadata perangkat dan tidak menampilkan data disk apa pun dengan sendirinya. Anda hanya dapat menggunakan checkpoint sebagai mekanisme untuk membuat snapshot disk yang mengalami degradasi. Setelah membuat snapshot menggunakan checkpoint, Anda dapat menggunakan snapshot untuk memulihkan data.
  • Anda dapat membuat snapshot dari titik pemeriksaan pemulihan replika hanya jika disk Anda menurun.
  • Compute Engine memperbarui titik pemeriksaan pemulihan replika disk Anda hanya jika disk direplikasi sepenuhnya.
  • Compute Engine hanya mempertahankan satu titik pemeriksaan pemulihan replika untuk disk dan hanya mempertahankan versi terbaru titik pemeriksaan tersebut.
  • Anda tidak dapat melihat stempel waktu pembuatan dan pembaruan yang tepat dari checkpoint pemulihan replika.
  • Anda dapat membuat snapshot dari checkpoint pemulihan replika hanya dengan menggunakan Compute Engine API.

Langkah selanjutnya