Failover

Jika cluster Bigtable tidak responsif, replikasi memungkinkan traffic masuk untuk beralih ke cluster lain dalam instance yang sama. Failover dapat dilakukan secara manual atau otomatis, bergantung pada profil aplikasi yang digunakan aplikasi dan cara profil aplikasi dikonfigurasi.

Halaman ini menjelaskan cara kerja failover manual dan otomatis dalam instance yang menggunakan replikasi. Untuk mempelajari cara menyelesaikan failover, lihat Mengelola Failover.

Sebelum membaca halaman ini, Anda harus sudah memahami ringkasan replikasi Bigtable. Anda juga harus memahami opsi perutean yang tersedia.

Failover manual

Jika profil aplikasi menggunakan perutean cluster tunggal untuk mengarahkan semua permintaan ke satu cluster, Anda harus menggunakan penilaian Anda sendiri untuk memutuskan kapan harus mulai menggagalkan ke cluster lain.

Berikut adalah beberapa sinyal yang mungkin menunjukkan bahwa akan sangat membantu untuk beralih ke cluster lain:

  • Cluster mulai menampilkan sejumlah besar error sistem sementara.
  • Waktu tunggu permintaan dimulai dalam jumlah besar.
  • Latensi respons rata-rata meningkat ke tingkat yang tidak dapat diterima.

Karena sinyal ini dapat muncul karena berbagai alasan, kegagalan pada cluster yang berbeda tidak dijamin akan menyelesaikan masalah yang mendasarinya. Pantau instance Anda sebelum dan sesudah failover untuk memverifikasi bahwa metrik telah meningkat.

Untuk mengetahui detail tentang cara menyelesaikan failover manual, lihat Menyelesaikan failover manual.

Failover otomatis

Jika profil aplikasi menggunakan perutean multi-cluster, Bigtable akan menangani failover secara otomatis. Jika cluster terdekat tidak dapat menangani permintaan, Bigtable akan mengarahkan traffic ke cluster terdekat yang tersedia.

Failover otomatis dapat terjadi meskipun cluster tidak tersedia untuk jangka waktu yang sangat singkat. Misalnya, jika Bigtable merutekan permintaan ke satu cluster, dan cluster tersebut terlalu lambat untuk membalas atau menampilkan error sementara, Bigtable biasanya akan mencoba kembali permintaan tersebut di cluster lain.

Jika Anda menggunakan pemilihan rute multi-cluster dan mengirim permintaan dengan batas waktu, Bigtable akan otomatis melakukan failover saat diperlukan untuk membantu memenuhi batas waktu. Jika batas waktu permintaan sudah mendekati batas waktu, tetapi cluster awal belum mengirimkan respons, Bigtable akan mengubah rute permintaan tersebut ke cluster terdekat berikutnya.

Bigtable menggunakan algoritma last write wins internal untuk menangani konflik data yang mungkin terjadi akibat failover sebelum replikasi selesai. Lihat Resolusi konflik untuk detail selengkapnya.

Jika Anda menggunakan replikasi dengan perutean multi-cluster untuk mencapai ketersediaan tinggi (HA) untuk aplikasi, Anda harus mencari server klien atau VM di atau di dekat beberapa region Google Cloud. Rekomendasi ini berlaku meskipun server aplikasi Anda tidak dihosting oleh Google Cloud, karena data Anda memasuki jaringan Google Cloud melalui region Google Cloud yang terdekat dengan server aplikasi. Seperti permintaan lainnya, failover selesai lebih cepat dalam jarak yang lebih pendek.

Banyak failover otomatis sangat singkat sehingga Anda tidak akan menyadarinya. Anda dapat memeriksa grafik Failover Otomatis di Konsol Google Cloud untuk melihat jumlah permintaan yang secara otomatis diubah rutenya selama periode waktu tertentu: buka daftar instance, klik nama instance, lalu klik Monitoring.

Langkah selanjutnya