Failover
Jika cluster Bigtable menjadi tidak responsif, replikasi memungkinkan traffic masuk mengalami kegagalan ke cluster lain dalam instance yang sama. Failover dapat bersifat manual atau otomatis, bergantung pada profil aplikasi yang digunakan aplikasi dan cara profil aplikasi dikonfigurasi.
Halaman ini menjelaskan cara kerja failover manual dan otomatis di instance yang menggunakan replika. Untuk mempelajari cara menyelesaikan failover, lihat Mengelola failover.
Sebelum membaca halaman ini, Anda harus sudah memahami ringkasan replikasi Bigtable. Anda juga harus memahami opsi pemilihan rute yang tersedia.
Failover manual
Jika profil aplikasi menggunakan perutean cluster tunggal untuk mengarahkan semua permintaan ke satu cluster, Anda harus menggunakan penilaian Anda sendiri untuk memutuskan kapan harus mulai melakukan failover ke cluster lain.
Berikut beberapa sinyal yang mungkin menunjukkan bahwa akan lebih baik untuk melakukan failover ke cluster lain:
- Cluster mulai menampilkan sejumlah besar error sistem sementara.
- Sejumlah besar permintaan mulai habis waktunya.
- Latensi respons rata-rata meningkat ke tingkat yang tidak dapat diterima.
Karena sinyal ini dapat muncul karena berbagai alasan, kegagalan pengalihan ke cluster lain tidak dijamin akan menyelesaikan masalah yang mendasarinya. Pantau instance Anda sebelum dan sesudah failover untuk memverifikasi bahwa metrik telah meningkat.
Untuk mengetahui detail tentang cara menyelesaikan failover manual, lihat Menyelesaikan failover manual.
Failover otomatis
Jika profil aplikasi menggunakan pemilihan rute multi-cluster, Bigtable akan menangani failover secara otomatis. Jika cluster terdekat tidak dapat menangani permintaan, Bigtable akan merutekan traffic ke cluster terdekat yang tersedia.
Failover otomatis dapat terjadi meskipun cluster tidak tersedia selama periode waktu yang sangat singkat. Misalnya, jika Bigtable merutekan permintaan ke satu cluster, dan cluster tersebut sangat lambat untuk membalas atau menampilkan error sementara, Bigtable biasanya akan mencoba kembali permintaan tersebut di cluster lain.
Jika Anda menggunakan pemilihan rute multi-cluster dan mengirim permintaan dengan batas waktu, Bigtable akan otomatis melakukan failover jika diperlukan untuk membantu memenuhi batas waktu. Jika batas waktu permintaan sudah dekat, tetapi cluster awal belum mengirim respons, Bigtable akan mengalihkan permintaan ke cluster terdekat berikutnya.
Bigtable menggunakan algoritma last write wins internal untuk menangani konflik data yang mungkin terjadi sebagai akibat dari failover sebelum replikasi selesai. Lihat Resolusi konflik untuk mengetahui detail selengkapnya.
Jika menggunakan replikasi dengan perutean multi-cluster untuk mencapai ketersediaan tinggi (HA) untuk aplikasi, Anda harus menempatkan server klien atau VM di atau di dekat lebih dari satu region Google Cloud. Rekomendasi ini berlaku meskipun server aplikasi Anda tidak dihosting oleh Google Cloud, karena data Anda memasuki jaringan Google Cloud melalui region Google Cloud yang paling dekat dengan server aplikasi Anda. Seperti permintaan lainnya, failover selesai lebih cepat dengan jarak yang lebih pendek.
Banyak failover otomatis yang berlangsung sangat singkat sehingga Anda tidak akan menyadarinya. Anda dapat memeriksa grafik Automatic Failovers di konsol Google Cloud untuk melihat jumlah permintaan yang secara otomatis dialihkan selama jangka waktu tertentu: buka daftar instance, klik nama instance, lalu klik Monitoring.
Langkah selanjutnya
- Pelajari cara menyelesaikan failover manual.
- Cari tahu cara memantau instance Anda.