Tentang ketersediaan tinggi

Halaman ini merupakan ringkasan konfigurasi ketersediaan tinggi (HA) untuk instance Cloud SQL. Untuk mengonfigurasi instance baru untuk HA, atau untuk mengaktifkan HA pada instance yang ada, lihat Mengaktifkan dan menonaktifkan ketersediaan tinggi pada instance.

Ringkasan konfigurasi HA

Tujuan konfigurasi HA adalah untuk mengurangi periode nonaktif saat zona atau instance menjadi tidak tersedia. Hal ini dapat terjadi selama pemadaman layanan berdasarkan zona, atau saat ada masalah hardware. Dengan HA, data Anda akan tetap tersedia untuk aplikasi klien.

Konfigurasi HA menyediakan redundansi data. Instance Cloud SQL yang dikonfigurasi untuk HA juga disebut instance regional dan memiliki zona primer dan sekunder* dalam region yang dikonfigurasi. Dalam instance regional, konfigurasi terdiri dari instance utama dan instance standby. Melalui replika sinkron ke persistent disk setiap zona, semua penulisan yang dibuat ke instance utama direplikasi ke disk di kedua zona sebelum transaksi dilaporkan sudah di-commit. Jika terjadi kegagalan instance atau zona, instance standby akan menjadi instance primer baru. Pengguna kemudian dialihkan ke instance primer baru. Proses ini disebut failover.

Setelah failover, instance yang menerima failover akan tetap menjadi instance primer, bahkan setelah instance aslinya kembali online. Setelah zona atau instance yang mengalami pemadaman tersedia lagi, instance primer yang asli akan dihilangkan dan dibuat ulang. Lalu menjadi instance standby baru. Jika nanti terjadi failover, instance baru akan beralih ke instance asli di zona asli.

Jika harus memiliki instance primer di zona yang mengalami pemadaman, Anda dapat melakukan failback. Langkah-langkah failback sama seperti failover, hanya berlawanan arah, untuk mengalihkan traffic kembali ke instance awal. Untuk melakukan failover, ikuti prosedur dalam Memulai failover.

Dukungan persistent disk regional untuk konfigurasi HA Cloud SQL yang memiliki setidaknya satu CPU khusus yang memiliki cakupan Perjanjian Tingkat Layanan (SLA) lengkap. Instance dengan konfigurasi HA dikenai biaya dua kali lebih besar dibandingkan instance mandiri. Harga ini sudah termasuk CPU, RAM, dan penyimpanan. Untuk informasi selengkapnya, lihat halaman harga.

Ringkasan diagram konfigurasi HA Cloud SQL. Dijelaskan dalam teks di bawah.

* Region Meksiko, Montreal, dan Osaka memiliki tiga zona dalam satu atau dua pusat data fisik. Region ini sedang dalam proses perluasan ke setidaknya tiga pusat data fisik. Untuk mengetahui informasi selengkapnya, lihat Lokasi Cloud dan SLA Google Cloud Platform. Untuk membantu meningkatkan keandalan workload Anda, pertimbangkan deployment multi-regional.

Replika baca

Jika ketersediaan menjadi pertimbangan untuk replika baca, Anda dapat mengaktifkan HA pada replika. Ketika Anda mempromosikan replika tersebut untuk menjadi instance primer, replika tersebut sudah disiapkan sebagai instance yang sangat tersedia

Selama pemadaman layanan di zona tertentu, traffic akan berhenti untuk membaca replika di zona tersebut. Setelah zona tersedia kembali, semua replika baca di zona tersebut melanjutkan replikasisi dari instance primer. Jika replika baca tidak berada di zona yang mengalami pemadaman, replika tersebut akan terhubung ke instance standby saat menjadi instance primer.

Sebagai praktik terbaik, sebaiknya Anda menempatkan beberapa replika baca Anda di zona yang berbeda dengan instance primer dan instance standby. Misalnya, jika Anda memiliki instance primer di zona A dan instance standby di zona B, masukkan replika baca di zona C untuk meningkatkan keandalan Anda. Praktik ini memastikan bahwa replika baca akan terus beroperasi meskipun zona untuk instance primer menurun. Anda juga harus menambahkan logika bisnis dalam aplikasi klien untuk mengirim operasi baca ke instance utama saat replika baca tidak tersedia.

Catatan: Instance standby tidak dapat digunakan untuk kueri baca. Ini berbeda dengan konfigurasi HA lama Cloud SQL untuk MySQL.

Ringkasan failover

Jika instance yang dikonfigurasi dengan HA menjadi tidak responsif, Cloud SQL akan otomatis beralih ke sajian data dari instance standby. Untuk mengetahui apakah failover muncul, periksa histori failover log operasi Anda.

Pelajari lebih lanjut cara membuat kueri di Logs Explorer. Jika memerlukan informasi operasi yang lebih mendetail, tentang pengguna yang melakukan operasi, Anda harus mengaktifkan logging audit.

Klik tab untuk melihat pengaruh failover terhadap instance Anda.

Normal

Diagram instance responsif sebelum failover

Failover

Diagram instance saat failover terjadi

Pasca-Failover

Diagram instance setelah failover

Failback

Diagram instance setelah failover

Proses

Proses berikut akan terjadi:

  • Instance primer atau zona gagal.

    Setiap detik, sistem heartbreak mendeteksi apakah instance primer responsif. Jika beberapa heartbreak tidak terdeteksi, failover akan dimulai.

  • Instance standby kini menyalurkan data setelah terhubung kembali.

    Melalui alamat IP statis bersama dengan instance primer, instance standby kini menyalurkan data dari zona sekunder.

Persyaratan

Agar Cloud SQL mengizinkan failover, konfigurasi harus memenuhi persyaratan berikut:

  • Instance primer harus dalam status operasi normal (tidak dihentikan, sedang berjalan, atau melakukan operasi instance Cloud SQL yang berjalan lama, seperti operasi pencadangan).
  • Zona sekunder dan instance standby keduanya harus dalam status responsif. Jika instance standby tidak responsif, operasi failover akan diblokir. Setelah Cloud SQL memperbaiki instance standby dan zona sekunder tersedia, Cloud SQL akan mengizinkan failover.

Pencadangan dan pemulihan

Pencadangan otomatis dan pemulihan point-in-time harus diaktifkan untuk instance dengan ketersediaan tinggi, tidak termasuk replika baca.

Aplikasi dan instance

Tidak ada perbedaan dalam menangani instance non-HA dan HA, sehingga aplikasi Anda tidak perlu dikonfigurasi dengan cara tertentu. Saat terjadi failover, semua koneksi yang ada ke instance primer dan replika baca akan ditutup, dan diperlukan waktu sekitar 60 detik agar koneksi ke instance primer terhubung kembali. Aplikasi Anda terhubung kembali menggunakan string koneksi atau alamat IP yang sama, sehingga Anda tidak perlu mengupdate aplikasi setelah failover.

Untuk melihat lebih tepat cara aplikasi Anda terpengaruh oleh failover, mulai failover secara manual.

Periode nonaktif untuk pemeliharaan

Peristiwa pemeliharaan memengaruhi instance primer yang dikonfigurasi dengan HA dengan cara yang sama seperti instance lainnya. Anda dapat memperkirakan bahwa instance primer dapat mengalami gangguan dalam jangka waktu yang singkat. Untuk mengetahui informasi selengkapnya tentang pengaruh pemeliharaan terhadap instance HA, baca Cara kerja pemeliharaan. Untuk meminimalkan dampak terhadap layanan Anda, ubah setelan pemeliharaan untuk mengontrol kapan periode nonaktif terjadi.

Performa

Performa persistent disk regional bergantung pada banyak faktor. Operasi input/output per detik (IOPS) Anda dapat dikurangi dengan persistent disk regional dibandingkan dengan persistent disk zona. Perhatikan ukuran Jenis instance VM serta input dan output workload Anda. Metrik lain yang perlu diperhatikan adalah latensi untuk persistent disk regional dengan solid-state drive (SSD) lebih tinggi daripada persistent disk zonal dengan SSD. Artinya, jika workload Anda bukan workload streaming dan sensitif terhadap latensi, beban kerja tidak dapat mencapai batas IOPS karena persistent disk regional dengan SSD memiliki latensi lebih tinggi dibandingkan persistent disk zona dengan SSD. Hal ini terjadi karena replikasi data sinkron pada beberapa zona yang terlibat dalam persistent disk regional untuk menyediakan beberapa salinan data pada seluruh zona dalam satu region.

Opsi ketersediaan tinggi MySQL versi lama

Proses lama untuk menambahkan ketersediaan tinggi ke instance MySQL menggunakan replika failover. Fungsi lama tidak tersedia di Konsol Google Cloud. Lihat bagian Konfigurasi lama: Membuat instance baru yang dikonfigurasi untuk ketersediaan tinggi atau Konfigurasi lama: Mengonfigurasi instance yang ada untuk ketersediaan tinggi.

Langkah selanjutnya