Meningkatkan ketersediaan aplikasi stateful dengan Operator HA Stateful


Operator Ketersediaan Tinggi (HA) Stateful memungkinkan Anda menggunakan integrasi bawaan GKE dengan Persistent Disk regional untuk mengotomatiskan dan mengontrol kecepatan failover Pod StatefulSet. Selama failover, operator secara otomatis menangani deteksi kegagalan node, melepaskan volume dari node yang gagal, dan memastikan pemasangan volume yang aman ke node failover.

Alasan menggunakan Operator HA Stateful

Arsitektur stateful umum untuk mencapai ketersediaan tinggi menggunakan Persistent Disk regional sebagai lapisan penyimpanan. Disk ini menyediakan replikasi data secara sinkron antara dua zona dalam satu region. Selama kegagalan jaringan node atau zona, arsitektur ini memungkinkan workload Anda failover (dengan menempelkan secara paksa) replika ke penyimpanan di node lain di zona yang berbeda.

Operator HA Stateful memungkinkan Anda melakukan pengoptimalan berikut:

  • Meningkatkan waktu pemulihan aplikasi replika tunggal: Jika hanya menggunakan replika tunggal, Anda dapat menggunakan Operator HA Stateful dan menukar penyimpanan zonal dengan penyimpanan regional saat aplikasi disediakan, untuk meningkatkan ketahanan dan ketersediaan data jika terjadi kegagalan node.
  • Mengurangi biaya jaringan lintas zona: Menyalin data di beberapa zona dapat berbiaya tinggi untuk aplikasi dengan throughput tinggi. Anda dapat menggunakan Operator HA Stateful untuk menjalankan aplikasi di satu zona, sekaligus mempertahankan jalur failover ke zona alternatif yang sesuai dengan SLA aplikasi Anda.

Batasan

Dengan arsitektur Operator HA Stateful satu replika, GKE mempertahankan data Anda di dua zona melalui Persistent Disk regional, tetapi data hanya dapat diakses saat replika aplikasi Anda berfungsi dengan baik. Selama failover, aplikasi Anda tidak akan tersedia untuk sementara saat replika Anda menjadwalkan ulang ke node baru yang sehat. Jika aplikasi Anda memiliki tujuan waktu pemulihan (RTO) yang sangat rendah, sebaiknya gunakan pendekatan multi-replika.

Sebelum memulai

Sebelum memulai, pastikan Anda telah menjalankan tugas berikut:

  • Aktifkan Google Kubernetes Engine API.
  • Aktifkan Google Kubernetes Engine API
  • Jika ingin menggunakan Google Cloud CLI untuk tugas ini, instal lalu lakukan inisialisasi gcloud CLI. Jika sebelumnya Anda telah menginstal gcloud CLI, dapatkan versi terbaru dengan menjalankan gcloud components update.

Persyaratan

  • Node dan bidang kontrol cluster Anda harus menjalankan GKE versi 1.28 atau yang lebih baru.
  • Saat Anda menggunakan Operator HA Stateful, operator ini akan otomatis mengonfigurasi StatefulSet tertaut untuk menggunakan Persistent Disk regional. Namun, Anda bertanggung jawab untuk memastikan bahwa Pod dikonfigurasi untuk menggunakan disk ini, dan dapat berjalan di semua zona yang terkait dengan penyimpanan yang mendasarinya.
  • Pastikan aplikasi Anda berjalan di bentuk mesin yang didukung Persistent Disk regional: E2, N1, N2, N2D.
  • Pastikan driver CSI Persistent Disk Compute Engine diaktifkan. Driver CSI Persistent Disk diaktifkan secara default pada cluster Autopilot dan Standard baru dan tidak dapat dinonaktifkan atau diedit saat menggunakan Autopilot. Jika Anda perlu menambahkan driver CSI Persistent Disk secara manual dari cluster, lihat Mengaktifkan driver CSI Persistent Disk di cluster yang ada.
  • Jika Anda menggunakan StorageClass kustom, konfigurasikan driver CSI Persistent Disk dengan penyedia pd.csi.storage.gke.io dan parameter berikut:
    • availability-class: regional-hard-failover
    • replication-type: regional-pd

Menyiapkan dan menggunakan Operator HA Stateful

Ikuti langkah-langkah berikut untuk menyiapkan Operator HA Stateful untuk beban kerja stateful Anda:

  1. Aktifkan add-on StatefulHA.
  2. Instal resource HighAvailabilityApplication.
  3. Instal StatefulSet.
  4. Periksa resource HighAvailabilityApplication.

Mengaktifkan add-on StatefulHA

Untuk menggunakan Operator HA Stateful, add-on StatefulHA harus diaktifkan di cluster Anda.

  • Cluster Autopilot: GKE otomatis mengaktifkan add-on StatefulHA saat pembuatan cluster. Jika Anda ingin menggunakan Operator HA Stateful untuk workload yang ada, deploy ulang workload Anda di cluster Autopilot baru.

  • Cluster standar:

    • Pembuatan cluster baru: Ikuti petunjuk gcloud CLI untuk membuat cluster Standard dan tambahkan flag berikut: --add-on=StatefulHA.
    • Cluster Standard yang ada: Ikuti petunjuk gcloud CLI untuk memperbarui setelan cluster Standard, dan gunakan flag berikut untuk mengaktifkan add-on: --update-addons=StatefulHA=ENABLED`.

GKE akan otomatis menginstal StorageClass bernama standard-rwo-regional untuk Anda saat add-on diaktifkan.

Menginstal resource HighAvailabilityApplication

HighAvailabilityApplication adalah resource Kubernetes yang menyederhanakan setelan StatefulSet dan meningkatkan ketersediaan Pod di GKE. Operator HA Stateful merekonsiliasi resource HighAvailabilityApplication di GKE.

Dalam spesifikasi HighAvailabilityApplication, Anda harus menetapkan HighAvailabilityApplication.spec.resourceSelection.resourceKind ke StatefulSet.

Untuk mempelajari cara mengonfigurasi resource HighAvailability, lihat dokumentasi referensi HighAvailabilityApplication.

Lihat contoh berikut untuk PostgreSQL:

  1. Simpan manifes berikut dalam file bernama stateful-ha-example-resource.yaml:

    kind: HighAvailabilityApplication
    apiVersion: ha.gke.io/v1
    metadata:
      name: APP_NAME
      namespace: APP_NAMESPACE
    spec:
      resourceSelection:
        resourceKind: StatefulSet
      policy:
        storageSettings:
          requireRegionalStorage: true
        failoverSettings:
          forceDeleteStrategy: AfterNodeUnreachable
          afterNodeUnreachable:
            afterNodeUnreachableSeconds: 20
    

    Ganti kode berikut:

    • APP_NAME: nama aplikasi di cluster yang ingin Anda lindungi. Nama ini harus dibagikan oleh HighAvailabilityApplication dan StatefulSet.
    • APP_NAMESPACE: namespace aplikasi. Namespace ini harus dibagikan oleh HighAvailabilityApplication dan StatefulSet yang dilindungi.

    Dalam contoh ini:

    • HighAvailabilityApplication.spec.policy.storageSettings.requireRegionalSettings disetel ke true. Tindakan ini akan menerapkan penyimpanan regional.
    • HighAvailabilityApplication.spec.policy.failoverSettings disetel ke AfterNodeUnreachable. Ini menentukan cara penghapusan paksa dipicu saat terjadi kegagalan node.
    • HighAvailabilityApplication.spec.policy.failoverSettings.afterNodeUnreachable disetel ke 20. Ini adalah waktu tunggu untuk memaksa penghapusan Pod setelah node tempat Pod berjalan ditandai sebagai tidak dapat dijangkau.
  2. Buat resource. Resource HighAvailabilityApplication mengidentifikasi StatefulSet dengan namespace dan nama yang cocok.

    kubectl apply -f stateful-ha-example-resource.yaml
    

Menginstal StatefulSet

Instal StatefulSet. Misalnya, Anda dapat menginstal StatefulSet PostgreSQL menggunakan Helm (Helm sudah diinstal sebelumnya dengan Cloud Shell):

helm install postgresql oci://registry-1.docker.io/bitnamicharts/postgresql \
  --namespace=APP_NAMESPACE \
  --set fullnameOverride=APP_NAME

Resource HighAvailabilityApplication secara otomatis mengubah StorageClass StatefulSet menjadi standard-rwo-regional, yang menggunakan Persistent Disk regional.

Memeriksa resource HighAvailabilityApplication

Jalankan perintah berikut untuk memverifikasi bahwa aplikasi contoh telah mengaktifkan failover otomatis:

kubectl describe highavailabilityapplication APP_NAME

Output akan muncul seperti berikut:

Status:
Conditions:
  Last Transition Time:  2023-08-09T23:59:52Z
  Message:               Application is protected
  Observed Generation:   1
  Reason:                ApplicationProtected
  Status:                True
  Type:                  Protected