Mengonfigurasi update lonjakan node pool

Dokumen ini menjelaskan cara mengaktifkan dan mengelola update lonjakan node. Untuk mengetahui informasi tentang cara kerja update lonjakan node pool, lihat Tentang update lonjakan.

Hal yang perlu dipertimbangkan sebelum menjalankan update lonjakan

Sebelum menjalankan update lonjakan, perhatikan hal berikut:

  • Instance tambahan yang dibuat sebagai bagian dari langkah lonjakan ini berpotensi melebihi batas kuota instance AWS Anda. Jika Anda tidak memiliki cukup kuota dan instance tambahan ini tidak dapat disediakan, update mungkin akan gagal.
  • Jika max-unavailable-update disetel ke 0, gangguan pada beban kerja masih dapat terjadi saat Pod dikeluarkan dan dijadwalkan ulang ke node yang lebih baru.
  • Jumlah maksimum node yang dapat diupdate secara bersamaan sama dengan jumlah max-surge-update dan max-unavailable-update, dan dibatasi hingga 20.

Mengaktifkan dan mengonfigurasi update lonjakan

Untuk mengaktifkan update lonjakan, hubungi Dukungan Google Cloud. Setelah tim dukungan mengaktifkan fitur ini, Anda dapat menetapkan nilai ke parameter max-surge-update dan max-unavailable-update saat membuat atau memperbarui kumpulan node:

Buat

gcloud container aws node-pools create NODE_POOL_NAME
    --cluster CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION \
    --max-surge-update MAX_SURGE \
    --max-unavailable-update MAX_UNAVAILABLE

Perbarui

gcloud container aws node-pools update NODE_POOL_NAME
    --cluster CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION \
    --max-surge-update MAX_SURGE \
    --max-unavailable-update MAX_UNAVAILABLE

Ganti kode berikut:

  • NODE_POOL_NAME: nama kumpulan node yang akan diperbarui.
  • CLUSTER_NAME: nama cluster.
  • GOOGLE_CLOUD_LOCATION: region Google Cloud yang didukung yang mengelola cluster Anda. Misalnya, us-west1.
  • MAX_SURGE: jumlah maksimum node tambahan yang dapat dibuat sementara di luar ukuran kumpulan node saat ini selama update. Dengan menyesuaikan nilai ini, Anda dapat mengontrol jumlah node yang diupdate secara bersamaan. Setelan default-nya adalah 1, tetapi Anda dapat menyetelnya ke 0. Jika Anda menetapkan max-surge-update ke nilai yang lebih besar dari 0, GKE di AWS akan membuat node lonjakan; menyetelnya ke 0 mencegah pembuatan node tersebut.
  • MAX_UNAVAILABLE: jumlah maksimum node yang mungkin tidak tersedia secara bersamaan selama proses update. Dengan meningkatkan nilai ini, lebih banyak node yang dapat diupdate secara bersamaan. Nilai defaultnya adalah 0, tetapi dapat disesuaikan ke atas.

Memeriksa setelan update lonjakan di kumpulan node

Untuk melihat setelan update lonjakan node, jalankan perintah berikut:

gcloud alpha container aws node-pools describe NODE_POOL_NAME
    --cluster CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION \

Ganti kode berikut:

  • NODE_POOL_NAME: nama node pool Anda.
  • CLUSTER_NAME: nama cluster.
  • GOOGLE_CLOUD_LOCATION: region Google Cloud yang didukung yang mengelola cluster Anda. Misalnya, us-west1.

Jika kumpulan node mengaktifkan update lonjakan, output dari perintah ini akan menampilkan bagian berlabel surge_settings. Bagian surge_settings ini menampilkan nilai parameter max_surge dan max_unavailable.

Mengelola pembaruan lonjakan yang sedang berlangsung

Anda dapat membatalkan update lonjakan yang sedang berlangsung, melakukan rollback update lonjakan yang gagal, atau melanjutkan update yang terhenti.

Batalkan (jeda) dan lanjutkan update lonjakan

Di GKE di AWS, "membatalkan" update lonjakan sebenarnya berarti menjeda update. Untuk mengetahui detail cara membatalkan update, lihat Membatalkan operasi update.

Dengan kata lain, membatalkan pembaruan lonjakan tidak akan membatalkan pembaruan. Sebaliknya, kumpulan node mungkin membiarkan kumpulan node dalam status diperbarui sebagian dengan dua grup penskalaan otomatis: satu dengan node yang menjalankan konfigurasi sebelumnya dan satu lagi dengan node yang menjalankan konfigurasi baru. Untuk menghilangkan masalah ini, lanjutkan update lonjakan dengan menjalankan kembali perintah update, menggunakan parameter target yang sama seperti operasi yang terganggu. Memulai update dengan parameter kumpulan node yang berbeda dibatasi hingga update sebelumnya selesai.

Menjalankan rollback update lonjakan yang gagal

Anda dapat melakukan roll back kumpulan node ke status aslinya jika update lonjakan dibatalkan atau gagal.

Hal yang perlu dipertimbangkan sebelum membatalkan update lonjakan

  • Anda hanya dapat melakukan roll back kumpulan node yang mengaktifkan lonjakan yang dalam status diperbarui sebagian (atau status DEGRADED).
  • Setelah rollback dimulai pada kumpulan node, Anda tidak dapat membatalkannya.
  • Anda tidak dapat melakukan lebih banyak operasi update hingga operasi rollback berhasil diselesaikan.
  • Anda hanya dapat mencoba kembali rollback jika gagal.
  • Anda tidak dapat melakukan roll back kumpulan node setelah berhasil diupdate.

Cara melakukan rollback pembaruan lonjakan yang gagal

Untuk melakukan rollback operasi update yang gagal pada kumpulan node, jalankan perintah berikut:

gcloud container aws node-pools rollback NODE_POOL_NAME
    --cluster CLUSTER_NAME

Ganti kode berikut:

  • NODE_POOL_NAME: nama kumpulan node yang akan diperbarui.
  • CLUSTER_NAME: nama cluster.

Cara kerja rollback

Memulai rollback secara internal akan memulai operasi pembaruan baru pada kumpulan node. ('Secara internal' di sini berarti proses ini dijalankan dalam sistem itu sendiri, dan tidak memerlukan intervensi Anda). Operasi tersebut mengembalikan node kumpulan node kembali ke status aslinya atas dasar upaya terbaik.

Node yang termasuk dalam grup penskalaan otomatis lama tidak diberi batasan, dan autoscaler cluster grup ini diaktifkan untuk memungkinkan workload dijadwalkan pada node. Node kumpulan node yang diupdate sebagian dalam grup penskalaan otomatis baru akan di- sebabkan, dikosongkan, dan dihentikan berdasarkan setelan lonjakan yang Anda tentukan dalam upaya update lonjakan awal.

Mengelola update lonjakan yang tidak berhasil

Anda memiliki tiga opsi untuk mengatasi update yang gagal:

  1. Lanjutkan update: Anda dapat melanjutkan update yang gagal menggunakan setelan kumpulan node target yang sama seperti upaya awal yang gagal.
  2. Rollback: Gunakan perintah rollback untuk mengembalikan kumpulan node ke status awalnya.
  3. Ubah dan mulai ulang: Jika Anda ingin mengubah parameter update lonjakan, kumpulan node yang ada harus dihapus, lalu dibuat ulang dengan setelan baru. Untuk mengetahui petunjuk cara menghapus kumpulan node, lihat Menghapus kumpulan node.