Mengupgrade cluster

Saat menginstal versi baru bmctl, Anda dapat mengupgrade cluster yang ada yang dibuat dengan versi sebelumnya. Mengupgrade cluster ke versi Google Distributed Cloud terbaru akan menghadirkan fitur dan perbaikan tambahan ke cluster Anda. Tindakan ini juga memastikan bahwa cluster Anda tetap didukung. Anda dapat mengupgrade cluster admin, hybrid, mandiri, atau pengguna dengan perintah bmctl upgrade cluster, atau Anda dapat menggunakan kubectl.

Untuk mempelajari lebih lanjut proses upgrade dan aturan pembuatan versi, lihat Siklus proses dan tahap upgrade cluster.

Halaman ini ditujukan untuk Admin, arsitek, dan Operator yang mengelola siklus proses infrastruktur teknologi dasar. Untuk mempelajari lebih lanjut peran umum dan contoh tugas yang kami referensikan dalam konten, lihat Peran dan tugas pengguna GKE umum. Google Cloud

Merencanakan upgrade

Bagian ini berisi informasi dan link ke informasi yang harus Anda pertimbangkan sebelum mengupgrade cluster. Untuk mengetahui informasi selengkapnya tentang upgrade, termasuk aturan pembuatan versi untuk cluster dan node pool, lihat Siklus proses dan tahap upgrade cluster.

Praktik terbaik

Untuk mengetahui informasi yang akan membantu Anda bersiap melakukan upgrade cluster, lihat Praktik terbaik untuk upgrade cluster Google Distributed Cloud.

Pemeriksaan awal upgrade

Pemeriksaan pra-penerbangan dijalankan sebagai bagian dari upgrade cluster untuk memvalidasi status cluster dan kondisi node. Upgrade cluster tidak akan dilanjutkan jika pemeriksaan awal gagal. Untuk mengetahui informasi selengkapnya tentang pemeriksaan preflight, lihat Memahami pemeriksaan preflight.

Anda dapat memeriksa apakah cluster siap untuk diupgrade dengan menjalankan pemeriksaan persiapan sebelum menjalankan upgrade. Untuk mengetahui informasi selengkapnya, lihat Pemeriksaan preflight untuk upgrade.

Masalah umum

Untuk mengetahui informasi tentang potensi masalah terkait upgrade cluster, lihat Masalah umum Google Distributed Cloud untuk bare metal dan pilih kategori masalah Upgrade dan update.

Mengonfigurasi opsi upgrade

Sebelum memulai upgrade cluster, Anda dapat mengonfigurasi opsi upgrade berikut yang mengontrol cara kerja proses upgrade:

Opsi ini dapat mengurangi risiko gangguan pada aplikasi dan layanan penting serta mengurangi waktu upgrade secara keseluruhan secara signifikan. Opsi ini sangat berguna untuk cluster besar dengan banyak node dan kumpulan node yang menjalankan workload penting. Untuk mengetahui informasi selengkapnya tentang fungsi opsi ini dan cara menggunakannya, lihat bagian berikut.

Upgrade node pool pekerja selektif

Secara default, operasi upgrade cluster mengupgrade setiap node dan node pool di cluster. Upgrade cluster dapat mengganggu dan memakan waktu, karena akan menyebabkan setiap node dikuras dan semua pod terkait dimulai ulang dan dijadwalkan ulang. Bagian ini menjelaskan cara menyertakan atau mengecualikan node pool pekerja tertentu untuk upgrade cluster guna meminimalkan gangguan workload. Fitur ini hanya berlaku untuk cluster pengguna, hybrid, dan mandiri, karena cluster admin tidak mengizinkan kumpulan node pekerja.

Anda dapat menggunakan upgrade node pool selektif dalam situasi berikut:

  • Untuk mendapatkan perbaikan keamanan tanpa mengganggu workload: Anda dapat mengupgrade hanya node bidang kontrol (dan node load balancer) untuk menerapkan perbaikan kerentanan Kubernetes tanpa mengganggu node pool pekerja.

  • Untuk mengonfirmasi pengoperasian yang tepat dari subset node pekerja yang diupgrade sebelum mengupgrade semua node pekerja: Anda dapat mengupgrade node pool pekerja secara selektif untuk memastikan bahwa beban kerja berjalan dengan benar di node pool yang diupgrade sebelum mengupgrade node pool lain.

  • Untuk mengurangi masa pemeliharaan: Mengupgrade cluster besar dapat memakan waktu dan sulit untuk memprediksi secara akurat kapan upgrade akan selesai. Waktu upgrade cluster sebanding dengan jumlah node yang diupgrade. Mengurangi jumlah node yang diupgrade dengan mengecualikan node pool akan mengurangi waktu upgrade. Anda melakukan upgrade beberapa kali, tetapi masa pemeliharaan yang lebih kecil dan lebih mudah diprediksi dapat membantu penjadwalan.

Ketidaksesuaian versi node pool dua versi minor

Untuk cluster versi 1.28 dan yang lebih tinggi, versi node pool pekerja dapat berisi hingga dua versi minor sebelum versi cluster (bidang kontrol). Dengan dukungan ketidaksesuaian versi n-2, Anda juga dapat melewati versi rilis minor saat mengupgrade node pool pekerja dari dua versi minor di belakang cluster ke versi minor yang sama dengan cluster.

Dukungan ketidakselarasan versi n-2 untuk kumpulan node pekerja memberi Anda fleksibilitas yang lebih besar dalam merencanakan upgrade armada.

Misalnya, jika Anda memiliki cluster versi 1.32, Anda dapat memiliki node pool pekerja pada versi 1.32, 1.31, dan 1.30 tertentu.

Sebelum Anda dapat mengupgrade cluster, semua kumpulan node pekerja harus berada di versi yang kompatibel dengan versi cluster saat ini dan versi cluster target.

Misalnya, jika Anda memiliki cluster di versi 1.29 dan kumpulan node pekerja di versi 1.29, versi 1.28, dan versi 1.16, Anda harus mengupgrade kumpulan node versi 1.16 ke versi 1.28 atau 1.29 sebelum dapat mengupgrade cluster ke versi 1.30.

Untuk mengetahui informasi selengkapnya, termasuk daftar versi node pool pekerja yang didukung oleh versi cluster tertentu (berlaku untuk versi 1.29 dan yang lebih lama), lihat Aturan pembuatan versi node pool

1,30

Pada rilis 1.30, dukungan kemiringan versi n-2 untuk kumpulan node pekerja tersedia secara umum untuk semua jenis cluster. Fitur ini diaktifkan secara default untuk cluster di versi 1.30.

Node pool pada versi patch apa pun dari versi minor 1.28 dan 1.29 dapat diupgrade ke versi patch 1.30, jika versi node pool sama atau lebih rendah dari versi cluster.

1,29

Pada rilis 1.29, dukungan kemiringan versi n-2 untuk node pool pekerja sudah tersedia secara umum untuk semua jenis cluster. Fitur ini diaktifkan secara default untuk cluster di versi 1.29.

Saat kami mentransisikan fitur ini dari Pratinjau Publik ke GA, cluster hybrid masih memerlukan anotasi pratinjau dalam situasi berikut. Jika Anda memiliki cluster hybrid versi 1.28.x dengan node pool pekerja versi 1.16.y, Anda harus menambahkan anotasi preview.baremetal.cluster.gke.io/two-minor-version-node-pool: enable ke cluster sebelum mengupgradenya ke versi 1.29.z:

apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: baremetal-demo
  namespace: cluster-baremetal-demo
  annotations:
    preview.baremetal.cluster.gke.io/two-minor-version-node-pool: enable
spec:
  type: hybrid
  profile: default
  anthosBareMetalVersion: 1.28.400-gke.77
  ...

1,28

Dukungan kemiringan versi n-2 untuk pool node pekerja tersedia untuk Pratinjau di rilis 1.28. Untuk mengaktifkan kemampuan Pratinjau ini, tambahkan anotasi preview.baremetal.cluster.gke.io/two-minor-version-node-pool: enable ke file konfigurasi cluster Anda:

apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: baremetal-demo
  namespace: cluster-baremetal-demo
  annotations:
    preview.baremetal.cluster.gke.io/two-minor-version-node-pool: enable
spec:
...

Jika Anda tidak mengaktifkan kemampuan Pratinjau ini, ketidaksesuaian versi maksimum antara kumpulan node pekerja dan cluster adalah satu versi minor.

Untuk mengetahui informasi selengkapnya tentang aturan pembuatan versi untuk mengupgrade node pekerja secara selektif, lihat Aturan pembuatan versi node pool di Siklus proses dan tahap upgrade cluster.

Mengupgrade bidang kontrol cluster dan node pool yang dipilih

Untuk mengupgrade kumpulan node pekerja secara selektif dalam upgrade cluster awal:

  1. Untuk node pool pekerja yang ingin Anda sertakan dalam upgrade cluster, lakukan salah satu perubahan berikut pada spesifikasi NodePool:

    • Tetapkan anthosBareMetalVersion dalam spesifikasi NodePool ke versi upgrade target cluster.
    • Hapus kolom anthosBareMetalVersion dari spesifikasi NodePool atau tetapkan ke string kosong. Secara default, node pool pekerja disertakan dalam upgrade cluster.
  2. Untuk kumpulan node pekerja yang ingin Anda kecualikan dari upgrade, tetapkan anthosBareMetalVersion ke versi cluster saat ini (pra-upgrade):

  3. Lanjutkan upgrade seperti yang dijelaskan dalam Mulai upgrade cluster.

    Operasi upgrade cluster mengupgrade node berikut:

    • Node bidang kontrol cluster.
    • Node pool load balancer, jika cluster Anda menggunakannya (spec.loadBalancer.nodePoolSpec). Secara default, node load balancer dapat menjalankan workload reguler. Anda tidak dapat mengupgrade node pool load balancer secara selektif, node pool tersebut selalu disertakan dalam upgrade cluster awal.
    • Kumpulan node pekerja yang belum Anda kecualikan dari upgrade.

Misalnya, anggaplah cluster Anda berada di versi 1.31.0 dan memiliki dua kumpulan node pekerja: wpool01 dan wpool02. Selain itu, misalkan Anda ingin mengupgrade bidang kontrol dan wpool01 ke 1.32.200-gke.104, tetapi Anda ingin wpool02 tetap berada di versi 1.31.0.

Kutipan file konfigurasi cluster berikut menunjukkan cara mengubah konfigurasi cluster untuk mendukung upgrade parsial ini:

...
---
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: user001
  namespace: cluster-user001
spec:
  type: user
  profile: default
  anthosBareMetalVersion: 1.32.200-gke.104
---
apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: wpool01
  namespace: cluster-user001
spec:
  clusterName: user001
  anthosBareMetalVersion: 1.32.200-gke.104
  nodes:
  - address:  10.200.0.1
  - address:  10.200.0.2
  - address:  10.200.0.3
  ...
  - address:  10.200.0.8

apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: wpool02
  namespace: cluster-user001
spec:
  clusterName: user001
  anthosBareMetalVersion: 1.31.0
  nodes:
  - address:  10.200.1.1
  - address:  10.200.1.2
  - address:  10.200.1.3
  ...
  - address:  10.200.1.12

Mengupgrade node pool ke versi cluster saat ini

Jika telah mengecualikan node pool dari upgrade cluster, Anda dapat menjalankan upgrade cluster yang membawanya ke versi cluster target. Kumpulan node pekerja yang telah dikecualikan dari upgrade cluster memiliki kolom anthosBareMetalVersion di spesifikasi NodePool yang ditetapkan ke versi cluster sebelumnya (pra-upgrade).

Untuk mengaktifkan node pool pekerja ke versi cluster yang saat ini diupgrade:

  1. Edit spesifikasi NodePool dalam file konfigurasi cluster untuk node pool pekerja yang ingin Anda upgrade ke versi cluster saat ini. Tetapkan anthosBareMetalVersion ke versi cluster saat ini (setelah upgrade).

    Jika beberapa node pool pekerja dipilih untuk diupgrade, nilai spec.nodePoolUpgradeStrategy.concurrentNodePools dalam spesifikasi cluster menentukan jumlah node pool yang diupgrade secara paralel, jika ada. Jika Anda tidak ingin mengupgrade node pool pekerja secara bersamaan, pilih satu node pool dalam satu waktu untuk diupgrade.

  2. Lanjutkan upgrade seperti yang dijelaskan dalam Mulai upgrade cluster.

    Operasi upgrade cluster hanya mengupgrade kumpulan node pekerja yang sebelumnya dikecualikan dan telah Anda tetapkan anthosBareMetalVersion ke versi cluster yang saat ini diupgrade.

Misalnya, anggaplah Anda mengupgrade cluster ke versi 1.32.200-gke.104, tetapi node pool wpool02 masih menggunakan versi cluster lama sebelum upgrade, yaitu 1.31.0. Workload berjalan dengan baik di node pool yang diupgrade, wpool01, jadi sekarang Anda juga ingin mengupgrade wpool02 ke versi cluster saat ini. Untuk mengupgrade wpool02, Anda dapat menghapus kolom anthosBareMetalVersion atau menetapkan nilainya ke string kosong.

Kutipan file konfigurasi cluster berikut menunjukkan cara mengubah konfigurasi cluster untuk mendukung upgrade parsial ini:

...
---
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: user001
  namespace: cluster-user001
spec:
  type: user
  profile: default
  anthosBareMetalVersion: 1.32.200-gke.104
---
apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: wpool01
  namespace: cluster-user001
spec:
  clusterName: user001
  anthosBareMetalVersion: 1.32.200-gke.104
  nodes:
  - address:  10.200.0.1
  - address:  10.200.0.2
  - address:  10.200.0.3
  ...
  - address:  10.200.0.8

apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: wpool02
  namespace: cluster-user001
spec:
  clusterName: user001
  anthosBareMetalVersion: ""
  nodes:
  - address:  10.200.1.1
  - address:  10.200.1.2
  - address:  10.200.1.3
  ...
  - address:  10.200.1.12

Me-roll back upgrade node pool

Ada banyak dependensi, seperti kompatibilitas dengan kubelet atau plugin, yang dapat memengaruhi performa beban kerja Anda. Jika Anda mengalami masalah setelah mengupgrade kumpulan node pekerja, Anda dapat me-roll back kumpulan node ke versi sebelumnya.

Fitur ini tidak berada pada fase peluncuran yang sama untuk semua versi cluster yang didukung:

1,30

Untuk cluster versi 1.30 (cluster dengan node bidang kontrol di versi 1.30), kemampuan rollback node pool tersedia secara umum dan diaktifkan secara default.

1,29

Kemampuan rollback node pool tersedia dalam Pratinjau untuk cluster versi 1.29 (cluster dengan node bidang kontrol pada versi 1.29). Saat fitur ini dalam Pratinjau, Anda harus menambahkan anotasi berikut ke resource Cluster untuk mengaktifkan fitur:

preview.baremetal.cluster.gke.io/worker-node-pool-upgrade-rollback: enable

1,28

Kemampuan rollback node pool tidak tersedia untuk cluster pada versi minor 1.28 atau yang lebih lama.

Untuk melakukan roll back upgrade node pool, ikuti langkah-langkah berikut:

bmctl

Saat menggunakan bmctl untuk mengembalikan upgrade node pool, Anda mengedit file konfigurasi cluster dan menerapkan perubahan dengan perintah bmctl update:

  1. Edit spesifikasi NodePool dalam file konfigurasi cluster untuk node pool pekerja yang ingin Anda roll back ke versi sebelumnya. Setel anthosBareMetalVersion ke versi cluster sebelumnya (sebelum upgrade).

    ...
    ---
    apiVersion: baremetal.cluster.gke.io/v1
    kind: NodePool
    metadata:
      name: wpool01
      namespace: cluster-user001
    spec:
      clusterName: user001
      anthosBareMetalVersion: 1.31.700-gke.72
      nodes:
      - address:  10.200.0.1
      - address:  10.200.0.2
      - address:  10.200.0.3
      ...
    

    Jika beberapa kumpulan node pekerja dipilih untuk rollback, nilai spec.nodePoolUpgradeStrategy.concurrentNodePools dalam spesifikasi cluster menentukan jumlah kumpulan node yang di-rollback secara paralel. Jika Anda tidak ingin melakukan roll back node pool pekerja secara serentak, pilih satu node pool dalam satu waktu untuk di-roll back atau perbarui setelan nodePoolUpgradeStrategy. Demikian pula, nilai spec.upgradeStrategy.parallelUpgrade.concurrentNodes dalam spesifikasi NodePool menentukan jumlah node yang di-roll back secara paralel.

  2. Gunakan bmctl update untuk menerapkan perubahan spesifikasi NodePool:

    bmctl update cluster -c CLUSTER_NAME --kubeconfig=ADMIN_KUBECONFIG
    

    Ganti kode berikut:

    • CLUSTER_NAME: nama cluster yang ingin Anda perbarui.

    • ADMIN_KUBECONFIG: jalur file kubeconfig dari cluster pengelola (admin, hybrid, atau mandiri).

    Rollback dimulai secara otomatis. Perintah bmctl update cluster akan segera keluar, tetapi rollback akan terus berjalan. Jangan lakukan operasi lain pada cluster saat rollback sedang berlangsung.

  3. Saat rollback berjalan, Google Distributed Cloud melakukan aktivitas berikut untuk setiap node:

    • Aktifkan mode pemeliharaan untuk node.
    • Jalankan tugas reset pada node untuk membawanya ke status bersih.
    • Jalankan pemeriksaan pra-penerbangan mesin di node.
    • Jalankan tugas machine-init di node untuk menginstal ulang node pada versi rollback target (sebelum upgrade).
    • Keluarkan node dari mode pemeliharaan.

    Di akhir rollback yang berhasil, nilai nodePool.status.anthosBareMetalVersion dalam resource NodePool ditetapkan ke versi rollback target.

kubectl

Anda dapat me-roll back upgrade node pool dengan menggunakan kubectl untuk mengedit resource NodePool secara langsung:

  1. Untuk melakukan roll back node pool pekerja, buka resource NodePool untuk diedit:

    kubectl edit nodepool NODE_POOL_NAME \
        --namespace CLUSTER_NAMESPACE \
        --kubeconfig ADMIN_KUBECONFIG
    

    Ganti kode berikut:

    • NODE_POOL_NAME: nama node pool yang akan di-roll back.

    • CLUSTER_NAMESPACE: nama namespace tempat node pool di-deploy. Ini adalah namespace cluster.

    • ADMIN_KUBECONFIG: jalur file kubeconfig dari cluster pengelola (admin, hybrid, atau mandiri).

  2. Ubah nilai spec.anthosBareMetalVersion ke versi sebelumnya (pra-upgrade).

    ...
    ---
    apiVersion: baremetal.cluster.gke.io/v1
    kind: NodePool
    metadata:
      name: wpool01
      namespace: cluster-user001
    spec:
      clusterName: user001
      anthosBareMetalVersion: 1.31.700-gke.72
      nodes:
      - address:  10.200.0.1
      - address:  10.200.0.2
      - address:  10.200.0.3
      ...
    
  3. Simpan dan tutup resource NodePool di editor Anda.

    Rollback dimulai secara otomatis. Jangan melakukan operasi lain pada klaster saat rollback sedang berlangsung.

  4. Saat rollback berjalan, Google Distributed Cloud melakukan aktivitas berikut untuk setiap node:

    • Aktifkan mode pemeliharaan untuk node.
    • Jalankan tugas reset pada node untuk membawanya ke status bersih.
    • Jalankan pemeriksaan pra-penerbangan mesin di node.
    • Jalankan tugas machine-init di node untuk menginstal ulang node pada versi rollback target (sebelum upgrade).
    • Keluarkan node dari mode pemeliharaan.

    Di akhir rollback yang berhasil, nilai nodePool.status.anthosBareMetalVersion dalam resource NodePool ditetapkan ke versi rollback target.

Upgrade paralel

Dalam upgrade cluster default yang umum, setiap node cluster diupgrade secara berurutan, satu per satu. Bagian ini menunjukkan cara mengonfigurasi cluster dan node pool pekerja agar beberapa node diupgrade secara paralel saat Anda mengupgrade cluster. Mengupgrade node secara paralel akan mempercepat upgrade cluster secara signifikan, terutama untuk cluster yang memiliki ratusan node.

Ada dua strategi upgrade paralel yang dapat Anda gunakan untuk mempercepat upgrade cluster:

  • Upgrade node serentak: Anda dapat mengonfigurasi kumpulan node pekerja sehingga beberapa node diupgrade secara paralel. Upgrade paralel node dikonfigurasi dalam spesifikasi NodePool (spec.upgradeStrategy.parallelUpgrade) dan hanya node di node pool pekerja yang dapat diupgrade secara paralel. Node di node pool bidang kontrol atau load balancer hanya dapat diupgrade satu per satu. Untuk mengetahui informasi selengkapnya, lihat Strategi upgrade node.

  • Upgrade node pool serentak: Anda dapat mengonfigurasi cluster sehingga beberapa node pool diupgrade secara paralel. Hanya kumpulan node pekerja yang dapat diupgrade secara paralel. Node pool bidang kontrol dan load balancer hanya dapat diupgrade satu per satu.

Strategi upgrade node

Anda dapat mengonfigurasi kumpulan node pekerja sehingga beberapa node diupgrade secara bersamaan (concurrentNodes). Anda juga dapat menetapkan nilai minimum untuk jumlah node yang dapat menjalankan beban kerja selama proses upgrade (minimumAvailableNodes). Konfigurasi ini dilakukan dalam spesifikasi NodePool. Untuk informasi selengkapnya tentang kolom ini, lihat Referensi kolom konfigurasi cluster.

Strategi upgrade node hanya berlaku untuk node pool pekerja. Anda tidak dapat menentukan strategi upgrade node untuk node pool bidang kontrol atau load balancer. Selama upgrade cluster, node di bidang kontrol dan node load balancer diupgrade secara berurutan, satu per satu. Node pool bidang kontrol dan node pool load balancer ditentukan dalam spesifikasi Cluster (controlPlane.nodePoolSpec.nodes dan loadBalancer.nodePoolSpec.nodes).

Saat Anda mengonfigurasi upgrade paralel untuk node, perhatikan batasan berikut:

  • Nilai concurrentNodes tidak boleh melebihi 50 persen dari jumlah node di node pool, atau angka tetap 15, mana saja yang lebih kecil. Misalnya, jika node pool Anda memiliki 20 node, Anda tidak dapat menentukan nilai yang lebih besar dari 10. Jika node pool Anda memiliki 100 node, 15 adalah nilai maksimum yang dapat Anda tentukan.

  • Saat Anda menggunakan concurrentNodes bersama dengan minimumAvailableNodes, nilai gabungan tidak boleh melebihi jumlah total node di node pool. Misalnya, jika node pool Anda memiliki 20 node dan minimumAvailableNodes ditetapkan ke 18, concurrentNodes tidak boleh melebihi 2. Demikian pula, jika concurrentNodes ditetapkan ke 10, minimumAvailableNodes tidak boleh melebihi 10.

Contoh berikut menunjukkan kumpulan node pekerja np1 dengan 10 node. Dalam upgrade, node diupgrade 5 sekaligus dan minimal 4 node harus tetap tersedia agar upgrade dapat dilanjutkan:

apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: np1
  namespace: cluster-cluster1
spec:
  clusterName: cluster1
  nodes:
  - address:  10.200.0.1
  - address:  10.200.0.2
  - address:  10.200.0.3
  - address:  10.200.0.4
  - address:  10.200.0.5
  - address:  10.200.0.6
  - address:  10.200.0.7
  - address:  10.200.0.8
  - address:  10.200.0.9
  - address:  10.200.0.10 
  upgradeStrategy:
    parallelUpgrade:
      concurrentNodes: 5
      minimumAvailableNodes: 4 

Strategi upgrade node pool

Anda dapat mengonfigurasi cluster sehingga beberapa kumpulan node pekerja diupgrade secara paralel. Kolom Boolean nodePoolUpgradeStrategy.concurrentNodePools dalam spesifikasi cluster menentukan apakah akan mengupgrade semua kumpulan node pekerja untuk cluster secara serentak atau tidak. Secara default (1), node pool diupgrade secara berurutan, satu per satu. Saat Anda menyetel concurrentNodePools ke 0, setiap node pool pekerja di cluster akan diupgrade secara paralel.

Kumpulan node bidang kontrol dan load balancing tidak terpengaruh oleh setelan ini. Node pool ini selalu diupgrade secara berurutan, satu per satu. Node pool bidang kontrol dan node pool load balancer ditentukan dalam spesifikasi Cluster (controlPlane.nodePoolSpec.nodes dan loadBalancer.nodePoolSpec.nodes).

apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: cluster1
  namespace: cluster-cluster1
spec:
  ...
  nodePoolUpgradeStrategy:
    concurrentNodePools: 0
  ...

Cara melakukan upgrade paralel

Bagian ini menjelaskan cara mengonfigurasi cluster dan node pool pekerja untuk upgrade paralel.

Untuk melakukan upgrade paralel pada kumpulan node pekerja dan node di kumpulan node pekerja, lakukan hal berikut:

  1. Tambahkan bagian upgradeStrategy ke spesifikasi NodePool.

    Anda dapat menerapkan manifes ini secara terpisah atau sebagai bagian dari file konfigurasi cluster saat melakukan update cluster.

    Berikut contohnya:

    ---
    apiVersion: baremetal.cluster.gke.io/v1
    kind: NodePool
    metadata:
      name: np1
      namespace: cluster-ci-bf8b9aa43c16c47
    spec:
      clusterName: ci-bf8b9aa43c16c47
      nodes:
      - address:  10.200.0.1
      - address:  10.200.0.2
      - address:  10.200.0.3
      ...
      - address:  10.200.0.30
      upgradeStrategy:
        parallelUpgrade:
          concurrentNodes: 5
          minimumAvailableNodes: 10
    

    Dalam contoh ini, nilai kolom concurrentNodes adalah 5, yang berarti 5 node diupgrade secara paralel. Kolom minimumAvailableNodes ditetapkan ke 10, yang berarti setidaknya 10 node harus tetap tersedia untuk workload selama upgrade.

  2. Tambahkan bagian nodePoolUpgradeStrategy ke spesifikasi Cluster dalam file konfigurasi cluster.

    ---
    apiVersion: v1
    kind: Namespace
    metadata:
      name: cluster-user001
    ---
    apiVersion: baremetal.cluster.gke.io/v1
    kind: Cluster
    metadata:
      name: user001
      namespace: cluster-user001
    spec:
      type: user
      profile: default
      anthosBareMetalVersion: 1.32.200-gke.104
      ...
      nodePoolUpgradeStrategy:
        concurrentNodePools: 0
      ...
    

    Dalam contoh ini, kolom concurrentNodePools ditetapkan ke 0, yang berarti semua node pool pekerja diupgrade secara bersamaan selama upgrade cluster. Strategi upgrade untuk node di node pool ditentukan dalam spesifikasi NodePool.

  3. Upgrade cluster seperti yang dijelaskan di bagian Mengupgrade cluster admin, mandiri, hybrid, atau pengguna sebelumnya.

Nilai default upgrade paralel

Upgrade paralel dinonaktifkan secara default dan kolom yang terkait dengan upgrade paralel dapat diubah. Kapan saja, Anda dapat menghapus kolom atau menyetelnya ke nilai default untuk menonaktifkan fitur sebelum upgrade berikutnya.

Tabel berikut mencantumkan kolom upgrade paralel dan nilai defaultnya:

Kolom Nilai default Arti
nodePoolUpgradeStrategy.concurrentNodePools (Spesifikasi cluster) 1 Upgrade kumpulan node pekerja secara berurutan, satu per satu.
upgradeStrategy.parallelUpgrade.concurrentNodes (spesifikasi NodePool) 1 Upgrade node secara berurutan, satu per satu.
upgradeStrategy.parallelUpgrade.minimumAvailableNodes (spesifikasi NodePool) Nilai minimumAvailableNodes default bergantung pada nilai concurrentNodes.
  • Jika Anda tidak menentukan concurrentNodes, maka minimumAvailableNodes secara default adalah 2/3 ukuran kumpulan node.
  • Jika Anda menentukan concurrentNodes, maka minimumAvailableNodes secara default adalah ukuran node pool dikurangi concurrentNodes.
Upgrade akan terhenti setelah minimumAvailableNodes tercapai dan hanya akan dilanjutkan setelah jumlah node yang tersedia lebih besar dari minimumAvailableNodes.

Mulai upgrade cluster

Bagian ini berisi petunjuk untuk mengupgrade cluster.

bmctl

Saat mendownload dan menginstal bmctl versi baru, Anda dapat mengupgrade cluster admin, hybrid, mandiri, dan pengguna yang dibuat dengan versi sebelumnya. Untuk versi bmctl tertentu, cluster hanya dapat diupgrade ke versi yang sama.

  1. Tetapkan kredensial pengguna Anda sebagai Kredensial Default Aplikasi (ADC):

    gcloud auth application-default login
    

    Ikuti petunjuk untuk memilih Akun Google Anda untuk ADC. Untuk informasi selengkapnya, lihat Menyiapkan Kredensial Default Aplikasi.

  2. Download bmctl terbaru seperti yang dijelaskan di Download Google Distributed Cloud.

  3. Perbarui anthosBareMetalVersion dalam file konfigurasi cluster ke versi target upgrade.

    Versi target upgrade harus cocok dengan versi file bmctl yang didownload. Cuplikan file konfigurasi cluster berikut menunjukkan kolom anthosBareMetalVersion yang diperbarui ke versi terbaru:

    ---
    apiVersion: baremetal.cluster.gke.io/v1
    kind: Cluster
    metadata:
      name: cluster1
      namespace: cluster-cluster1
    spec:
      type: admin
      # Anthos cluster version.
      anthosBareMetalVersion: 1.32.200-gke.104
    
  4. Gunakan perintah bmctl upgrade cluster untuk menyelesaikan upgrade:

    bmctl upgrade cluster -c CLUSTER_NAME --kubeconfig ADMIN_KUBECONFIG
    

    Ganti kode berikut:

    • CLUSTER_NAME: nama cluster yang akan diupgrade.
    • ADMIN_KUBECONFIG: jalur ke file kubeconfig cluster admin.

    Operasi upgrade cluster menjalankan pemeriksaan preflight untuk memvalidasi status cluster dan kesehatan node. Upgrade cluster tidak akan dilanjutkan jika pemeriksaan awal gagal. Untuk mengetahui informasi pemecahan masalah, lihat Memecahkan masalah penginstalan atau upgrade cluster.

    Setelah semua komponen cluster berhasil diupgrade, operasi upgrade cluster akan melakukan pemeriksaan kondisi cluster. Langkah terakhir ini memastikan bahwa cluster dalam kondisi operasi yang baik. Jika cluster tidak lulus semua health check, health check akan terus berjalan hingga lulus. Jika semua health check berhasil, upgrade akan berhasil diselesaikan.

    Untuk mengetahui informasi selengkapnya tentang urutan peristiwa untuk upgrade cluster, lihat Siklus proses dan tahap upgrade cluster.

kubectl

Untuk mengupgrade cluster dengan kubectl, lakukan langkah-langkah berikut:

  1. Edit file konfigurasi cluster untuk menyetel anthosBareMetalVersion ke versi target upgrade.

  2. Untuk memulai upgrade, jalankan perintah berikut:

    kubectl apply -f CLUSTER_CONFIG_PATH
    

    Ganti CLUSTER_CONFIG_PATH dengan jalur ke file konfigurasi cluster yang telah diedit.

    Seperti proses upgrade dengan bmctl, pemeriksaan pra-penerbangan dijalankan sebagai bagian dari upgrade cluster untuk memvalidasi status cluster dan kesehatan node. Jika pemeriksaan awal gagal, upgrade cluster akan dihentikan. Untuk memecahkan masalah kegagalan, periksa cluster dan log terkait, karena tidak ada cluster bootstrap yang dibuat. Untuk mengetahui informasi selengkapnya, lihat Memecahkan masalah penginstalan atau upgrade cluster.

Meskipun Anda tidak memerlukan bmctl versi terbaru untuk mengupgrade cluster dengan kubectl, sebaiknya download bmctl terbaru. Anda memerlukan bmctl untuk melakukan tugas lain, seperti pemeriksaan kondisi dan pencadangan, untuk memastikan cluster Anda tetap berfungsi dengan baik.

Menjeda dan melanjutkan upgrade

Fitur jeda dan lanjutkan upgrade memungkinkan Anda menjeda upgrade cluster sebelum selesai. Saat upgrade cluster dijeda, tidak ada upgrade node pekerja baru yang dipicu hingga upgrade dilanjutkan.

Fitur ini tersedia di (Pratinjau) untuk cluster dengan semua node panel kontrol pada versi minor 1.28 atau yang lebih tinggi. Fitur ini tersedia untuk umum di cluster dengan semua node bidang kontrol pada versi minor 1.29 atau yang lebih tinggi.

Anda mungkin ingin menjeda upgrade karena alasan berikut:

  • Anda mendeteksi ada yang salah dengan workload cluster selama upgrade dan Anda ingin menjeda upgrade untuk menyelidiki masalah tersebut

  • Anda memiliki masa pemeliharaan yang singkat, jadi Anda ingin menjeda upgrade di antara masa pemeliharaan

Saat upgrade cluster dijeda, operasi berikut didukung:

Saat node baru ditambahkan saat upgrade dijeda, tugas pemeriksaan mesin tidak berjalan di node tersebut hingga upgrade dilanjutkan dan selesai.

Saat upgrade cluster dijeda, operasi cluster berikut tidak didukung:

Anda tidak dapat memulai upgrade cluster baru saat upgrade cluster yang aktif dijeda.

Mengaktifkan jeda dan melanjutkan upgrade

Google Distributed Cloud 1.32

Fitur jeda dan lanjutkan upgrade diaktifkan secara default untuk cluster dengan semua node bidang kontrol pada versi minor 1.29 atau yang lebih tinggi.

Google Distributed Cloud 1.31

Meskipun kemampuan jeda dan lanjutkan upgrade masih dalam Pratinjau, Anda dapat mengaktifkannya dengan anotasi di resource Cluster.

Untuk mengaktifkan jeda dan melanjutkan upgrade, ikuti langkah-langkah berikut:

  1. Tambahkan anotasi preview.baremetal.cluster.gke.io/upgrade-pause-and-resume ke file konfigurasi cluster Anda:

    apiVersion: baremetal.cluster.gke.io/v1
    kind: Cluster
    metadata:
      name: baremetal-demo
      namespace: cluster-baremetal-demo
      annotations:
        preview.baremetal.cluster.gke.io/upgrade-pause-and-resume: enable
    spec:
    ...
    
  2. Untuk menerapkan perubahan, update cluster Anda:

    bmctl update cluster -c CLUSTER_NAME --kubeconfig=ADMIN_KUBECONFIG
    

    Ganti kode berikut:

    • CLUSTER_NAME: nama cluster yang ingin Anda perbarui.
    • ADMIN_KUBECONFIG: untuk cluster admin, hybrid, atau mandiri, masukkan jalur ke file kubeconfig cluster. Untuk cluster pengguna, masukkan jalur ke file kubeconfig cluster admin.

    Kolom nodePoolUpgradeStrategy.pause dapat diubah. Anda dapat menambahkan dan memperbaruinya kapan saja.

Menjeda upgrade

Anda menjeda upgrade cluster dengan menyetel nodePoolUpgradeStrategy.pause ke true dalam spesifikasi Cluster.

Untuk menjeda upgrade cluster yang aktif, ikuti langkah-langkah berikut:

  1. Tambahkan nodePoolUpgradeStrategy.pause ke file konfigurasi cluster dan tetapkan ke true:

    apiVersion: baremetal.cluster.gke.io/v1
    kind: Cluster
    metadata:
      name: baremetal-demo
      namespace: cluster-baremetal-demo
      ...
    spec:
      ...
      nodePoolUpgradeStrategy:
        pause: true
      ...
    

    Jika Anda menggunakan bmctl untuk memulai upgrade, Anda memerlukan jendela terminal baru untuk melakukan langkah berikutnya.

  2. Untuk menerapkan perubahan, update cluster Anda:

    bmctl update CLUSTER_NAME
    

    Operasi upgrade dijeda. Tidak ada upgrade node baru yang dipicu.

  3. Jika Anda menggunakan bmctl untuk memulai upgrade dan Anda berencana untuk menjeda dalam waktu lama, tekan Control+C untuk keluar dari bmctl, atau biarkan bmctl tetap berjalan.

    CLI bmctl tidak mendeteksi perubahan status jeda upgrade, sehingga tidak keluar secara otomatis. Namun, saat Anda keluar dari bmctl, proses logging progres upgrade akan berhenti ke file log cluster-upgrade-TIMESTAMP di folder cluster pada workstation admin dan ke Cloud Logging. Oleh karena itu, untuk jeda singkat, Anda sebaiknya membiarkan bmctl tetap berjalan. Jika Anda membiarkan bmctl berjalan dalam jangka waktu yang lama saat upgrade dijeda, pada akhirnya akan terjadi waktu tunggu habis.

Melanjutkan upgrade yang dijeda

Anda melanjutkan upgrade cluster yang dijeda dengan menetapkan nodePoolUpgradeStrategy.pause ke false dalam spesifikasi Cluster atau menghapus nodePoolUpgradeStrategy.pause dari spesifikasi.

Untuk melanjutkan upgrade cluster yang telah dijeda, ikuti langkah-langkah berikut:

  1. Tetapkan nodePoolUpgradeStrategy.pause ke file konfigurasi cluster dan tetapkan ke false:

    apiVersion: baremetal.cluster.gke.io/v1
    kind: Cluster
    metadata:
      name: baremetal-demo
      namespace: cluster-baremetal-demo
      ...
    spec:
      ...
      nodePoolUpgradeStrategy:
        pause: false
      ...
    

    Atau, Anda dapat menghapus kolom pause, karena secara default ditetapkan ke false.

  2. Untuk menerapkan perubahan, update cluster Anda:

    bmctl update CLUSTER_NAME
    

    Operasi upgrade akan dilanjutkan dari saat upgrade dihentikan.

  3. Untuk memeriksa status upgrade, pertama-tama dapatkan daftar resource yang memiliki anthosBareMetalVersion di status-nya:

    kubectl get RESOURCE --kubeconfig ADMIN_KUBECONFIG --all_namespaces
    

    Ganti kode berikut:

    • RESOURCE: nama resource yang ingin Anda dapatkan. Resource Cluster, NodePool, dan BareMetalMachine semuanya berisi informasi status anthosBareMetalVersion.

    • ADMIN_KUBECONFIG: jalur file kubeconfig cluster admin.

    Contoh berikut menunjukkan format respons untuk resource kustom BareMetalMachine. Setiap BareMetalMachine sesuai dengan node cluster.

    NAMESPACE              NAME         CLUSTER        READY   INSTANCEID               MACHINE      ABM VERSION   DESIRED ABM VERSION
    cluster-nuc-admin001   192.0.2.52   nuc-admin001   true    baremetal://192.0.2.52   192.0.2.52   1.28.0        1.28.0
    cluster-nuc-user001    192.0.2.53   nuc-user001    true    baremetal://192.0.2.53   192.0.2.53   1.16.2        1.16.2
    cluster-nuc-user001    192.0.2.54   nuc-user001    true    baremetal://192.0.2.54   192.0.2.54   1.16.2        1.16.2
    
  4. Untuk memeriksa status.anthosBareMetalVersion (versi resource saat ini), ambil detail untuk setiap resource:

    kubectl describe RESOURCE RESOURCE_NAME \
        --kubeconfig ADMIN_KUBECONFIG \
        --namespace CLUSTER_NAMESPACE
    

    Contoh berikut menunjukkan detail BareMetalMachine untuk node cluster dengan alamat IP 192.0.2.53:

    Name:         192.0.2.53
    Namespace:    cluster-nuc-user001
    ...
    API Version:  infrastructure.baremetal.cluster.gke.io/v1
    Kind:         BareMetalMachine
    Metadata:
      Creation Timestamp:  2023-09-22T17:52:09Z
      ...
    Spec:
      Address:                    192.0.2.53
      Anthos Bare Metal Version:  1.16.2
      ...
    Status:
      Anthos Bare Metal Version:  1.16.2
    

    Dalam contoh ini, node berada di Google Distributed Cloud versi 1.16.2.