Cluster Anthos on bare metal kini menjadi Google Distributed Cloud (khusus software) untuk bare metal. Untuk mengetahui informasi selengkapnya, lihat ringkasan produk.

Halaman ini diterjemahkan oleh Cloud Translation API.

Menghapus node yang diblokir oleh PodDisruptionBudgets

Dalam kondisi tertentu, kebijakan PodDisruptionBudgets (PDB) dapat mencegah node berhasil dihapus dari nodepool. Dalam kondisi ini, status node melaporkan Ready,SchedulingDisabled meskipun dihapus. Dokumen ini menunjukkan cara menghapus node dari cluster Google Distributed Cloud yang saat ini diblokir oleh masalah PDB.

Halaman ini ditujukan untuk Admin, arsitek, dan Operator yang mengelola siklus proses infrastruktur teknologi yang mendasarinya, serta merespons pemberitahuan dan halaman saat sasaran tingkat layanan (SLO) tidak terpenuhi atau aplikasi gagal. Untuk mempelajari lebih lanjut peran umum dan contoh tugas yang kami referensikan dalam konten Google Cloud, lihat Peran dan tugas pengguna GKE Enterprise umum.

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.

PDB bertentangan dengan jumlah Pod yang tersedia

Kebijakan PDB membantu memastikan performa aplikasi dengan mencegah Pod mati secara bersamaan saat Anda membuat perubahan pada sistem. Akibatnya, kebijakan PDB membatasi jumlah Pod yang tidak tersedia secara bersamaan dalam aplikasi replika.

Namun, kebijakan PDB terkadang dapat mencegah penghapusan node yang ingin Anda lakukan jika Anda akan melanggar kebijakan dengan menghapus node.

Misalnya, kebijakan PDB dapat menentukan bahwa harus selalu ada dua Pod yang tersedia di sistem (.spec.minAvailable adalah 2). Namun, jika Anda hanya memiliki dua Pod, dan Anda mencoba menghapus node yang berisi salah satunya, kebijakan PDB akan diterapkan dan mencegah penghapusan node.

Demikian pula, jika kebijakan PDB menentukan bahwa tidak ada Pod yang tidak tersedia (.spec.maxUnavailable adalah 0), kebijakan ini juga mencegah node terkait dihapus. Meskipun Anda mencoba menghapus satu Pod dalam satu waktu, kebijakan PDB akan mencegah Anda menghapus node yang terpengaruh.

Menonaktifkan dan mengaktifkan kembali kebijakan PDB

Untuk menyelesaikan konflik PDB, cadangkan, lalu hapus kebijakan PDB. Setelah PDB berhasil dihapus, node akan habis dan Pod terkait akan dihapus. Kemudian, Anda dapat melakukan perubahan yang diinginkan, dan mengaktifkan kembali kebijakan PDB.

Contoh berikut menunjukkan cara menghapus node dalam kondisi ini, yang dapat memengaruhi semua jenis cluster Google Distributed Cloud: cluster admin, hybrid, mandiri, dan pengguna.

Prosedur umum yang sama berlaku untuk semua jenis cluster. Namun, perintah khusus untuk menghapus node dari nodepool cluster admin (untuk cluster admin, campuran, atau mandiri) sedikit berbeda dengan perintah untuk menghapus node dari nodepool cluster pengguna.

Untuk memudahkan pembacaan, variabel ${KUBECONFIG} digunakan dalam perintah berikut.

Bergantung pada jenis cluster, ekspor jalur kubeconfig cluster admin (ADMIN_KUBECONFIG) atau kubeconfig cluster pengguna (USER_CLUSTER_CONFIG) ke $(KUBECONFIG) dan selesaikan langkah-langkah berikut:
- Untuk menghapus node dari cluster pengguna, tetapkan export KUBECONFIG=USER_CLUSTER_CONFIG
- Untuk menghapus node dari cluster admin, tetapkan export KUBECONFIG=ADMIN_KUBECONFIG.
Opsional: Jika Anda menghapus node dari nodepool cluster pengguna, jalankan perintah berikut untuk mengekstrak file kubeconfig cluster pengguna:
```
kubectl --kubeconfig ADMIN_KUBECONFIG -n cluster-USER_CLUSTER_NAME \
  get secret USER_CLUSTER_NAME-kubeconfig  \
  -o 'jsonpath={.data.value}' | base64 -d > USER_CLUSTER_CONFIG
```
Ganti entri berikut dengan informasi khusus untuk lingkungan cluster Anda:
- ADMIN_KUBECONFIG: jalur ke file kubeconfig cluster admin.
- CLUSTER_NAME: nama cluster yang ingin Anda ambil snapshot-nya.
- USER_CLUSTER_CONFIG: jalur ke file konfigurasi cluster pengguna.

Setelah Anda menghapus node dari node pool, periksa status node. Node yang terpengaruh melaporkan Ready, SchedulingDisabled:

kubectl get nodes --kubeconfig ${KUBECONFIG}

Status node terlihat mirip dengan contoh output berikut:

NAME   STATUS                    ROLES      AGE      VERSION
CP2    Ready                     Master     11m      v.1.18.6-gke.6600
CP3    Ready,SchedulingDisabled  <none>     9m22s    v.1.18.6-gke.6600
CP4    Ready                     <none>     9m18s    v.1.18.6-gke.6600

Periksa PDB di cluster Anda:

kubectl get pdb --kubeconfig ${KUBECONFIG} -A

Sistem melaporkan PDB yang mirip dengan yang ditampilkan dalam contoh output berikut:

NAMESPACE     NAME             MIN AVAILABLE    MAX UNAVAILABLE   ALLOWED DISRUPTIONS   AGE
gke-system    istio-ingress    1                N/A               1                     19m
gke-system    istiod           1                N/A               1                     19m
kube-system   coredns          1                N/A               0                     19m
kube-system   log-aggregator   N/A              0                 0                     19m
kube-system   prometheus       N/A              0                 0                     19m

Periksa PDB. Temukan kecocokan antara label Pod dalam PDB dan Pod yang cocok di node. Kecocokan ini memastikan Anda menonaktifkan PDB yang benar untuk menghapus node dengan sukses:
```
kubectl --kubeconfig ${KUBECONFIG} get pdb log-aggregator -n kube-system -o 'jsonpath={.spec}'
```
Sistem menampilkan hasil label yang cocok dalam kebijakan PDB:
```
{"maxUnavailable":0,"selector":{"matchLabels":{"app":"stackdriver-log-aggregator"}}}
```

Temukan Pod yang cocok dengan label kebijakan PDB:

kubectl --kubeconfig ${KUBECONFIG} get pods -A --selector=app=stackdriver-log-aggregator  \
  -o=jsonpath='{range .items[*]}{.metadata.name}{"\t"}{.spec.nodeName}{"\n"}{end}'

Perintah ini menampilkan daftar Pod yang cocok dengan label PDB, dan memverifikasi kebijakan PDB yang perlu Anda hapus:

stackdriver-log-aggregator-0    CP3
stackdriver-log-aggregator-1    CP3

Setelah Anda mengonfirmasi Pod yang terpengaruh, buat salinan cadangan kebijakan PDB. Contoh berikut mencadangkan kebijakan log-aggregator:
```
kubectl get pdb log-aggregator --kubeconfig ${KUBECONFIG} -n kube-system  \
  -o yaml >> log-aggregator.yaml
```
Hapus kebijakan PDB tertentu. Sekali lagi, contoh berikut akan menghapus kebijakan log-aggregator:
```
kubectl delete pdb log-aggregator --kubeconfig ${KUBECONFIG} -n kube-system
```
Setelah Anda menghapus kebijakan PDB, node akan terus dikosongkan. Namun, perlu waktu hingga 30 menit agar node dihapus sepenuhnya. Terus periksa status node untuk mengonfirmasi bahwa proses telah berhasil diselesaikan.

Jika Anda ingin menghapus node secara permanen, dan juga menghapus resource penyimpanan yang terkait dengan node, Anda dapat melakukannya sebelum memulihkan kebijakan PDB. Untuk mengetahui informasi selengkapnya, lihat Menghapus resource penyimpanan.

Pulihkan kebijakan PDB dari salinan Anda:

kubectl apply -f log-aggregator.yaml --kubeconfig ${KUBECONFIG}

Pastikan Pod yang dihapus berhasil dibuat ulang. Dalam contoh ini, jika ada dua Pod stackdriver-log-aggregator-x, Pod tersebut akan dibuat ulang:
```
kubectl get pods -o wide --kubeconfig ${KUBECONFIG} -A
```
Jika Anda ingin memulihkan node, edit konfigurasi nodepool yang sesuai, dan pulihkan alamat IP node.

Menghapus resource penyimpanan dari node yang dihapus secara permanen

Jika Anda menghapus node secara permanen, dan tidak ingin memulihkannya ke sistem, Anda juga dapat menghapus resource penyimpanan yang terkait dengan node tersebut.

Periksa dan dapatkan nama volume persisten (PV) yang terkait dengan node:

kubectl get pv --kubeconfig ${KUBECONFIG}  \
  -A -o=jsonpath='{range .items[*]}{"\n"}{.metadata.name}{":\t"}{.spec.claimRef.name}{":\t"}  \
  {.spec.nodeAffinity.required.nodeSelectorTerms[0].matchExpressions[0].values}{"\n"}{end}'

Hapus PV yang terkait dengan node:
```
kubectl delete pv PV_NAME --kubeconfig ${KUBECONFIG}
```
Ganti PV_NAME dengan nama volume persisten yang akan dihapus.

Langkah selanjutnya

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.