Jika waktu tunggu tugas habis dan Anda yakin bahwa waktu tunggu bukan disebabkan oleh masalah yang mendasari penginstalan, Anda dapat meningkatkan interval waktu tunggu. Dokumen ini menjelaskan cara menyesuaikan interval waktu tunggu untuk tugas mesin dan tugas batch dengan anotasi sesuai spesifikasi konfigurasi.
Perintah dan rutinitas Bare Metal dibagi menjadi dua kategori, yaitu tugas mesin dan tugas batch. Banyak hal yang dapat memengaruhi waktu yang diperlukan untuk menyelesaikan tugas, seperti konfigurasi hardware, konfigurasi jaringan, dan konfigurasi cluster. GKE pada Bare Metal memiliki waktu tunggu default yang dimaksudkan untuk mengakomodasi penginstalan standar.
Berikut adalah beberapa contoh tempat Anda dapat menemukan pesan error waktu tunggu tugas:
Pesan error waktu tunggu tugas mesin (digabungkan agar lebih jelas) dari log preflight, misalnya,
bmctl-workspace/cluster1/logs/preflight-20210501-000426/172.18.0.4
Pod:172.18.0.4-machine-preflf3a32c8a2f7a2449545c7e8ff954c961-652st Result:Failed Reason:DeadlineExceeded Time:Wed Feb 3 16:59:56 2021
Output dari
kubectl logs
untuk pod yang gagal dapat menampilkan pesanDeadlineExceeded
yang serupa (digabungkan):cluster-cluster1 172.18.0.4-machine-preflf3a32c8a2f7a2449545c7e8ff954c961-652st ● 0/1 0 DeadlineExceeded 192.168.122.180 bmctl-control-plane 7m12
Menyesuaikan interval waktu tunggu tugas mesin
Tugas mesin adalah rutinitas yang hanya berjalan di satu mesin, seperti pemeriksaan preflight
yang dibatasi untuk satu komputer. GKE pada tugas mesin Bare Metal memiliki
waktu tunggu default 900 detik atau 15 menit. Interval waktu tunggu tugas mesin
disesuaikan dengan anotasi baremetal.cluster.gke.io/machine-job-deadline-seconds
di file konfigurasi cluster.
Contoh berikut menetapkan interval waktu tunggu tugas mesin ke 1800 detik atau 30 menit:
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
name: cluster1
namespace: cluster-cluster1
annotations:
baremetal.cluster.gke.io/machine-job-deadline-seconds: "1800"
spec:
...
Nilai interval waktu tunggu akan diterapkan ketika membuat cluster baru dengan bmctl create cluster
atau saat mengupgrade cluster yang ada dengan bmctl upgrade
cluster
. Interval baru akan digunakan untuk semua tugas mesin tunggal, termasuk bmctl check preflight
, bmctl check -c <cluster-name>
, dan lainnya.
Menyesuaikan interval waktu tunggu tugas batch
Tugas batch adalah rutinitas yang berjalan di beberapa mesin, seperti pemeriksaan preflight
jaringan. Interval waktu tunggu default untuk GKE pada tugas batch Bare Metal bergantung pada jumlah mesin di jaringan. Interval waktu tunggu default adalah 900 detik ditambah 20 detik tambahan untuk setiap mesin.
Jadi, jika tugas batch Anda berjalan pada 60 mesin, interval waktu tunggu default adalah
2.100 detik (900 + 20 * 60 = 2.100) atau 35 menit. Interval waktu tunggu tugas batch disesuaikan dengan anotasi baremetal.cluster.gke.io/batch-job-deadline-seconds
di file konfigurasi cluster.
Contoh berikut menetapkan interval waktu tunggu tugas batch ke 10.800 detik atau 3 jam:
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
name: cluster1
namespace: cluster-cluster1
annotations:
baremetal.cluster.gke.io/batch-job-deadline-seconds: "10800"
spec:
...
Nilai interval waktu tunggu akan diterapkan ketika membuat cluster baru dengan bmctl create cluster
atau saat mengupgrade cluster yang ada dengan bmctl upgrade
cluster
.