Jika waktu tunggu tugas di Google Distributed Cloud habis dan Anda yakin perilaku tersebut bukan karena masalah yang mendasari penginstalan, Anda dapat menambah waktu tunggu dengan interval waktu tertentu. Dokumen ini menjelaskan cara menyesuaikan interval waktu tunggu untuk tugas mesin, dan tugas batch dengan menggunakan anotasi di spesifikasi konfigurasi.
Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.Jenis dan error tugas
Ada dua jenis perintah dan rutinitas Google Distributed Cloud: machine tugas, dan tugas batch. Banyak hal yang dapat mempengaruhi berapa lama waktu yang dibutuhkan selesai, seperti konfigurasi perangkat keras, konfigurasi jaringan, dan konfigurasi Anda. Google Distributed Cloud memiliki waktu tunggu default yang dimaksudkan untuk mengakomodasi instalasi yang umum.
Berikut adalah contoh pesan error waktu tunggu tugas:
Pesan error waktu tunggu tugas mesin (digabungkan agar lebih jelas) dari preflight log suka
bmctl-workspace/cluster1/logs/preflight-20210501-000426/172.18.0.4
:Pod:172.18.0.4-machine-preflf3a32c8a2f7a2449545c7e8ff954c961-652st Result:Failed Reason:DeadlineExceeded Time:Wed Feb 3 16:59:56 2021
Output dari
kubectl logs
untuk Pod yang gagal mungkin menampilkan errorDeadlineExceeded
pesan (digabungkan):cluster-cluster1 172.18.0.4-machine-preflf3a32c8a2f7a2449545c7e8ff954c961-652st ● 0/1 0 DeadlineExceeded 192.168.122.180 bmctl-control-plane 7m12
Menyesuaikan interval waktu tunggu tugas mesin
Tugas mesin adalah rutinitas yang hanya berjalan di satu komputer, seperti pemeriksaan preflight
yang terbatas pada satu komputer. Tugas mesin Google Distributed Cloud
waktu tunggu default 900 detik, atau 15 menit. Anda dapat menyesuaikan tugas mesin
interval waktu tunggu dengan baremetal.cluster.gke.io/machine-job-deadline-seconds
di file konfigurasi cluster.
Contoh berikut menetapkan interval waktu tunggu tugas mesin ke 1.800 detik, atau 30 menit:
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
name: cluster1
namespace: cluster-cluster1
annotations:
baremetal.cluster.gke.io/machine-job-deadline-seconds: "1800"
spec:
...
Nilai interval waktu tunggu diterapkan saat Anda membuat cluster baru dengan
bmctl create cluster
atau saat Anda mengupgrade cluster yang ada dengan bmctl upgrade
cluster
. Interval baru digunakan untuk semua tugas mesin tunggal, termasuk
bmctl check preflight
, bmctl check -c CLUSTER_NAME
, dan
banyak lagi.
Menyesuaikan interval waktu tunggu tugas batch
Tugas batch adalah rutinitas yang berjalan di beberapa mesin, seperti jaringan pemeriksaan preflight. Interval waktu tunggu default untuk batch Google Distributed Cloud pekerjaan tergantung pada jumlah komputer dalam jaringan. Default interval waktu tunggu adalah 900 detik, ditambah 20 detik tambahan untuk setiap mesin.
Misalnya, jika tugas batch Anda berjalan di 60 mesin, interval waktu tunggu default adalah 2.100 detik (900 + (20 * 60) = 2100), atau 35 menit.
Anda bisa menyesuaikan interval waktu tunggu tugas batch dengan
Anotasi baremetal.cluster.gke.io/batch-job-deadline-seconds
di cluster
file konfigurasi.
Contoh berikut menetapkan interval waktu tunggu tugas batch ke 10.800 detik, atau 3 jam:
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
name: cluster1
namespace: cluster-cluster1
annotations:
baremetal.cluster.gke.io/batch-job-deadline-seconds: "10800"
spec:
...
Nilai interval waktu tunggu diterapkan saat Anda membuat cluster baru dengan
bmctl create cluster
atau saat Anda mengupgrade cluster yang ada dengan bmctl upgrade
cluster
.