Jika tugas di Google Distributed Cloud mengalami waktu tunggu habis dan Anda yakin bahwa perilaku tersebut bukan disebabkan oleh masalah mendasar pada penginstalan Anda, Anda dapat meningkatkan interval waktu tunggu. Dokumen ini menjelaskan cara menyesuaikan interval waktu tunggu untuk tugas mesin dan tugas batch menggunakan anotasi dalam spesifikasi konfigurasi.
Jenis dan error tugas
Ada dua jenis perintah dan rutin Google Distributed Cloud: tugas mesin dan tugas batch. Banyak hal yang dapat memengaruhi durasi penyelesaian tugas, seperti konfigurasi hardware, konfigurasi jaringan, dan konfigurasi cluster. Google Distributed Cloud memiliki waktu tunggu default yang dimaksudkan untuk mengakomodasi penginstalan umum.
Berikut adalah contoh pesan error waktu tunggu tugas:
Pesan error waktu tunggu tugas mesin (di-wrap agar lebih jelas) dari log pra-penerbangan seperti
bmctl-workspace/cluster1/logs/preflight-20210501-000426/172.18.0.4
:Pod:172.18.0.4-machine-preflf3a32c8a2f7a2449545c7e8ff954c961-652st Result:Failed Reason:DeadlineExceeded Time:Wed Feb 3 16:59:56 2021
Output dari
kubectl logs
untuk Pod yang gagal mungkin menampilkan pesanDeadlineExceeded
(gabungan) yang serupa:cluster-cluster1 172.18.0.4-machine-preflf3a32c8a2f7a2449545c7e8ff954c961-652st ● 0/1 0 DeadlineExceeded 192.168.122.180 bmctl-control-plane 7m12
Menyesuaikan interval waktu tunggu tugas mesin
Tugas mesin adalah rutin yang hanya berjalan di satu mesin, seperti pemeriksaan sebelum penerbangan yang terbatas pada satu mesin. Tugas mesin Google Distributed Cloud memiliki
waktu tunggu default 900 detik, atau 15 menit. Anda dapat menyesuaikan interval waktu tunggu tugas mesin dengan anotasi baremetal.cluster.gke.io/machine-job-deadline-seconds
dalam file konfigurasi cluster.
Contoh berikut menetapkan interval waktu tunggu tugas mesin menjadi 1.800 detik, atau 30 menit:
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
name: cluster1
namespace: cluster-cluster1
annotations:
baremetal.cluster.gke.io/machine-job-deadline-seconds: "1800"
spec:
...
Nilai interval waktu tunggu Anda diterapkan saat Anda membuat cluster baru dengan
bmctl create cluster
atau saat Anda mengupgrade cluster yang ada dengan bmctl upgrade
cluster
. Interval baru digunakan untuk semua tugas mesin tunggal, termasuk
bmctl check preflight
, bmctl check -c CLUSTER_NAME
, dan
lainnya.
Menyesuaikan interval waktu tunggu tugas batch
Tugas batch adalah rutin yang berjalan di beberapa mesin, seperti pemeriksaan awal jaringan. Interval waktu tunggu default untuk tugas batch Google Distributed Cloud bergantung pada jumlah mesin dalam jaringan. Interval waktu tunggu default adalah 900 detik, ditambah 20 detik tambahan untuk setiap mesin.
Misalnya, jika tugas batch Anda berjalan di 60 mesin, interval waktu tunggu default adalah 2.100 detik (900 + (20 * 60) = 2100), atau 35 menit.
Anda dapat menyesuaikan interval waktu tunggu tugas batch dengan anotasi
baremetal.cluster.gke.io/batch-job-deadline-seconds
dalam file konfigurasi
cluster.
Contoh berikut menetapkan interval waktu tunggu tugas batch menjadi 10.800 detik, atau 3 jam:
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
name: cluster1
namespace: cluster-cluster1
annotations:
baremetal.cluster.gke.io/batch-job-deadline-seconds: "10800"
spec:
...
Nilai interval waktu tunggu Anda diterapkan saat Anda membuat cluster baru dengan
bmctl create cluster
atau saat Anda mengupgrade cluster yang ada dengan bmctl upgrade
cluster
.
Langkah berikutnya
Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care. Anda juga dapat melihat bagian Mendapatkan dukungan untuk mengetahui informasi selengkapnya tentang sumber dukungan, termasuk yang berikut:
- Persyaratan untuk membuka kasus dukungan.
- Alat untuk membantu Anda memecahkan masalah, seperti konfigurasi lingkungan, log, dan metrik.
- Komponen yang didukung.