Menyesuaikan nilai waktu tunggu tugas

Jika tugas di Google Distributed Cloud habis waktu tunggunya dan Anda yakin perilaku tersebut bukan karena masalah mendasar pada penginstalan, Anda dapat meningkatkan interval waktu tunggu. Dokumen ini menjelaskan cara menyesuaikan interval waktu tunggu untuk tugas mesin dan tugas batch menggunakan anotasi dalam spesifikasi konfigurasi.

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.

Jenis dan error tugas

Ada dua jenis perintah dan rutinitas Google Distributed Cloud: tugas mesin dan tugas batch. Banyak hal yang dapat memengaruhi waktu yang diperlukan untuk menyelesaikan tugas, seperti konfigurasi hardware, konfigurasi jaringan, dan konfigurasi cluster. Google Distributed Cloud memiliki waktu tunggu default yang dimaksudkan untuk menampung penginstalan standar.

Berikut adalah contoh pesan error waktu tunggu tugas habis:

  • Pesan error waktu tunggu tugas mesin (digabungkan untuk kejelasan) dari log preflight seperti bmctl-workspace/cluster1/logs/preflight-20210501-000426/172.18.0.4:

    Pod:172.18.0.4-machine-preflf3a32c8a2f7a2449545c7e8ff954c961-652st
    Result:Failed Reason:DeadlineExceeded Time:Wed Feb  3 16:59:56 2021
    
  • Output dari kubectl logs untuk Pod yang gagal mungkin menampilkan pesan DeadlineExceeded yang serupa (digabungkan):

    cluster-cluster1
    172.18.0.4-machine-preflf3a32c8a2f7a2449545c7e8ff954c961-652st    0/1
    0 DeadlineExceeded  192.168.122.180  bmctl-control-plane  7m12
    

Menyesuaikan interval waktu tunggu tugas mesin

Tugas mesin adalah rutinitas yang hanya berjalan di satu mesin, seperti pemeriksaan pra-penerbangan yang terbatas pada satu mesin. Tugas mesin Google Distributed Cloud memiliki waktu tunggu default 900 detik, atau 15 menit. Anda dapat menyesuaikan interval waktu tunggu tugas mesin dengan anotasi baremetal.cluster.gke.io/machine-job-deadline-seconds dalam file konfigurasi cluster.

Contoh berikut menetapkan interval waktu tunggu tugas mesin ke 1.800 detik, atau 30 menit:

   apiVersion: baremetal.cluster.gke.io/v1
   kind: Cluster
   metadata:
     name: cluster1
     namespace: cluster-cluster1
     annotations:
       baremetal.cluster.gke.io/machine-job-deadline-seconds: "1800"
   spec:
   ...

Nilai interval waktu tunggu diterapkan saat Anda membuat cluster baru dengan bmctl create cluster atau saat Anda mengupgrade cluster yang ada dengan bmctl upgrade cluster. Interval baru digunakan untuk semua tugas satu mesin, termasuk bmctl check preflight, bmctl check -c CLUSTER_NAME, dan lainnya.

Menyesuaikan interval waktu tunggu tugas batch

Tugas batch adalah rutinitas yang berjalan di beberapa mesin, seperti pemeriksaan preflight jaringan. Interval waktu tunggu default untuk tugas batch Google Distributed Cloud bergantung pada jumlah mesin di jaringan. Interval waktu tunggu default adalah 900 detik, ditambah 20 detik tambahan untuk setiap mesin.

Misalnya, jika tugas batch Anda berjalan di 60 mesin, interval waktu tunggu defaultnya adalah 2.100 detik (900 + (20 * 60) = 2100), atau 35 menit.

Anda dapat menyesuaikan interval waktu tunggu tugas batch dengan anotasi baremetal.cluster.gke.io/batch-job-deadline-seconds dalam file konfigurasi cluster.

Contoh berikut menetapkan interval waktu tunggu tugas batch menjadi 10.800 detik, atau 3 jam:

   apiVersion: baremetal.cluster.gke.io/v1
   kind: Cluster
   metadata:
     name: cluster1
     namespace: cluster-cluster1
     annotations:
       baremetal.cluster.gke.io/batch-job-deadline-seconds: "10800"
   spec:
   ...

Nilai interval waktu tunggu diterapkan saat Anda membuat cluster baru dengan bmctl create cluster atau saat Anda mengupgrade cluster yang ada dengan bmctl upgrade cluster.

Langkah selanjutnya

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.