작업 제한 시간 값 조정

작업의 제한 시간이 초과되었지만 설치의 근본적인 문제로 인한 것이 아니라고 판단되면 제한 시간 간격을 늘릴 수 있습니다. 이 문서에서는 구성 사양에 주석이 있는 머신 작업 및 일괄 작업의 제한 시간 간격을 조정하는 방법을 설명합니다.

베어메탈용 GDCV 명령어 및 루틴은 머신 작업과 일괄 작업의 두 가지 범주로 나뉩니다. 하드웨어 구성, 네트워크 구성, 클러스터 구성 등 작업이 완료되는 데 걸리는 시간에 영향을 줄 수 있는 요인은 많습니다. 베어메탈용 GKE에는 일반적인 설치를 수용하기 위한 기본 제한 시간이 있습니다.

작업 제한 시간 오류 메시지를 찾을 수 있는 위치의 예시는 다음과 같습니다.

  • 실행 전 로그의 머신 작업 제한 시간 오류 메시지(명확성을 높이기 위해 래핑됨)(예: bmctl-workspace/cluster1/logs/preflight-20210501-000426/172.18.0.4)

    Pod:172.18.0.4-machine-preflf3a32c8a2f7a2449545c7e8ff954c961-652st
    Result:Failed Reason:DeadlineExceeded Time:Wed Feb  3 16:59:56 2021
    
  • 실패한 pod에 대한 kubectl logs의 출력은 유사한 DeadlineExceeded 메시지(래핑됨)가 표시될 수 있습니다.

    cluster-cluster1
    172.18.0.4-machine-preflf3a32c8a2f7a2449545c7e8ff954c961-652st  ●  0/1
    0 DeadlineExceeded  192.168.122.180  bmctl-control-plane  7m12
    

머신 작업 제한 시간 간격 조정

머신 작업은 단일 머신으로 국한되는 실행 전 검사와 같이 한 머신에서만 실행되는 루틴입니다. 베어메탈용 GKE 머신 작업의 기본 제한 시간은 900초 또는 15분입니다. 머신 작업 제한 시간 간격은 클러스터 구성 파일의 baremetal.cluster.gke.io/machine-job-deadline-seconds 주석으로 조정됩니다.

다음 예시에서는 머신 작업 제한 시간 간격을 1800초 또는 30분으로 설정합니다.

   apiVersion: baremetal.cluster.gke.io/v1
   kind: Cluster
   metadata:
     name: cluster1
     namespace: cluster-cluster1
     annotations:
       baremetal.cluster.gke.io/machine-job-deadline-seconds: "1800"
   spec:
   ...

bmctl create cluster를 사용하여 새 클러스터를 만들거나 bmctl upgrade cluster로 기존 클러스터를 업그레이드할 때 제한 시간 간격 값이 적용됩니다. bmctl check preflight, bmctl check -c <cluster-name> 등을 포함한 모든 단일 머신 작업에 새 간격이 사용됩니다.

일괄 작업 제한 시간 간격 조정

일괄 작업은 네트워크 실행 전 검사와 같이 여러 머신에서 실행되는 루틴입니다. 베어메탈용 GKE 일괄 작업의 기본 제한 시간 간격은 네트워크의 머신 수에 따라 다릅니다. 기본 제한 시간 간격은 900초에 각 머신에 대해 추가 20초를 더한 것입니다. 따라서 일괄 작업이 60대 머신에서 실행되는 경우 기본 제한 시간 간격은 2100초(900 + 20 * 60 = 2,100) 또는 35분입니다. 일괄 작업 제한 시간 간격은 클러스터 구성 파일의 baremetal.cluster.gke.io/batch-job-deadline-seconds 주석으로 조정됩니다.

다음 예시에서는 일괄 작업 제한 시간 간격을 10800초 또는 3시간으로 설정합니다.

   apiVersion: baremetal.cluster.gke.io/v1
   kind: Cluster
   metadata:
     name: cluster1
     namespace: cluster-cluster1
     annotations:
       baremetal.cluster.gke.io/batch-job-deadline-seconds: "10800"
   spec:
   ...

bmctl create cluster를 사용하여 새 클러스터를 만들거나 bmctl upgrade cluster로 기존 클러스터를 업그레이드할 때 제한 시간 간격 값이 적용됩니다.