요청 제한 시간 설정

Knative serving 서비스에서 요청에 대한 응답을 반환해야 하는 시간을 설정하는 방법을 알아봅니다. 지정된 시간 내에 응답이 반환되지 않으면 요청이 종료되고 오류 504가 반환됩니다.

제한 시간 한도

최대 제한 시간 한도는 GKE 클러스터 버전에 따라 다릅니다.

GKE 버전 기본 한도 최대 제한 시간 한도
0.16.0-gke.1 이상 300초 24시간
0.15.0-gke.3 이하 300초 900초

Knative serving 요청 시간 제한을 변경하는 것 외에도 언어 프레임워크를 확인하여 업데이트가 필요한 자체 요청 시간 제한 설정이 있는지 확인해야 합니다.

요청 제한 시간 설정 및 업데이트

구성을 변경하면 새 버전이 생성됩니다. 이를 변경하는 명시적 업데이트가 없으면 이후 버전에도 이 구성 설정이 자동으로 적용됩니다.

서비스를 배포하거나 기존 서비스를 업데이트하고 버전을 배포하는 경우 Google Cloud 콘솔, Google Cloud CLI 또는 YAML 파일을 사용하여 요청 제한 시간을 설정할 수 있습니다.

Console

  1. Google Cloud 콘솔에서 Knative serving으로 이동합니다.

    Knative serving으로 이동

  2. 배포할 새 서비스를 구성하려면 서비스 만들기를 클릭합니다. 기존 서비스를 구성하려면 해당 서비스를 클릭한 다음 새 버전 수정 및 배포를 클릭합니다.

  3. 고급 설정에서 컨테이너를 클릭합니다.

  4. 요청 제한 시간 필드에 사용할 제한 시간 값을 입력합니다. 지정한 값은 클러스터의 GKE 버전에 대한 제한 시간 한도보다 짧아야 합니다.

  5. 다음을 클릭하여 다음 섹션으로 진행합니다.

  6. 이 서비스가 트리거되는 방식 구성 섹션에서 서비스를 호출하는 데 사용할 연결을 선택합니다.

  7. 만들기를 클릭하여 Knative serving에 이미지를 배포하고 배포가 완료될 때까지 기다립니다.

명령줄

  • 기존 서비스의 경우 --timeout 매개변수로 gcloud run services update 명령어를 실행하여 요청 제한 시간을 설정합니다.

    gcloud run services update SERVICE --timeout TIMEOUT

    다음과 같이 바꿉니다.

    • SERVICE를 서비스 이름으로 바꿉니다.
    • TIMEOUT을 정수 값(초) 또는 절대 지속 시간 값을 사용하여 원하는 시간으로 바꿉니다. 예를 들어 1m20s는 1분 20초입니다. 지정한 값은 클러스터의 GKE 버전에 대한 제한 시간 한도보다 짧아야 합니다. 0을 지정하여 제한 시간을 기본값으로 설정합니다.
  • 새 서비스의 경우 --timeout 매개변수로 gcloud run deploy 명령어를 실행하여 요청 제한 시간을 설정합니다.

    gcloud run deploy SERVICE --image=IMAGE_URL --timeout TIMEOUT

    다음과 같이 바꿉니다.

    • SERVICE를 서비스 이름으로 바꿉니다.
    • IMAGE_URL을 컨테이너 이미지에 대한 참조(예: gcr.io/cloudrun/hello)로 바꿉니다.
    • TIMEOUT을 정수 값(초) 또는 절대 지속 시간 값을 사용하여 원하는 시간으로 바꿉니다. 예를 들어 1m20s는 1분 20초입니다. 지정한 값은 클러스터의 GKE 버전에 대한 제한 시간 한도보다 짧아야 합니다. 0을 지정하여 제한 시간을 기본값으로 설정합니다.

YAML

--format=export 플래그를 사용하여 gcloud run services describe 명령어로 YAML 파일에 기존 서비스 구성을 다운로드할 수 있습니다. 그런 다음 gcloud run services replace 명령어로 YAML 파일을 수정하고 변경사항을 배포할 수 있습니다. 지정된 속성만 수정해야 합니다.

  1. 서비스 구성을 로컬 작업공간의 service.yaml 파일에 다운로드합니다.

    gcloud run services describe SERVICE --format export > service.yaml

    SERVICE를 Knative serving 서비스의 이름으로 바꿉니다.

  2. 로컬 파일에서 timeoutSeconds 속성을 업데이트합니다.

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containers:
          - image: IMAGE
          timeoutSeconds: TIMEOUT

    다음과 같이 바꿉니다.

    • SERVICE를 Knative serving 서비스의 이름으로 바꿉니다.
    • IMAGE_URL을 컨테이너 이미지에 대한 참조(예: gcr.io/cloudrun/hello)로 바꿉니다.
    • TIMEOUT를 원하는 제한 시간(초 단위)으로 바꿉니다.
  3. 다음 명령어를 사용하여 서비스를 새 구성으로 바꿉니다.

    gcloud run services replace service.yaml