인스턴스(서비스)당 최대 동시 요청 수 설정

컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

인스턴스당 최대 동시 요청 수 설정에 대해 알아보려면 개념 문서를 참조하세요.

구성을 변경하면 새 버전이 생성됩니다. 이를 변경하는 명시적 업데이트가 없으면 이후 버전에도 이 구성 설정이 자동으로 적용됩니다.

Cloud Run 서비스의 경우 새 서비스를 만들거나 새 버전을 배포할 때 Google Cloud 콘솔, gcloud 명령줄 또는 .yaml 파일을 사용하여 인스턴스당 최대 동시 요청 수를 설정할 수 있습니다.

콘솔

  1. Cloud Run으로 이동

  2. 배포할 새 서비스를 구성하려면 서비스 만들기를 클릭합니다. 기존 서비스를 구성하는 경우 서비스를 클릭한 다음 새 버전 수정 및 배포를 클릭합니다.

  3. 새 서비스를 구성하는 경우 원하는 대로 초기 서비스 설정 페이지를 작성한 다음 컨테이너, 연결, 보안을 클릭하여 서비스 구성 페이지를 펼칩니다.

  4. 컨테이너 탭을 클릭합니다.

    이미지

  5. 컨테이너당 최대 요청 수 텍스트 상자에 인스턴스당 원하는 최대 동시 요청 수를 설정합니다.

  6. 만들기 또는 배포를 클릭합니다.

명령줄

인스턴스당 최대 동시 요청 수를 설정하려면 다음 명령어를 사용하세요.

gcloud run services update SERVICE --concurrency CONCURRENCY

바꾸기

  • SERVICE를 서비스 이름으로 바꿉니다.
  • CONCURRENCY를 컨테이너 인스턴스당 최대 동시 요청 수로 바꿉니다. 예를 들어 다음은 최대 1개의 동시 요청 수를 설정합니다.

    gcloud run services update SERVICE --concurrency 1

지정된 서비스의 인스턴스당 최대 동시 요청 수를 변경하면 새 버전에 이 설정이 적용됩니다.

기본 최대 동시 요청 수(80)로 되돌리려면 다음 명령어를 사용합니다.

gcloud run services update SERVICE --concurrency default

SERVICE을 구성 중인 서비스의 이름으로 바꿉니다.

YAML

YAML 형식으로 정리된 결과를 반환하는 gcloud run services describe --format export 명령어를 사용하면 기존 서비스 구성을 다운로드하고 볼 수 있습니다. 그런 다음 아래 설명된 필드를 수정하고 gcloud run services replace 명령어를 사용하여 수정된 YAML을 업로드할 수 있습니다. 설명된 대로 필드만 수정해야 합니다.

  1. 구성을 보고 다운로드하려면 다음을 실행합니다.

    gcloud run services describe SERVICE --format export > service.yaml
  2. containerConcurrency 속성을 업데이트합니다.

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          name: REVISION
        spec:
          containerConcurrency: CONCURRENCY

    바꾸기

    • SERVICE를 Cloud Run 서비스 이름으로 바꿉니다.
    • IMAGE_URL을 컨테이너 이미지에 대한 참조(예: us-docker.pkg.dev/cloudrun/container/hello:latest)로 바꿉니다.
    • CONCURRENCY를 컨테이너 인스턴스당 최대 동시 요청 수로 바꿉니다.
    • REVISION를 새 버전 이름으로 변경하거나 이미 있는 경우 삭제합니다. 새 버전 이름을 제공할 경우 다음 기준을 반드시 충족해야 합니다.
      • SERVICE-로 시작해야 합니다.
      • 소문자, 숫자, -만 포함합니다.
      • -로 끝나면 안 됩니다.
      • 63자(영문 기준) 이하여야 합니다.
  3. 다음 명령어를 사용하여 서비스를 새 구성으로 바꿉니다.

    gcloud run services replace service.yaml

Terraform

template.spec.containers 아래의 Terraform 구성에서 google_cloud_run_service 리소스에 다음 항목을 추가합니다. 80을 원하는 최대 동시 요청 수로 바꿉니다.

# Maximum concurrent requests
# https://cloud.google.com/run/docs/configuring/concurrency
container_concurrency = 80

Google Cloud 프로젝트에 Terraform 구성을 적용하려면 다음 단계를 완료하세요.

  1. Cloud Shell을 실행합니다.
  2. Terraform 구성을 적용할 Google Cloud 프로젝트를 설정합니다.
    export GOOGLE_CLOUD_PROJECT=PROJECT_ID
    
  3. 디렉터리를 만들고 해당 디렉터리에 새 파일을 엽니다. 파일 이름에는 .tf 확장자가 있어야 합니다(예: main.tf).
    mkdir DIRECTORY && cd DIRECTORY && nano main.tf
    
  4. 샘플을 main.tf에 복사합니다.
  5. 환경에 적용할 샘플 매개변수를 검토하고 수정합니다.
  6. Ctrl-x를 누른 후 y를 눌러 변경사항을 저장합니다.
  7. Terraform을 초기화합니다.
    terraform init
  8. 구성을 검토하고 Terraform에서 만들거나 업데이트할 리소스가 예상과 일치하는지 확인합니다.
    terraform plan

    필요에 따라 구성을 수정합니다.

  9. 다음 명령어를 실행하고 프롬프트에 yes를 입력하여 Terraform 구성을 적용합니다.
    terraform apply

    Terraform에 '적용 완료' 메시지가 표시될 때까지 기다립니다.

  10. 결과를 보려면 Google Cloud 프로젝트를 엽니다. Google Cloud 콘솔에서 UI의 리소스로 이동하여 Terraform이 리소스를 만들었거나 업데이트했는지 확인합니다.

동시 실행 설정 보기

Cloud Run 서비스의 현재 동시 실행 설정을 보려면 다음 안내를 따르세요.

콘솔

  1. Cloud Run으로 이동

  2. 관심이 있는 서비스를 클릭하여 서비스 세부정보 페이지를 엽니다.

  3. 버전 탭을 클릭합니다.

  4. 오른쪽의 세부정보 패널에서 동시 실행 설정이 컨테이너 탭에 표시됩니다.

명령줄

  1. 다음 명령어를 사용하세요.

    gcloud run services describe SERVICE
  2. 반환된 구성에서 동시 실행 설정을 찾습니다.