최대 인스턴스 수 설정(서비스)

이 페이지에서는 Cloud Run 서비스에 사용할 수 있는 최대 인스턴스 수를 설정하는 방법을 설명합니다. Cloud Run에서 최대 인스턴스를 지정하면 수신 요청에 대한 응답으로 서비스의 확장을 제한할 수 있습니다. 하지만 이 최대 설정은 트래픽 급증과 같은 상황으로 인해 일시적으로 초과할 수 있습니다. 이 설정을 사용하여 비용을 제어하거나 데이터베이스와 같은 백업 서비스에 대한 연결 수를 제한할 수 있습니다.

서비스에 적용될 수 있는 최대 인스턴스 한도에 대한 자세한 내용은 최대 인스턴스 한도를 참조하세요.

Cloud Run이 컨테이너 인스턴스를 자동 확장하는 방법에 대한 자세한 내용은 인스턴스 자동 확장을 참조하세요.

필요한 역할

Cloud Run 서비스를 구성하고 배포하는 데 필요한 권한을 얻으려면 관리자에게 다음 IAM 역할을 부여해 달라고 요청하세요.

Cloud Run과 연결된 IAM 역할 및 권한 목록은 Cloud Run IAM 역할Cloud Run IAM 권한을 참조하세요. Cloud Run 서비스가 Cloud 클라이언트 라이브러리와 같은 Google Cloud API와 상호작용하는 경우에는 서비스 ID 구성 가이드를 참조하세요. 역할 부여에 대한 자세한 내용은 배포 권한액세스 관리를 참조하세요.

최대 인스턴스 설정 및 업데이트

구성을 변경하면 새 버전이 생성됩니다. 이를 변경하는 명시적 업데이트가 없으면 이후 버전에도 이 구성 설정이 자동으로 적용됩니다.

기본적으로 Cloud Run 서비스는 최대 100개의 인스턴스로 수평 확장되도록 구성됩니다.

새 서비스를 만들거나 새 버전을 배포할 때 Google Cloud 콘솔, gcloud 명령줄 또는 YAML 파일을 사용하여 최대 인스턴스 설정을 변경할 수 있습니다.

콘솔

  1. Google Cloud 콘솔에서 Cloud Run으로 이동합니다.

    Cloud Run으로 이동

  2. 컨테이너 배포를 클릭하고 서비스를 선택하여 새 서비스를 구성합니다. 기존 서비스를 구성하는 경우 서비스를 클릭한 후 새 버전 수정 및 배포를 클릭합니다.

  3. 새 서비스를 구성하는 경우 초기 서비스 설정 페이지를 작성한 후 컨테이너, 볼륨, 네트워킹, 보안을 클릭하여 서비스 구성 페이지를 펼칩니다.

  4. 컨테이너 탭을 클릭합니다.

    이미지

    • 최소 인스턴스 수로 라벨이 지정된 필드에서 1에서 최대 한도까지의 정수 값을 사용하여 원하는 최대 인스턴스 수를 지정합니다.
  5. 만들기 또는 배포를 클릭합니다.

gcloud

다음 명령어를 사용하여 지정된 서비스의 최대 인스턴스 수를 업데이트할 수 있습니다.

gcloud run services update SERVICE --max-instances MAX-VALUE

다음과 같이 바꿉니다.

  • SERVICE를 서비스 이름으로 바꿉니다.
  • MAX-VALUE1에서 최대 한도까지의 정수 값을 사용하여 원하는 최대 컨테이너 인스턴스 수로 바꿉니다. 최대 인스턴스 설정을 삭제하고 기본 인스턴스 100개를 복원하려면 default를 지정합니다.

배포 중에 다음 명령어를 사용하여 최대 인스턴스 수를 설정할 수도 있습니다.

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

다음과 같이 바꿉니다.

  • IMAGE_URL: 컨테이너 이미지에 대한 참조(예: us-docker.pkg.dev/cloudrun/container/hello:latest). Artifact Registry를 사용하는 경우 저장소 REPO_NAME이 이미 생성되어 있어야 합니다. URL의 형식은 LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG입니다.
  • MAX-VALUE를 원하는 최대 컨테이너 인스턴스 수로 바꿉니다.

YAML

  1. 새 서비스를 만드는 경우에는 이 단계를 건너뜁니다. 기존 서비스를 업데이트하는 경우 YAML 구성을 다운로드합니다.

    gcloud run services describe SERVICE --format export > service.yaml
  2. autoscaling.knative.dev/maxScale: 속성을 업데이트합니다.

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
          name: REVISION

    다음과 같이 바꿉니다.

    • SERVICE를 Cloud Run 서비스 이름으로 바꿉니다.
    • MAX-INSTANCE를 원하는 최대 개수로 바꿉니다.
    • REVISION을 새 버전 이름으로 변경하거나 이미 있는 경우 삭제합니다. 새 버전 이름을 제공할 경우 다음 기준을 반드시 충족해야 합니다.
      • SERVICE-로 시작해야 합니다.
      • 소문자, 숫자, -만 포함합니다.
      • -로 끝나면 안 됩니다.
      • 63자(영문 기준) 이하여야 합니다.
  3. 다음 명령어를 사용하여 서비스를 만들거나 업데이트합니다.

    gcloud run services replace service.yaml

Terraform

Terraform 구성을 적용하거나 삭제하는 방법은 기본 Terraform 명령어를 참조하세요.

다음 google_cloud_run_v2_service 리소스는 template.scaling에서 10의 최대 인스턴스 수를 지정합니다. 10을 원하는 최대 인스턴스 수로 바꿉니다.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-max-instances"
  location = "us-central1"

  deletion_protection = false # set to "true" in production

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    scaling {
      # Max instances
      max_instance_count = 10
    }
  }
}

최대 인스턴스 한도

기본적으로 Cloud Run 서비스는 최대 100개의 인스턴스로 구성됩니다.

최대 한도는 Cloud Run 서비스의 리전과 해당 CPU 및 메모리 구성에 따라 다릅니다.

할당량 페이지에는 리전별 기준 할당량이 표시됩니다.

최대 인스턴스 수는 다음 중 최소값으로 결정됩니다.

  • 리전 할당량 기준 / CPU 1개의 배수를 요청
  • 리전 할당량 기준/요청된 2GB 메모리의 배수

예를 들어, 기준 할당량이 인스턴스 1,000개인데 4GB 메모리 또는 CPU 2개가 있으면 유효 한도 500개가 적용됩니다.

Cloud Run 서비스 리전에서 허용하는 최대 인스턴스 수보다 큰 값으로 지정하려면 할당량 증가를 요청해야 합니다.

최대 인스턴스 설정 보기

Cloud Run 서비스에 대해 현재 최대 인스턴스 설정을 보려면 다음 안내를 따르세요.

콘솔

  1. Google Cloud 콘솔에서 Cloud Run으로 이동합니다.

    Cloud Run으로 이동

  2. 관심이 있는 서비스를 클릭하여 서비스 세부정보 페이지를 엽니다.

  3. 버전 탭을 클릭합니다.

  4. 오른쪽의 세부정보 패널에서 최대 인스턴스 설정이 컨테이너 탭에 표시됩니다.

gcloud

  1. 다음 명령어를 사용하세요.

    gcloud run services describe SERVICE
  2. 반환된 구성에서 최대 인스턴스 설정을 찾습니다.