이 페이지에서는 기본 Cloud Run 자동 확장 동작을 사용하여 Cloud Run 서비스에 사용할 수 있는 최대 인스턴스 수를 설정하는 방법을 설명합니다. 서비스를 수동으로 확장하려면 수동 확장을 참조하세요.
Cloud Run에서 최대 인스턴스를 지정하면 수신 요청에 대한 응답으로 서비스 확장을 제한할 수 있습니다. 하지만 이 최대 설정은 트래픽 급증과 같은 상황으로 인해 일시적으로 초과될 수 있습니다.
이 설정을 사용하여 비용을 제어하거나 데이터베이스와 같은 백업 서비스에 대한 연결 수를 제한할 수 있습니다.
서비스에 적용될 수 있는 최대 인스턴스 한도에 대한 자세한 내용은 최대 인스턴스 한도를 참조하세요.
Cloud Run이 컨테이너 인스턴스를 자동 확장하는 방법에 대한 자세한 내용은 인스턴스 자동 확장을 참조하세요.
최대 인스턴스 적용(서비스 수준 및 버전 수준 비교)
서비스 수준이나 버전 수준에서 최대 인스턴스를 구성할 수 있습니다. 버전 수준에서 인스턴스를 제한해야 하는 특정 니즈가 없는 한 서비스 수준 최대 인스턴스를 사용하는 것이 좋습니다.
최대 인스턴스를 적용하면 설정이 다음과 같이 적용됩니다.
- 서비스 수준: 즉시
- 버전 수준: 버전 배포 시
태그 지정 버전 및 서비스 수준 최대 인스턴스
태그 지정 버전이 시작되지만 트래픽 분할에 포함된 경우 서비스 수준 최대 인스턴스로만 계산됩니다.
필요한 역할
Cloud Run 서비스를 구성하고 배포하는 데 필요한 권한을 얻으려면 관리자에게 다음 IAM 역할을 부여해 달라고 요청하세요.
-
Cloud Run 서비스에 대한 Cloud Run 개발자(
roles/run.developer
) 역할 -
서비스 ID에 대한 서비스 계정 사용자(
roles/iam.serviceAccountUser
) 역할
Cloud Run과 연결된 IAM 역할 및 권한 목록은 Cloud Run IAM 역할 및 Cloud Run IAM 권한을 참조하세요. Cloud Run 서비스가 Cloud 클라이언트 라이브러리와 같은Google Cloud API와 상호작용하는 경우에는 서비스 ID 구성 가이드를 참조하세요. 역할 부여에 대한 자세한 내용은 배포 권한 및 액세스 관리를 참조하세요.
서비스 수준 최대 인스턴스 구성
새 서비스를 만들거나 새 버전을 배포할 때 Google Cloud 콘솔, Google Cloud CLI 또는 YAML 파일을 사용하여 최대 인스턴스 설정을 변경할 수 있습니다.
콘솔
Google Cloud 콘솔에서 Cloud Run으로 이동합니다.
새 서비스를 구성하는 경우 서비스를 선택하고 컨테이너 배포를 클릭하여 서비스 만들기 양식을 표시합니다. 서비스 확장 양식을 찾습니다.
기존 서비스를 구성하는 경우 서비스를 클릭하여 세부정보 패널을 표시한 후 세부정보 패널 오른쪽 상단에 있는
서비스 수준 확장 설정 수정을 클릭합니다.최대 인스턴스 수 필드에
1
부터 서비스에 적용할 수 있는 최대 한도까지의 정수 값을 사용하여 필요한 최대 컨테이너 인스턴스 수를 지정합니다.새 서비스의 경우 만들기를 클릭하고 기존 서비스의 경우 배포를 클릭합니다.
gcloud
다음 명령어를 사용하여 지정된 서비스의 최대 인스턴스 수를 업데이트할 수 있습니다.
gcloud beta run services update SERVICE --max MAX-VALUE
다음과 같이 바꿉니다.
- SERVICE를 서비스 이름으로 바꿉니다.
- MAX-VALUE를
1
부터 서비스에 적용할 수 있는 최대 한도까지의 정수 값을 사용하여 필요한 최대 컨테이너 인스턴스 수로 바꿉니다.
배포 중에 다음 명령어를 사용하여 최대 인스턴스 수를 설정할 수도 있습니다.
gcloud beta run deploy --image IMAGE_URL --max MAX-VALUE
다음과 같이 바꿉니다.
YAML
구성을 변경하면 새 버전이 생성됩니다. 이를 변경하는 명시적 업데이트가 없으면 이후 버전에도 이 구성 설정이 자동으로 적용됩니다.
새 서비스를 만드는 경우에는 이 단계를 건너뜁니다. 기존 서비스를 업데이트하는 경우 YAML 구성을 다운로드합니다.
gcloud run services describe SERVICE --format export > service.yaml
run.googleapis.com/maxScale:
속성을 업데이트합니다.apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE annotations: run.googleapis.com/launch-stage: BETA run.googleapis.com/maxScale: 'MAX-INSTANCE'
다음과 같이 바꿉니다.
- SERVICE: Cloud Run 서비스 이름
- MAX-INSTANCE를
1
부터 서비스에 적용할 수 있는 최대 한도까지의 정수 값을 사용하여 필요한 최대 컨테이너 인스턴스 수로 바꿉니다.
다음 명령어를 사용하여 서비스를 만들거나 업데이트합니다.
gcloud run services replace service.yaml
서비스 수준 최대 인스턴스 보기
Cloud Run 서비스의 현재 서비스 수준 최대 인스턴스 설정을 보려면 다음 안내를 따르세요.
콘솔
Google Cloud 콘솔에서 Cloud Run으로 이동합니다.
해당 서비스를 클릭하여 서비스 세부정보 패널을 엽니다.
서비스 세부정보 패널 오른쪽 상단에 있는 확장 옆에서 현재 설정을 봅니다.
gcloud
다음 명령어를 사용하세요.
gcloud run services describe SERVICE
반환된 구성에서 확장: 자동(최소: MIN_VALUE, 최대: MAX_VALUE) 값을 찾습니다.
버전 수준 최대 인스턴스 구성
구성을 변경하면 새 버전이 생성됩니다. 이를 변경하는 명시적 업데이트가 없으면 이후 버전에도 이 구성 설정이 자동으로 적용됩니다.
기본적으로 Cloud Run 서비스는 인스턴스 최대 100개까지 확장되도록 구성됩니다.
새 서비스를 만들거나 새 버전을 배포할 때 Google Cloud 콘솔, Google Cloud CLI 또는 YAML 파일을 사용하여 최대 인스턴스 설정을 변경할 수 있습니다.
콘솔
Google Cloud 콘솔에서 Cloud Run으로 이동합니다.
서비스 목록에서 업데이트하려는 서비스를 찾아 클릭하여 해당 서비스 세부정보를 엽니다.
새 버전 수정 및 배포를 클릭하여 버전 배포 양식을 표시합니다.
컨테이너 탭을 클릭합니다.
버전 확장 섹션을 찾습니다. 최대 인스턴스 수 필드에 최대 컨테이너 인스턴스 수를 지정합니다.
배포를 클릭합니다.
gcloud
다음 명령어를 사용하여 지정된 서비스의 최대 인스턴스 수를 업데이트할 수 있습니다.
gcloud beta run services update SERVICE --max-instances MAX-VALUE
다음과 같이 바꿉니다.
- SERVICE를 서비스 이름으로 바꿉니다.
- MAX-VALUE를
1
부터 최대 한도까지의 정수 값을 사용하여 필요한 최대 컨테이너 인스턴스 수로 바꿉니다.
YAML
새 서비스를 만드는 경우에는 이 단계를 건너뜁니다. 기존 서비스를 업데이트하는 경우 YAML 구성을 다운로드합니다.
gcloud run services describe SERVICE --format export > service.yaml
autoscaling.knative.dev/maxScale:
속성을 업데이트합니다.apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE annotations: run.googleapis.com/launch-stage: BETA spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' name: REVISION
다음과 같이 바꿉니다.
- SERVICE: Cloud Run 서비스 이름
- MAX-INSTANCE를
1
부터 최대 한도까지의 정수 값을 사용하여 필요한 최대 컨테이너 인스턴스 수로 바꿉니다. - REVISION을 새 버전 이름으로 변경하거나 이미 있는 경우 삭제합니다. 새 버전 이름을 제공할 경우 다음 기준을 반드시 충족해야 합니다.
SERVICE-
로 시작해야 합니다.- 소문자, 숫자,
-
만 포함합니다. -
로 끝나면 안 됩니다.- 63자(영문 기준) 이하여야 합니다.
다음 명령어를 사용하여 서비스를 만들거나 업데이트합니다.
gcloud run services replace service.yaml
버전 수준 최대 인스턴스 설정 보기
Cloud Run 서비스의 현재 버전 수준 최대 인스턴스 설정을 보려면 다음 안내를 따르세요.
콘솔
Google Cloud 콘솔에서 Cloud Run으로 이동합니다.
해당 서비스를 클릭하여 서비스 세부정보 패널을 엽니다.
버전 탭을 클릭합니다.
오른쪽에 있는 세부정보 패널의 컨테이너 탭에 표시된 버전 최대 인스턴스 설정을 봅니다.
gcloud
다음 명령어를 사용하세요.
gcloud run services describe SERVICE
반환된 구성에서 최대 인스턴스: 값을 찾습니다.
서비스 수준 및 버전 수준 최소 또는 최대 인스턴스 모두 사용
다음 표에서는 서비스 수준 최소 인스턴스와 버전 수준 최소 또는 최대 인스턴스를 결합한 경우의 동작을 보여줍니다.
서비스 수준 설정 | 버전 수준 설정 | 동작 |
---|---|---|
서비스 수준 최대 인스턴스가 설정됨 | 버전 수준 최대 인스턴스가 설정됨 | 유효한 최대 인스턴스 한도는 버전 수준 최대 인스턴스와 서비스 수준 최대 인스턴스 중 작은 값입니다. |
서비스 수준 최대 인스턴스가 설정됨 | 버전 수준 최소 인스턴스가 설정됨 | 서비스 수준 최대 인스턴스가 버전 수준 최소 인스턴스보다 낮은 값으로 설정되면 버전은 인스턴스를 서비스 수준 최대 인스턴스까지 시작하며 구성된 버전 수준 최소 인스턴스에 도달하지 않습니다. |
트래픽 분할과 함께 서비스 수준 최대 인스턴스 사용
트래픽 분할을 사용하는 경우 서비스 수준 최소 인스턴스는 트래픽 분할 비율에 따라 버전 전체에서 분할됩니다. 예를 들어 서비스 수준 최대 인스턴스가 100개인 경우 50/50 트래픽 분할은 버전마다 서비스 수준 최대 인스턴스를 50개로 할당합니다. 다음 표에는 샘플 구성 시나리오가 나와 있습니다.
샘플 구성 | 결과 동작 |
---|---|
서비스 수준 최대 인스턴스가 설정됨(버전 수준 설정이 없는 시나리오): 100개
|
서비스 수준 최대 인스턴스 일부가 각 버전에 할당됩니다. 각 버전의 유효한 최대 인스턴스는 트래픽 분할에 따라 고정됩니다. 버전 A의 최대 인스턴스는 10개이며 버전 B는 10개, 버전 C는 80개입니다. |