최소 인스턴스(서비스)

이 페이지에서는 최소 인스턴스 설정을 사용하여 서비스에 대해 유휴 인스턴스를 사용 설정하는 방법을 설명합니다.

Cloud Run 서비스의 경우 Cloud Run은 기본적으로 수신 요청 수를 기준으로 인스턴스 수에 맞게 확장됩니다. 하지만 특히 활성 인스턴스 0개에서 확장할 때 서비스의 지연 시간을 단축해야 하는 경우에는 웜 상태로 유지하고 요청 처리를 위해 준비할 최소 컨테이너 인스턴스 수를 지정하여 이러한 기본 동작을 변경할 수 있습니다. 이 최적화에 대한 자세한 내용은 일반적인 개발 팁을 참조하세요.

Cloud Run은 요청을 처리하지 않는(유휴 상태) 인스턴스를 삭제합니다. 최소 인스턴스가 설정되면 요청을 처리하지 않는 경우에도 Cloud Run에서 실행되는 최소 인스턴스 수를 유지합니다. min-instances 위의 활성 인스턴스가 요청을 수신하지 못하면 유휴 상태가 될 수 있습니다.

예를 들어 min-instances10이고 활성 인스턴스 수가 0이면 유휴 인스턴스 수는 10입니다. 활성 인스턴스 수가 6으로 증가하면 유휴 인스턴스 수가 4로 줄어듭니다.

청구

최소 인스턴스 기능을 사용하여 계속 실행되는 인스턴스에서 청구 비용이 발생합니다. 이러한 청구 비용은 매우 예측 가능하므로 약정 사용 할인을 구매하는 것이 좋습니다.

최소 인스턴스 및 항상 할당되는 CPU

요청 외부의 CPU가 필요한 경우 CPU를 항상 할당됨으로 구성할 수 있습니다.

최소 인스턴스 재시작 수

최소 인스턴스는 언제든지 다시 시작될 수 있습니다.

버전 및 최소 인스턴스

서비스에서 버전이 참조될 때마다 최소 인스턴스가 시작되고 버전이 더 이상 지정되지 않았으면 해제됩니다.

최소 인스턴스 설정 및 업데이트

구성을 변경하면 새 버전이 생성됩니다. 이를 변경하는 명시적 업데이트가 없으면 이후 버전에도 이 구성 설정이 자동으로 적용됩니다.

기본적으로 컨테이너 인스턴스는 0 설정으로 min-instances를 해제합니다. 새 서비스를 만들거나 새 버전을 배포할 때 Google Cloud 콘솔, gcloud 명령줄 또는 YAML 파일을 사용하여 이 기본값을 변경할 수 있습니다.

콘솔

  1. Google Cloud 콘솔에서 Cloud Run으로 이동합니다.

    Cloud Run으로 이동

  2. 배포할 새 서비스를 구성하려면 서비스 만들기를 클릭합니다. 기존 서비스를 구성하는 경우 서비스를 클릭한 후 새 버전 수정 및 배포를 클릭합니다.

  3. 새 서비스를 구성하는 경우 원하는 대로 초기 서비스 설정 페이지를 작성한 후 컨테이너, 볼륨, 네트워킹, 보안을 클릭하여 서비스 구성 페이지를 펼칩니다.

  4. 컨테이너 탭을 클릭합니다.

    이미지

    • 최소 인스턴스 수로 라벨이 지정된 필드에서 요청을 수신할 수 있도록 웜 상태로 유지하기 위해 원하는 컨테이너 인스턴스 수를 지정합니다.
  5. 만들기 또는 배포를 클릭합니다.

명령줄

다음 명령어를 사용하여 제공된 서비스의 min-instance를 업데이트합니다.

gcloud run services update SERVICE --min-instances MIN-VALUE

다음과 같이 바꿉니다.

  • SERVICE를 서비스 이름으로 바꿉니다.
  • MIN-VALUE를 요청을 수신할 수 있도록 웜 상태로 유지하기 위해 원하는 컨테이너 인스턴스 수로 바꿉니다. 최소 인스턴스 설정을 삭제하려면 default를 지정합니다.

또한 다음 명령어를 사용하여 배포min-instance를 설정할 수도 있습니다.

gcloud run deploy --image IMAGE_URL --min-instances MIN-VALUE

다음과 같이 바꿉니다.

  • IMAGE_URL: 컨테이너 이미지에 대한 참조(예: us-docker.pkg.dev/cloudrun/container/hello:latest). Artifact Registry를 사용하는 경우 저장소 REPO_NAME이 이미 생성되어 있어야 합니다. URL의 형식은 REGION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG입니다.
  • MIN-VALUE를 요청을 수신할 수 있도록 웜 상태로 유지하기 위해 원하는 컨테이너 인스턴스 수로 바꿉니다. 최소 인스턴스 설정을 삭제하려면 default를 지정합니다.

YAML

YAML 형식으로 정리된 결과를 생성하는 gcloud run services describe --format export 명령어를 사용하면 기존 서비스 구성을 다운로드해서 볼 수 있습니다. 그런 다음 아래 설명된 필드를 수정하고 gcloud run services replace 명령어를 사용하여 수정된 YAML을 업로드할 수 있습니다. 설명된 대로 필드만 수정해야 합니다.

  1. 구성을 보고 다운로드하려면 다음을 실행합니다.

    gcloud run services describe SERVICE --format export > service.yaml
  2. autoscaling.knative.dev/minScale: 속성을 업데이트합니다.

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            autoscaling.knative.dev/minScale: 'MIN-INSTANCE'
          name: REVISION

    다음과 같이 바꿉니다.

    • SERVICE를 Cloud Run 서비스 이름으로 바꿉니다.
    • MIN-INSTANCE를 요청을 수신할 수 있도록 웜 상태로 유지하기 위해 원하는 인스턴스 수로 바꿉니다.
    • REVISION을 새 버전 이름으로 변경하거나 이미 있는 경우 삭제합니다. 새 버전 이름을 제공할 경우 다음 기준을 반드시 충족해야 합니다.
      • SERVICE-로 시작해야 합니다.
      • 소문자, 숫자, -만 포함합니다.
      • -로 끝나면 안 됩니다.
      • 63자(영문 기준) 이하여야 합니다.
  3. 다음 명령어를 사용하여 서비스를 새 구성으로 바꿉니다.

    gcloud run services replace service.yaml

Terraform

Terraform 구성을 적용하거나 삭제하는 방법은 기본 Terraform 명령어를 참조하세요.

다음 google_cloud_run_v2_service 리소스는 template.scaling에서 1의 최소 인스턴스 수를 지정합니다. 1을 원하는 최소 인스턴스 수로 바꿉니다.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-min-instances"
  location = "us-central1"

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    scaling {
      # Min instances
      min_instance_count = 1
    }
  }
}

최소 인스턴스 설정 보기

Cloud Run 서비스의 현재 최소 인스턴스 설정을 보려면 다음 안내를 따르세요.

콘솔

  1. Google Cloud 콘솔에서 Cloud Run으로 이동합니다.

    Cloud Run으로 이동

  2. 관심이 있는 서비스를 클릭하여 서비스 세부정보 페이지를 엽니다.

  3. 버전 탭을 클릭합니다.

  4. 오른쪽의 세부정보 패널에서 최소 인스턴스 설정이 컨테이너 탭에 표시됩니다.

명령줄

  1. 다음 명령어를 사용하세요.

    gcloud run services describe SERVICE
  2. 반환된 구성에서 최소 인스턴스 설정을 찾습니다.