결제 설정 (서비스)

Cloud Run 서비스에는 두 가지 결제 설정이 있습니다.

  • 요청 기반 결제 (기본값): Cloud Run 인스턴스에는 요청 처리, 컨테이너 시작, 컨테이너 종료 중에 인스턴스가 요청을 처리할 때만 요금이 청구됩니다. 자세한 내용은 인스턴스 수명 주기를 참고하세요. 이 설정의 이전 이름은 요청 처리 중에만 할당되는 CPU였습니다.

  • 인스턴스 기반 결제: 수신되는 요청이 없어도 Cloud Run 인스턴스의 전체 수명 주기에 대해 요금이 청구됩니다. 인스턴스 기반 결제는 단기 백그라운드 작업 및 기타 비동기 처리 작업을 실행할 때 유용할 수 있습니다. 이 설정의 이전 이름은 CPU가 항상 할당됨이었습니다.

요청 기반 결제를 선택하면 인스턴스가 요청을 처리할 때만 요청별로 요금이 청구됩니다. 인스턴스 기반 결제를 선택하면 인스턴스의 전체 수명 주기에 대해 요금이 청구됩니다. 자세한 내용은 Cloud Run 가격 책정표를 참조하세요.

추천자는 지난 1개월 동안 Cloud Run 서비스에서 수신한 트래픽을 자동으로 조회하여 요청 기반 결제보다 인스턴스 기반 결제가 저렴한 경우 인스턴스 기반 결제로 전환하도록 추천합니다.

CPU 할당 영향

결제 설정을 선택하면 CPU 할당 방식에 영향을 미칩니다.

  • 요청 기반 결제를 사용하면 요청 처리 중에만 CPU가 할당됩니다.
  • 인스턴스 기반 결제를 사용하면 전체 컨테이너 인스턴스 수명 주기에 걸쳐 CPU가 할당됩니다.

적절한 결제 설정을 선택하는 방법

사용 사례에 적합한 결제 설정을 선택하는 것은 트래픽 패턴, 백그라운드 실행, 비용 등 여러 요소에 따라 결정됩니다. 각 요소에 대해서는 다음 섹션에서 설명합니다.

트래픽 패턴 고려사항

  • 수신 트래픽이 산발적이거나 급격히 증가하는 경우 요청 기반 결제를 사용하는 것이 좋습니다.
  • 수신 트래픽이 일정하고 느리게 변화하는 경우 인스턴스 기반 결제를 사용하는 것이 좋습니다.

백그라운드 실행 고려사항

인스턴스 기반 결제를 선택하면 요청 처리 외에도 CPU가 할당되므로 응답을 반환한 후 단기 백그라운드 작업 및 기타 비동기 처리 작업을 실행할 수 있습니다. 예를 들면 다음과 같습니다.

  • 백그라운드에서 실행될 수 있다고 가정할 수 있는 OpenTelemetry와 같은 모니터링 에이전트 활용
  • Go의 Goroutines, Node.js 비동기, 자바 스레드, Kotlin 코루틴 사용
  • 기본 제공 예약/백그라운드 기능에 의존하는 애플리케이션 프레임워크 사용

최소 인스턴스를 사용하여 준비 상태로 유지되는 인스턴스를 포함하여 유휴 인스턴스를 언제든지 종료할 수 있습니다. 컨테이너가 종료되기 전 미해결 태스크를 완료해야 할 경우 SIGTERM을 트랩하여 중지되기 전 인스턴스에 10초의 유예 시간을 제공할 수 있습니다.

비동기 태스크 실행을 위해서는 Cloud Tasks 사용을 고려합니다. Cloud Tasks는 실패한 태스크를 자동으로 재시도하고 최대 30분까지 실행 시간을 지원합니다.

비용 고려사항

요청 기반 결제를 사용하는 경우 다음과 같은 경우 인스턴스 기반 결제가 더 경제적일 수 있습니다.

  • Cloud Run 서비스가 많은 수의 현재 요청을 일정한 속도로 처리하고 있습니다.
  • 인스턴스 수 측정항목을 확인할 때 '유휴' 인스턴스가 많지 않습니다.

가격 계산기를 사용하여 비용 차이를 추정할 수 있습니다.

자동 확장 고려사항

Cloud Run은 컨테이너 인스턴스 수를 autoscales합니다.

요청 기반 결제로 설정된 서비스의 경우 Cloud Run은 요청 처리 중에만 CPU 사용률에 따라 인스턴스 수를 자동 확장합니다.

인스턴스 기반 결제로 설정된 서비스의 경우 Cloud Run은 컨테이너 인스턴스의 전체 수명 주기 동안 CPU 사용률에 따라 인스턴스 수를 자동 확장합니다. 단, 0으로 확장하거나 0에서 확장할 때는 요청만 사용합니다.

인스턴스 기반 청구 고려사항

결제 설정이 인스턴스 기반 결제로 설정되어 있더라도 Cloud Run 자동 확장은 계속 적용되며 수신 트래픽 또는 요청 외의 현재 CPU 사용률을 처리하는 데 필요하지 않은 경우 인스턴스를 종료할 수 있습니다. 최소 인스턴스를 사용하여 활성 상태로 유지되지 않는 한 인스턴스는 요청 처리 후 15분 이상 유휴 상태로 유지되지 않습니다.

인스턴스 기반 결제를 여러 최소 인스턴스와 결합하면 CPU 리소스에 대한 전체 액세스 권한으로 여러 인스턴스가 실행되어 백그라운드 처리 사용 사례가 가능해집니다. 이 패턴을 사용할 때 Cloud Run은 서비스가 요청 이외의 CPU를 사용하더라도 인스턴스 자동 확장을 적용합니다.

상태 점검 프로브를 사용하는 경우 모든 프로브에 인스턴스 기반 결제를 사용해야 합니다. 결제 세부정보는 컨테이너 상태 점검 프로브를 참고하세요.

필요한 역할

Cloud Run 서비스를 구성하고 배포하는 데 필요한 권한을 얻으려면 관리자에게 다음 IAM 역할을 부여해 달라고 요청하세요.

Cloud Run과 연결된 IAM 역할 및 권한 목록은 Cloud Run IAM 역할Cloud Run IAM 권한을 참조하세요. Cloud Run 서비스가 Cloud 클라이언트 라이브러리와 같은Google Cloud API와 상호작용하는 경우에는 서비스 ID 구성 가이드를 참고하세요. 역할 부여에 대한 자세한 내용은 배포 권한액세스 관리를 참고하세요.

결제 설정 및 업데이트

구성을 변경하면 새 버전이 생성됩니다. 이를 변경하는 명시적 업데이트가 없으면 이후 버전에도 이 구성 설정이 자동으로 적용됩니다.

인스턴스 기반 결제를 선택하는 경우 최소 512MiB의 메모리를 지정해야 합니다.

새 서비스를 만들거나 새 버전을 배포할 때 Google Cloud 콘솔, gcloud CLI 또는 YAML 파일을 사용하여 결제 설정을 변경할 수 있습니다.

콘솔

  1. Google Cloud 콘솔에서 Cloud Run으로 이동합니다.

    Cloud Run으로 이동

  2. 컨테이너 배포를 클릭하고 서비스를 선택하여 새 서비스를 구성합니다. 기존 서비스를 구성하는 경우 서비스를 클릭한 후 새 버전 수정 및 배포를 클릭합니다.

  3. 새 서비스를 구성하는 경우 초기 서비스 설정 페이지를 작성합니다.

  4. 결제에서 결제 설정을 선택합니다. 요청 처리 중에만 인스턴스에 요금이 청구되도록 하려면 요청 기반 결제를 선택합니다. 인스턴스의 전체 수명 주기에 대해 요금이 청구되도록 인스턴스에 인스턴스 기반 결제를 선택합니다.

  5. 만들기 또는 배포를 클릭합니다.

gcloud

결제 설정을 업데이트할 수 있습니다. 특정 서비스에 인스턴스 기반 결제를 설정하려면 다음 안내를 따르세요.

gcloud run services update SERVICE --no-cpu-throttling 

SERVICE를 서비스 이름으로 바꿉니다.

요청 기반 결제를 설정하는 방법은 다음과 같습니다.

gcloud run services update SERVICE --cpu-throttling 

배포 중에 결제 설정을 설정할 수도 있습니다. 결제 설정을 인스턴스 기반 결제로 설정하려면 다음 단계를 따르세요.

gcloud run deploy --image IMAGE_URL --no-cpu-throttling

요청 기반 결제로 결제 설정을 변경하려면 다음 단계를 따르세요.

gcloud run deploy --image IMAGE_URL --cpu-throttling

IMAGE_URL을 컨테이너 이미지에 대한 참조(예: us-docker.pkg.dev/cloudrun/container/hello:latest)로 바꿉니다. Artifact Registry를 사용하는 경우 저장소 REPO_NAME이 이미 생성되어 있어야 합니다. URL의 형식은 LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG입니다.

YAML

  1. 새 서비스를 만드는 경우에는 이 단계를 건너뜁니다. 기존 서비스를 업데이트하는 경우 YAML 구성을 다운로드합니다.

    gcloud run services describe SERVICE --format export > service.yaml
  2. cpu 속성을 업데이트합니다.

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            run.googleapis.com/cpu-throttling: 'BOOLEAN'
          name: REVISION

    다음과 같이 바꿉니다.

    • SERVICE: Cloud Run 서비스 이름
    • BOOLEANtrue를 사용하여 요청 결제를 설정하거나 false를 사용하여 인스턴스 기반 결제를 설정합니다.
    • REVISION을 새 버전 이름으로 변경하거나 이미 있는 경우 삭제합니다. 새 버전 이름을 제공할 경우 다음 기준을 반드시 충족해야 합니다.
      • SERVICE-로 시작해야 합니다.
      • 소문자, 숫자, -만 포함합니다.
      • -로 끝나면 안 됩니다.
      • 63자(영문 기준) 이하여야 합니다.
  3. 다음 명령어를 사용하여 서비스를 만들거나 업데이트합니다.

    gcloud run services replace service.yaml

Terraform

Terraform 구성을 적용하거나 삭제하는 방법은 기본 Terraform 명령어를 참조하세요.

template.containers.resources 아래의 Terraform 구성에서 google_cloud_run_v2_service 리소스에 다음을 추가합니다.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-cpu-allocation"
  location = "us-central1"

  deletion_protection = false # set to "true" in production

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
      resources {
        # If true, garbage-collect CPU when once a request finishes
        cpu_idle = false
      }
    }
  }
}

결제 설정 보기

Cloud Run 서비스의 현재 결제 설정을 보려면 다음 안내를 따르세요.

콘솔

  1. Google Cloud 콘솔에서 Cloud Run으로 이동합니다.

    Cloud Run으로 이동

  2. 관심이 있는 서비스를 클릭하여 서비스 세부정보 페이지를 엽니다.

  3. 버전 탭을 클릭합니다.

  4. 오른쪽의 세부정보 패널에서 결제 설정이 일반 탭에 표시됩니다.

gcloud

  1. 다음 명령어를 사용하세요.

    gcloud run services describe SERVICE
  2. 반환된 구성에서 결제 설정을 찾습니다.