할당량 및 시스템 한도 이해하기

Google Cloud에서는 이러한 리소스의 사용량을 모니터링하고, 알림을 만들고, 조정을 요청할 수 있는 도구를 제공합니다.

  • 할당량은 사용할 수 있는 계수 가능한 공유 리소스의 양을 지정하며 Compute Engine과 같은 Google Cloud 서비스에서 정의됩니다.

  • 시스템 한도는 변경할 수 없는 고정 값입니다.

다음 표에는 추가 할당량 용어와 정의가 나와 있습니다.

용어

설명

조정 가능 여부

할당량 값을 늘리거나 줄일 수 있는 리소스입니다.

계수 가능

추적할 수 있으며 할당량 시스템에서 할당한 값에 포함되는 리소스입니다.

측정기준

측정기준은 리전이나 영역 또는 서비스별 측정기준(예: gpu_family 또는 network_id)을 나타내는 속성입니다.

Cloud Quotas API는 측정기준을 키-값 쌍으로 나타냅니다. 여기서 키는 측정기준 이름이고 값은 이름이 지정된 측정기준의 값입니다(예: {"key" : "region", "value" : "us-central1"}).

할당량

계수 가능한 공유 리소스의 사용할 수 있는 양입니다.

할당량 조정

할당량 값을 늘리거나 줄이기 위한 요청입니다. 할당량 상향 조정은 승인 및 처리에 따라 달라집니다. 할당량 감소 조정은 즉시 승인됩니다.

할당량 정보

QuotaInfo는 지정된 프로젝트, 폴더 또는 조직의 특정 할당량에 대한 메타데이터와 할당량 값 정보를 제공하는 읽기 전용 리소스입니다. QuotaInfo 리소스에는 다음이 포함됩니다.

  • 이름 및 크기와 같은 메타데이터
  • 다양한 할당량 측정기준의 할당량 값
  • Cloud 할당량은 Google Cloud 서비스에서 정의한 할당량과 개발자가 시작한 처리된 할당량 조정에서 정보를 가져옵니다.

    참고: QuotaInfo는 여러 소스의 정보를 통합하여 구성되므로 QuotaPreference 리소스가 생성되지 않더라도 기본 할당량 구성이 존재합니다. quotaPreference.create 또는 quotaPreference.update를 통해 기본 상태를 표현할 때까지는 QuotaInfo에서 사용 가능한 기본 할당량 정보를 사용하여 적용할 할당량 값을 결정합니다.

    할당량 환경설정

    QuotaPreference 리소스는 특정 측정기준 조합에 대한 선호도를 나타냅니다. 이 리소스를 사용하여 프로젝트의 할당량을 늘리고 프로젝트, 폴더 또는 조직의 할당량을 줄입니다. 할당량 상향 조정은 승인 및 처리에 따라 달라집니다. 할당량 감소는 즉시 처리됩니다. Cloud Quotas 콘솔 UI 또는 API를 사용하여 할당량 환경설정을 지정합니다.

    시스템 한도

    일반적으로 아키텍처에 따라 제약되는 고정 값입니다. 시스템 한도를 조정할 수 없습니다.

    하지만 일부 시스템 한도는 계수 가능하며, 이러한 경우 Google Cloud는 해당 값을 기준으로 사용량을 모니터링하고 알림을 생성할 수 있는 도구를 제공합니다.

    유형

    리소스를 할당량(조정 가능) 또는 시스템 한도(조정 불가)로 표현하는 필드입니다. 일부 할당량을 조정하지 못할 수도 있습니다.

    계수 가능한 리소스 또는 시스템 한도에 적용된 현재 유효한 최댓값입니다. 할당량은 일반적으로 조정 가능하며 수동 또는 자동 할당량 조정을 통해 할당량 값을 수정할 수 있습니다.

    할당량 관리

    사용할 수 있는 공유 리소스의 양은 프로젝트 및 조직에 따라 다릅니다. 예를 들어 무료 체험판 계정을 사용하는 경우 결제 계정에 비해 일부 리소스의 할당량이 더 낮을 수 있습니다. 프로젝트에 결제를 사용 설정하면 대부분의 서비스에 대한 할당량이 증가합니다. Google Cloud를 사용할수록 대부분의 서비스에 대한 할당량도 증가합니다.

    일부 할당량은 무제한이므로 리소스를 원하는 만큼 사용할 수 있습니다. 반면에 기본값에서 늘릴 수 없는 할당량도 있습니다. 더 많이 사용하는 것이 비효율적이거나 리소스 사용이 매우 제한적인 경우입니다. 이러한 제한사항은 일반적으로 해당 서비스의 관련 할당량 및 시스템 한도 페이지에 설명되어 있습니다(예: Cloud Run 함수의 비율 한도 문서).

    이러한 극단적인 경우가 아니라면 공유 리소스는 대부분의 프로젝트에 충분한 기본값으로 설정됩니다. 하지만 프로젝트에 현재 값보다 많은 특정 리소스가 필요한 경우 할당량 환경설정을 더 높은 값으로 설정하거나 리소스를 제한하려는 경우 할당량 환경설정을 더 낮은 값으로 설정할 수 있습니다. 할당량 상향을 요청하려면 할당량 값 상향 요청을 참조하세요.

    할당량이 부족할 경우

    일반적으로 할당량이 부족하면 수행하려는 작업이 실패하고 할당량 오류가 발생합니다. 이 오류가 발생하는 작업에는 애플리케이션 배포, 새 프로젝트 만들기, API 호출이 포함될 수 있습니다. 이후 작업은 리소스를 확보하거나(배정 할당량의 경우), 기간이 재설정(비율 할당량의 경우)되거나, 할당량 상향 조정을 부여받을 때까지 계속 실패합니다.

    할당량 오류가 표시되는 방식은 Google Cloud와 상호작용하는 데 사용하는 도구 또는 클라이언트에 따라 다릅니다. 할당량 오류에서 할당량 오류에 대한 세부정보를 볼 수 있습니다.

    할당량 오류를 방지하려면 다음을 시도해 보세요.

    • 할당량을 초과하기 전에 할당량 조정자를 사용하여 할당량 상향 요청을 자동으로 만드세요.
    • 최대 할당량 값에 가까워지면 알림을 만듭니다. 자세한 내용은 할당량 알림 설정을 참조하세요.

    할당량 조정 정보

    대부분의 할당량 상향 요청은 자동화 시스템에서 평가됩니다. 결정은 리소스 가용성, Google Cloud 사용 시간, 기타 요인 등의 기준에 따라 결정됩니다. 이 기준을 충족하지 않는 요청은 거부됩니다.

    자동 검토 평가 기준은 모든 고객의 공정성을 보장하고 프로세스 조작 시도를 방지하기 위해 공개되지 않았습니다. 할당량 상향 조정 요청이 검토자에게 에스컬레이션되는 경우도 있습니다. 검토자는 기준을 따르지만 고유한 상황을 고려할 수 있습니다.

    할당량 상향 조정에 대한 요금을 선결제하라는 메시지가 표시될 수 있습니다. 예를 들어 유료 Google Cloud 서비스를 사용할 프로젝트를 더 요청하면 결제하라는 메시지가 표시될 수 있습니다. 결제는 향후에 발생하는 모든 요금에 적용될 수 있으며 계정에 크레딧으로 표시됩니다.

    할당량 상향 요청 방법은 할당량 값 상향 요청을 참조하세요. 유료 고객 관리 서비스를 사용하지 않아도 할당량 상향을 요청할 수 있습니다. 할당량 상향 요청은 일반적으로 영업일 기준 2~3일 이내에 완료됩니다. 요청이 수신되면 이메일이 전송되며 개발자는 이 이메일에 응답할 수 있습니다. 질문이 있거나 요청에 대한 추가 정보를 제공하려는 경우(예: 증가 요청이 긴급한 경우) 이 기능을 사용합니다. 그런 다음 요청이 처리된 후 할당량 상향 조정이 승인 또는 거부되었음을 알리는 또 다른 이메일이 전송됩니다. 이메일에서 할당량이 상향된 시행일을 알립니다(해당하는 경우).