할당량 및 한도

이 문서에서는 Media CDN에 적용되는 할당량한도에 대해 설명합니다.

할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 Google Cloud 프로젝트에서 사용할 수 있는 공유 Google Cloud 리소스의 양을 제한합니다. 따라서 할당량은 다음을 수행하는 시스템에 속합니다.

  • Google Cloud 제품 및 서비스 사용 또는 소비를 모니터링합니다.
  • 공정성 보장 및 사용량 급증 방지 등의 이유로 리소스 소비를 제한합니다.
  • 사전 정의된 제한사항을 자동으로 적용하는 구성을 유지합니다.
  • 할당량을 요청하거나 변경할 수 있는 수단을 제공합니다.

대부분의 경우 할당량이 초과되면 시스템에서 관련 Google 리소스에 대한 액세스를 즉시 차단하고 수행하려는 작업이 실패합니다. 대부분의 경우 할당량은 각 Google Cloud 프로젝트에 적용되며 해당 Google Cloud 프로젝트를 사용하는 모든 애플리케이션과 IP 주소 전반에 공유됩니다.

Media CDN 리소스에도 한도가 있습니다. 이 한도는 할당량 시스템과 관련이 없습니다. 별도로 명시되지 않는 한 한도를 변경할 수 없습니다.

한도

Media CDN에는 다음 한도가 적용됩니다.

구성

항목 한도 참고
최대 EdgeCacheService 프로젝트당 20개 이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요.
최대 EdgeCacheOrigin 프로젝트당 30개 이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요.
최대 EdgeCacheKeyset 프로젝트당 10개 이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요.
EdgeCacheService당 최대 RouteRules 2000

EdgeCacheService는 최대 10개까지 PathMatchers를 정의하고 각 PathMatcher는 최대 200개까지 RouteRules를 정의할 수 있습니다.

이 한도는 상향 조정할 수 없습니다.

서비스별 최대 SSL 인증서 5 이 한도는 상향 조정할 수 없습니다. SSL 인증서에 대해서는 프로젝트별 할당량을 참조하세요.
EdgeCacheKeyset당 최대 공개 키 수 3 이 한도는 상향 조정할 수 없습니다. 키 세트의 여러 키가 키 순환을 사용 설정하도록 설계됩니다. 오래되고 사용되지 않은 키는 시간이 지남에 따라 삭제해야 합니다.
EdgeCacheKeyset당 최대 검증 공유 키 수 3 이 한도는 상향 조정할 수 없습니다. 키 세트의 여러 키가 키 순환을 사용 설정하도록 설계됩니다. 오래되고 사용되지 않은 키는 시간이 지남에 따라 삭제해야 합니다.

HTTP 헤더, 요청, 응답

항목 한도 참고
최대 요청 헤더 크기 대략적인 11KiB 이 한도는 상향 조정할 수 없습니다.

요청 URL과 요청 헤더를 합한 크기는 15KB로 제한됩니다.

요청은 HTTP/1.1 연결에 대한 HTTP 431 응답으로 거부됩니다.

응답 코드를 작성하지 않고 HTTP/2 연결이 닫힙니다.

이러한 요청은 로깅이 사용 설정된 경우 headers_too_longstatusDetails로 로깅됩니다.

최대 요청 본문 크기 16KiB 이 한도를 초과하는 본문의 요청은 HTTP 413 Content Too Large 상태 코드로 거부됩니다.
최대 응답 헤더 크기 대략적인 128KiB 이 한도는 상향 조정할 수 없습니다.

이 한도를 초과하는 헤더를 포함하는 원본 응답은 HTTP 502가 클라이언트에 전송되도록 만듭니다. 로깅이 사용 설정된 경우 backend_response_headers_too_longstatusDetails로 로깅됩니다.

캐시 가능한 최대 객체 크기 100GiB 이 한도는 상향 조정할 수 없습니다.

Media CDN이 캐시할 수 있는 원본의 최대 객체 크기입니다. 더 큰 객체는 캐시할 수 없는 것으로 취급됩니다.

캐시할 수 없는 최대 응답 크기 500MiB 이 한도는 상향 조정할 수 없습니다.

객체가 캐시 불가능할 때 Media CDN이 프록시하는 응답 본문의 최대 바이트 수입니다. 캐시할 수 없는 응답은 한도에 도달한 후 잘립니다.

헤더의 소문자 변환 Media CDN의 경우 항상 Media CDN은 요청 및 응답 헤더의 대소문자 표현에 대해 HTTP/2 규칙을 따릅니다.

사용된 프로토콜에 관계없이 모든 헤더가 소문자로 변환됩니다.

예를 들어 Hosthost가 되고 Keep-Alivekeep-alive가 됩니다.

헤더 값의 대소문자는 변경되지 않습니다.

API 요청 비율 한도

API 요청에 더 높은 비율 한도가 필요한 경우 현재 사용을 검토하고 증가를 요청할 수 있습니다.

항목 한도
무효화 EdgeCacheService별 분당 10
networkservices 네임스페이스에 없는 모든 호출 프로젝트별 분당 호출 1,200개
읽기 전용: GetEdgeCache*, ListEdgeCache* 프로젝트별 분당 100개
읽기/쓰기: networkservices 네임스페이스의 모든 항목이 읽기 전용으로 표시되지 않음 프로젝트별 분당 100개

클라이언트 제한 시간

시간 초과 최대 기간 응답 코드 설명
Maximum request duration 5분 HTTP 408 (Request Timeout) 단일 요청-응답의 최대 기간입니다.
Header timeout 10초 HTTP 408 (Request Timeout) 클라이언트가 전체 요청 헤더 집합을 전송해야 하는 시간입니다.

원본 제한 시간

  • connectTimeoutmaxAttemptsTimeout은 Media CDN이 사용 가능한 응답을 찾는 데 걸리는 시간을 제한합니다.

    두 제한 시간 모두 원본이 헤더를 반환하고 장애 조치 또는 리디렉션을 사용할지 여부를 결정하는 데 걸리는 시간을 포함합니다. connectTimeout은 각 원본 시도에 독립적으로 적용되며, maxAttemptsTimeout에는 장애 조치 및 리디렉션을 포함하여 모든 원본 시도 전반에서 연결에 필요한 시간이 포함됩니다. 리디렉션이 발생하면 원본에 연결하려는 추가 시도로 계산되며 구성된 원본에 대해 설정된 maxAttempts에 포함됩니다.

    Media CDN에 리디렉션 또는 장애 조치 원본에서와 같은 비리디렉션 응답이 발생하면 readTimeoutresponseTimeout 값이 적용됩니다. 리디렉션 원본은 리디렉션이 발생한 EdgeCacheOrigin에 대해 구성된 connectTimeout, readTimeout, responseTimeout 값을 사용합니다.

  • responseTimeoutreadTimeout은 스트리밍 응답이 수행될 수 있는 시간을 제어합니다. Media CDN에서 업스트림 응답을 사용할 것으로 결정한 후에는 connectTimeout 또는 maxAttemptsTimeout이 중요하지 않습니다. 이제부터는 readTimeoutresponseTimeout이 적용됩니다.

Media CDN은 각 EdgeCacheOrigin에 설정된 maxAttempts에 관계없이 모든 원본에서 최대 4번의 원본 시도를 수행합니다. Media CDN은 기본 EdgeCacheOrigin에서 maxAttemptsTimeout 값을 사용합니다. 시도당 제한 시간 값(connectTimeout, readTimeout, responseTimeout)은 각 시도의 EdgeCacheOrigin에 대해 구성됩니다.

다음 표에서는 제한 시간 필드에 대해 설명합니다.

필드 기본값 설명
connectTimeout 5초

Media CDN이 응답 사용 가능 여부를 확인할 때까지 Media CDN이 원본에 대해 요청을 시작하는 데 걸리는 최대 시간입니다. 실제로 connectTimeout에는 요청을 만들고, DNS 조회를 수행하고, HTTP 상태 코드를 포함하는 응답 헤더를 가져와서 TLS 핸드셰이크, TCP/QUIC 연결 설정을 수행하는 데 걸리는 시간이 포함됩니다.

제한 시간은 1초~15초 사이의 값이어야 합니다.

maxAttemptsTimeout 15초

클라이언트에 오류를 반환하기 전에 장애 조치 출처를 포함한 모든 출처의 연결 시도에 소요되는 최대 시간입니다. 응답이 반환되기 전 제한 시간에 도달하면 HTTP 504가 반환됩니다.

제한 시간은 1초~30초 사이의 값이어야 합니다.

이 설정은 장애 조치 원본을 포함하여 모든 원본 연결 시도의 기간을 정의하여 클라이언트가 콘텐츠 스트리밍을 시작할 때까지 기다리는 최대 시간을 결정합니다. 첫 번째 maxAttemptsTimeout 값만 사용되고, 첫 번째 값은 제공된 경로에 대해 구성된 원본에 따라 정의됩니다.

readTimeout 15초

단일 HTTP 응답의 읽기 작업 사이에 기다리는 최대 기간입니다. readTimeoutresponseTimeout에 따라 최대 값이 결정됩니다. HTTP 응답의 모든 읽기 작업은 responseTimeout으로 설정된 마감 시한까지 완료해야 합니다. 제한 시간은 1초~30초 사이의 값이어야 합니다. 응답이 완료되기 전에 이 제한 시간에 도달하면 응답이 잘리고 로깅됩니다.

responseTimeout 30초

응답이 완료될 때까지 허용하는 최대 기간입니다.

제한 시간은 1초~120초 사이의 값이어야 합니다.

기간은 첫 번째 본문이 수신된 시간으로부터 측정됩니다. 응답이 완료되기 전에 이 제한 시간에 도달하면 응답이 잘리고 로깅됩니다.

할당량 관리

Media CDN 는 다양한 이유로 리소스 사용량에 할당량을 적용합니다. 예를 들어 할당량은 사용량이 예기치 않게 급증하는 것을 방지하여 Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 무료 등급으로 Google Cloud 제품을 둘러보는 사용자가 계속해서 체험판을 사용할 수 있게 해줍니다.

모든 프로젝트가 동일한 할당량으로 시작하며 추가 할당량을 요청하여 할당량을 변경할 수 있습니다. 제품 사용에 따라 일부 할당량이 자동으로 증가할 수 있습니다.

권한

할당량을 확인하거나 할당량 상향 조정을 요청하려면 Identity and Access Management(IAM) 주 구성원에게 다음 역할 중 하나가 필요합니다.

작업 필요한 역할
프로젝트의 할당량 확인 다음 역할 중 하나가 필요합니다.
할당량 수정, 추가 할당량 요청 다음 역할 중 하나가 필요합니다.
  • 프로젝트 소유자(roles/owner)
  • 프로젝트 편집자(roles/editor)
  • 할당량 관리자(roles/servicemanagement.quotaAdmin)
  • serviceusage.quotas.update 권한이 있는 커스텀 역할

할당량 확인

콘솔

  1. Google Cloud 콘솔에서 할당량 페이지로 이동합니다.

    할당량으로 이동

  2. 업데이트하려는 할당량을 검색하려면 테이블 필터링을 사용합니다. 할당량 이름을 모르는 경우 대신 이 페이지의 링크를 사용하세요.

gcloud

Google Cloud CLI를 사용하여 다음 명령어를 실행하여 할당량을 확인하세요. 여기서 PROJECT_ID는 프로젝트 ID로 바꿉니다.

      gcloud compute project-info describe --project PROJECT_ID

리전에서 사용한 할당량을 확인하려면 다음 명령어를 실행합니다.

    gcloud compute regions describe example-region
    

할당량 초과 시 오류

gcloud 명령어 사용 시 할당량을 초과하면 gcloud에서 quota exceeded라는 오류 메시지를 출력하고 종료 코드 1을 반환합니다.

API 요청 시 할당량을 초과하면 Google Cloud에서 HTTP 상태 코드 413 Request Entity Too Large를 반환합니다.

추가 할당량 요청

대부분의 할당량은 Google Cloud 콘솔을 사용해 늘리거나 줄입니다. 자세한 내용은 할당량 상향 요청을 참조하세요.

콘솔

  1. Google Cloud 콘솔에서 할당량 페이지로 이동합니다.

    할당량으로 이동

  2. 할당량 페이지에서 변경할 할당량을 선택합니다.
  3. 페이지 상단에서 할당량 수정을 클릭합니다.
  4. 이름에 개발자 이름을 입력합니다.
  5. (선택사항) 전화에 전화번호를 입력합니다.
  6. 요청을 제출합니다. 할당량 요청이 처리되는 데는 24~48 시간이 소요됩니다.

리소스 가용성

각 할당량은 특정 유형의 리소스를 사용할 수 있는 경우에 만들 수 있는 해당 리소스의 최대 개수를 나타냅니다. 할당량이 리소스 가용성을 보장하지는 않는다는 점에 유의해야 합니다. 사용 가능한 할당량이 있어도 리소스를 사용할 수 없으면 새 리소스를 만들 수 없습니다.

예를 들어 us-central1 리전에 새로운 리전의 외부 IP 주소를 만드는 데 충분한 할당량이 있을 수 있습니다. 그러나 이 리전에 사용 가능한 외부 IP 주소가 없으면 새 주소를 만들 수 없습니다. 또한 영역별 리소스 가용성은 새 리소스를 만들 수 있는지 여부에도 영향을 줄 수 있습니다.

전체 리전에서 리소스를 사용할 수 없는 경우는 드뭅니다. 그러나 영역 내 리소스가 소진되는 경우가 발생할 수 있으며 이러한 경우에도 일반적으로 해당 리소스 유형에 적용되는 서비스수준계약(SLA)에는 영향을 미치지 않습니다. 자세한 내용을 확인하려면 리소스의 관련 SLA를 검토하세요.