이 문서에서는 Media CDN에 적용되는 할당량과 한도에 대해 설명합니다. 할당량은 사용할 수 있고 계수할 수 있는 공유 리소스의 양을 지정하며, Media CDN과 같은 Google Cloud 서비스에서 정의됩니다. 시스템 한도는 변경할 수 없는 고정 값입니다.
Google Cloud는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는 Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여 Google Cloud 사용자 커뮤니티를 보호합니다. 할당량은 자체 Google Cloud 리소스를 관리하는 데도 도움이 됩니다.
Cloud Quotas 시스템은 다음을 수행합니다.
- Google Cloud 제품 및 서비스 소비량 모니터링
- 리소스 소비 제한
- 할당량 값 변경을 요청할 수 있는 수단 제공
대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.
할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.
Media CDN 리소스에도 시스템 한도가 있습니다. 이 시스템 한도는 할당량 시스템과 관련이 없습니다. 별도로 명시되지 않는 한 시스템 한도를 변경할 수 없습니다.
한도
Media CDN에는 다음 한도가 적용됩니다.
구성
항목 | 한도 | 참고 |
---|---|---|
최대 EdgeCacheService 수 |
프로젝트당 20개 | 이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요. |
최대 EdgeCacheOrigin 수 |
프로젝트당 30개 | 이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요. |
최대 EdgeCacheKeyset 수 |
프로젝트당 10개 | 이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요. |
EdgeCacheService 당 최대 RouteRules 수 |
2000 | 각 이 한도는 상향 조정할 수 없습니다. |
서비스별 최대 SSL 인증서 | 5 | 이 한도는 상향 조정할 수 없습니다. SSL 인증서에 대해서는 프로젝트별 할당량을 참조하세요. |
EdgeCacheKeyset 당 최대 공개 키 수 |
3 | 이 한도는 상향 조정할 수 없습니다. 키 세트의 여러 키가 키 순환을 사용 설정하도록 설계됩니다. 오래되고 사용되지 않은 키는 시간이 지남에 따라 삭제해야 합니다. |
EdgeCacheKeyset 당 최대 검증 공유 키 수 |
3 | 이 한도는 상향 조정할 수 없습니다. 키 세트의 여러 키가 키 순환을 사용 설정하도록 설계됩니다. 오래되고 사용되지 않은 키는 시간이 지남에 따라 삭제해야 합니다. |
HTTP 헤더, 요청, 응답
항목 | 한도 | 참고 |
---|---|---|
최대 요청 헤더 크기 | 대략적인 11KiB | 이 한도는 상향 조정할 수 없습니다.
요청 URL과 요청 헤더를 합한 크기는 15KB로 제한됩니다. 요청은 HTTP/1.1 연결에 대한 HTTP 431 응답으로 거부됩니다. 응답 코드를 작성하지 않고 HTTP/2 연결이 닫힙니다.
이러한 요청은 로깅이 사용 설정된 경우 |
최대 요청 본문 크기 | 16KiB | 이 한도를 초과하는 본문의 요청은 HTTP 413 Content Too Large 상태 코드로 거부됩니다.
|
최대 응답 헤더 크기 | 대략적인 128KiB | 이 한도는 상향 조정할 수 없습니다.
이 한도를 초과하는 헤더를 포함하는 원본 응답은 HTTP 502가 클라이언트에 전송되도록 만듭니다. 로깅이 사용 설정된 경우 |
캐시 가능한 최대 객체 크기 | 100GiB | 이 한도는 상향 조정할 수 없습니다.
Media CDN이 캐시할 수 있는 원본의 최대 객체 크기입니다. 더 큰 객체는 캐시할 수 없는 것으로 취급됩니다. |
캐시할 수 없는 최대 응답 크기 | 500MiB | 이 한도는 상향 조정할 수 없습니다.
객체가 캐시 불가능할 때 Media CDN이 프록시하는 응답 본문의 최대 바이트 수입니다. 캐시할 수 없는 응답은 한도에 도달한 후 잘립니다. |
헤더의 소문자 변환 | Media CDN의 경우 항상 | Media CDN은 요청 및 응답 헤더의 대소문자 표현에 대해 HTTP/2 규칙을 따릅니다.
사용된 프로토콜에 관계없이 모든 헤더가 소문자로 변환됩니다. 예를 들어 헤더 값의 대소문자는 변경되지 않습니다. |
API 요청 비율 한도
API 요청에 더 높은 비율 한도가 필요한 경우 현재 사용을 검토하고 증가를 요청할 수 있습니다.
항목 | 한도 |
---|---|
무효화 | EdgeCacheService 별 분당 10 |
networkservices 네임스페이스에 없는 모든 호출 |
프로젝트별 분당 호출 1,200개 |
읽기 전용: GetEdgeCache* ,
ListEdgeCache* |
프로젝트별 분당 100개 |
읽기/쓰기: networkservices 네임스페이스의 모든 항목이 읽기 전용으로 표시되지 않음 |
프로젝트별 분당 100개 |
클라이언트 제한 시간
제한 시간 | 최대 기간 | 응답 코드 | 설명 |
---|---|---|---|
Maximum request duration | 5분 | HTTP 408 (Request Timeout) | 단일 요청-응답의 최대 기간입니다. |
Header timeout | 10초 | HTTP 408 (Request Timeout) | 클라이언트가 전체 요청 헤더 집합을 전송해야 하는 시간입니다. |
원본 제한 시간
connectTimeout
및maxAttemptsTimeout
은 Media CDN이 사용 가능한 응답을 찾는 데 걸리는 시간을 제한합니다.두 제한 시간 모두 원본이 헤더를 반환하고 장애 조치 또는 리디렉션을 사용할지 여부를 결정하는 데 걸리는 시간을 포함합니다.
connectTimeout
은 각 원본 시도에 독립적으로 적용되며,maxAttemptsTimeout
에는 장애 조치 및 리디렉션을 포함하여 모든 원본 시도 전반에서 연결에 필요한 시간이 포함됩니다. 리디렉션이 발생하면 원본에 연결하려는 추가 시도로 계산되며 구성된 원본에 대해 설정된maxAttempts
에 포함됩니다.Media CDN에 리디렉션 또는 장애 조치 원본에서와 같은 비리디렉션 응답이 발생하면
readTimeout
및responseTimeout
값이 적용됩니다. 리디렉션 원본은 리디렉션이 발생한EdgeCacheOrigin
에 대해 구성된connectTimeout
,readTimeout
,responseTimeout
값을 사용합니다.responseTimeout
및readTimeout
은 스트리밍 응답이 수행될 수 있는 시간을 제어합니다. Media CDN에서 업스트림 응답을 사용할 것으로 결정한 후에는connectTimeout
또는maxAttemptsTimeout
이 중요하지 않습니다. 이제부터는readTimeout
및responseTimeout
이 적용됩니다.
Media CDN은 각 EdgeCacheOrigin
에 설정된 maxAttempts
에 관계없이 모든 원본에서 최대 4번의 원본 시도를 수행합니다.
Media CDN은 기본 EdgeCacheOrigin
에서 maxAttemptsTimeout
값을 사용합니다. 시도당 제한 시간 값(connectTimeout
, readTimeout
, responseTimeout
)은 각 시도의 EdgeCacheOrigin
에 대해 구성됩니다.
다음 표에서는 제한 시간 필드에 대해 설명합니다.
필드 | 기본값 | 설명 |
---|---|---|
connectTimeout | 5초 | Media CDN이 응답 사용 가능 여부를 확인할 때까지 Media CDN이 원본에 대해 요청을 시작하는 데 걸리는 최대 시간입니다. 실제로 제한 시간은 1초~15초 사이의 값이어야 합니다. |
maxAttemptsTimeout | 15초 | 클라이언트에 오류를 반환하기 전에 장애 조치 출처를 포함한 모든 출처의 연결 시도에 소요되는 최대 시간입니다. 응답이 반환되기 전 제한 시간에 도달하면 HTTP 504가 반환됩니다. 제한 시간은 1초~30초 사이의 값이어야 합니다. 이 설정은 장애 조치 원본을 포함하여 모든 원본 연결 시도의 총 기간을 정의하여 클라이언트가 콘텐츠 스트리밍을 시작할 때까지 기다리는 최대 시간을 결정합니다. 첫 번째 |
readTimeout | 15초 | 단일 HTTP 응답의 읽기 작업 사이에 기다리는 최대 기간입니다.
|
responseTimeout | 30초 | 응답이 완료될 때까지 허용하는 최대 기간입니다. 제한 시간은 1초~120초 사이의 값이어야 합니다. 기간은 첫 번째 본문이 수신된 시간으로부터 측정됩니다. 응답이 완료되기 전에 이 제한 시간에 도달하면 응답이 잘리고 로깅됩니다. |
할당량 관리
Media CDN 는 다양한 이유로 리소스 사용량에 할당량을 적용합니다. 예를 들어 할당량은 사용량이 예기치 않게 급증하는 것을 방지하여 Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 무료 등급으로 Google Cloud 제품을 둘러보는 사용자가 계속해서 체험판을 사용할 수 있게 해줍니다.
모든 프로젝트가 동일한 할당량으로 시작하며 추가 할당량을 요청하여 할당량을 변경할 수 있습니다. 제품 사용에 따라 일부 할당량이 자동으로 증가할 수 있습니다.
권한
할당량을 확인하거나 할당량 상향 조정을 요청하려면 Identity and Access Management(IAM) 주 구성원에게 다음 역할 중 하나가 필요합니다.
작업 | 필요한 역할 |
---|---|
프로젝트의 할당량 확인 | 다음 역할 중 하나가 필요합니다. |
할당량 수정, 추가 할당량 요청 | 다음 역할 중 하나가 필요합니다. |
할당량 확인
콘솔
- Google Cloud 콘솔에서 할당량 페이지로 이동합니다.
- 업데이트하려는 할당량을 검색하려면 테이블 필터링을 사용합니다. 할당량 이름을 모르는 경우 대신 이 페이지의 링크를 사용하세요.
gcloud
Google Cloud CLI를 사용하여 다음 명령어를 실행하여 할당량을 확인하세요. 여기서 PROJECT_ID
는 프로젝트 ID로 바꿉니다.
gcloud compute project-info describe --project PROJECT_ID
리전에서 사용한 할당량을 확인하려면 다음 명령어를 실행합니다.
gcloud compute regions describe example-region
할당량 초과 시 오류
gcloud
명령어 사용 시 할당량을 초과하면 gcloud
에서 quota exceeded
라는 오류 메시지를 출력하고 종료 코드 1
을 반환합니다.
API 요청 시 할당량을 초과하면 Google Cloud에서 HTTP 상태 코드 413 Request Entity Too Large
를 반환합니다.
추가 할당량 요청
대부분의 할당량은 Google Cloud 콘솔을 사용해 늘리거나 줄입니다. 자세한 내용은 할당량 상향 요청을 참조하세요.
콘솔
- Google Cloud 콘솔에서 할당량 페이지로 이동합니다.
- 할당량 페이지에서 변경할 할당량을 선택합니다.
- 페이지 상단에서 할당량 수정을 클릭합니다.
- 이름에 개발자 이름을 입력합니다.
- (선택사항) 전화에 전화번호를 입력합니다.
- 요청을 제출합니다. 할당량 요청이 처리되는 데는 24~48 시간이 소요됩니다.
리소스 가용성
각 할당량은 특정 유형의 리소스를 사용할 수 있는 경우에 만들 수 있는 해당 리소스의 최대 개수를 나타냅니다. 할당량이 리소스 가용성을 보장하지는 않는다는 점에 유의해야 합니다. 사용 가능한 할당량이 있어도 리소스를 사용할 수 없으면 새 리소스를 만들 수 없습니다.
예를 들어 us-central1
리전에 새로운 리전의 외부 IP 주소를 만드는 데 충분한 할당량이 있을 수 있습니다. 그러나 이 리전에 사용 가능한 외부 IP 주소가 없으면 새 주소를 만들 수 없습니다. 또한 영역별 리소스 가용성은 새 리소스를 만들 수 있는지 여부에도 영향을 줄 수 있습니다.
전체 리전에서 리소스를 사용할 수 없는 경우는 드뭅니다. 그러나 영역 내 리소스가 소진되는 경우가 발생할 수 있으며 이러한 경우에도 일반적으로 해당 리소스 유형에 적용되는 서비스수준계약(SLA)에는 영향을 미치지 않습니다. 자세한 내용을 확인하려면 리소스의 관련 SLA를 검토하세요.