이 문서에서는 Media CDN에 적용되는 할당량과 한도에 대해 설명합니다.
- 할당량에는 기본값이 있지만 일반적으로 조정을 요청할 수 있습니다.
- 시스템 한도는 변경할 수 없는 고정 값입니다.
Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.
Cloud Quotas 시스템은 다음을 수행합니다.
- Google Cloud 제품 및 서비스 소비량 모니터링
- 리소스 소비 제한
- 할당량 값 변경을 요청하고 할당량 조정을 자동화하는 방법을 제공합니다.
대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.
할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.
Media CDN 리소스에도 시스템 한도가 있습니다. 한도는 변경할 수 없습니다.
한도
Media CDN에는 다음 한도가 적용됩니다.
구성
항목 | 한도 | 참고 |
---|---|---|
최대 EdgeCacheService 수 |
프로젝트당 20개 | 이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요. |
최대 EdgeCacheOrigin 수 |
프로젝트당 30개 | 이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요. |
최대 EdgeCacheKeyset 수 |
프로젝트당 10개 | 이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요. |
EdgeCacheService 당 최대 RouteRules 수 |
2000 | 각 이 한도는 상향 조정할 수 없습니다. |
서비스별 최대 SSL 인증서 | 5 | 이 한도는 상향 조정할 수 없습니다. SSL 인증서에 대해서는 프로젝트별 할당량을 참조하세요. |
EdgeCacheKeyset 당 최대 공개 키 수 |
3 | 이 한도는 상향 조정할 수 없습니다. 키 세트의 여러 키가 키 순환을 사용 설정하도록 설계됩니다. 오래되고 사용되지 않은 키는 시간이 지남에 따라 삭제해야 합니다. |
EdgeCacheKeyset 당 최대 검증 공유 키 수 |
3 | 이 한도는 상향 조정할 수 없습니다. 키 세트의 여러 키가 키 순환을 사용 설정하도록 설계됩니다. 오래되고 사용되지 않은 키는 시간이 지남에 따라 삭제해야 합니다. |
HTTP 헤더, 요청, 응답
항목 | 한도 | 참고 |
---|---|---|
최대 요청 헤더 크기 | 대략적인 11KiB | 이 한도는 상향 조정할 수 없습니다.
요청 URL과 요청 헤더를 합한 크기는 15KB로 제한됩니다. 요청은 HTTP/1.1 연결에 대한 HTTP 431 응답으로 거부됩니다. 응답 코드를 작성하지 않고 HTTP/2 연결이 닫힙니다.
이러한 요청은 로깅이 사용 설정된 경우 |
최대 요청 본문 크기 | 16KiB | 이 한도를 초과하는 본문의 요청은 HTTP 413 Content Too Large 상태 코드로 거부됩니다.
|
최대 응답 헤더 크기 | 대략적인 128KiB | 이 한도는 상향 조정할 수 없습니다.
이 한도를 초과하는 헤더를 포함하는 원본 응답은 HTTP 502가 클라이언트에 전송되도록 만듭니다. 로깅이 사용 설정된 경우 |
캐시 가능한 최대 객체 크기 | 100GiB | 이 한도는 상향 조정할 수 없습니다.
Media CDN이 캐시할 수 있는 원본의 최대 객체 크기입니다. 더 큰 객체는 캐시할 수 없는 것으로 취급됩니다. |
캐시할 수 없는 최대 응답 크기 | 500MiB | 이 한도는 상향 조정할 수 없습니다.
객체가 캐시 불가능할 때 Media CDN이 프록시하는 응답 본문의 최대 바이트 수입니다. 캐시할 수 없는 응답은 한도에 도달한 후 잘립니다. |
헤더의 소문자 변환 | Media CDN의 경우 항상 | Media CDN은 요청 및 응답 헤더의 대소문자 표현에 대해 HTTP/2 규칙을 따릅니다.
사용된 프로토콜에 관계없이 모든 헤더가 소문자로 변환됩니다. 예를 들어 헤더 값의 대소문자는 변경되지 않습니다. |
API 요청 비율 한도
API 요청에 더 높은 비율 한도가 필요한 경우 현재 사용을 검토하고 증가를 요청할 수 있습니다.
항목 | 한도 |
---|---|
무효화 | EdgeCacheService 별 분당 10 |
networkservices 네임스페이스에 없는 모든 호출 |
프로젝트별 분당 호출 1,200개 |
읽기 전용: GetEdgeCache* ,
ListEdgeCache* |
프로젝트별 분당 100개 |
읽기/쓰기: networkservices 네임스페이스의 모든 항목이 읽기 전용으로 표시되지 않음 |
프로젝트별 분당 100개 |
클라이언트 제한 시간
제한시간 | 최대 기간 | 응답 코드 | 설명 |
---|---|---|---|
Maximum request duration | 5분 | HTTP 408 (Request Timeout) | 단일 요청-응답의 최대 기간입니다. |
Header timeout | 10초 | HTTP 408 (Request Timeout) | 클라이언트가 전체 요청 헤더 집합을 전송해야 하는 시간입니다. |
원본 제한 시간
connectTimeout
및maxAttemptsTimeout
은 Media CDN이 사용 가능한 응답을 찾는 데 걸리는 시간을 제한합니다.두 제한 시간 모두 원본이 헤더를 반환하고 장애 조치 또는 리디렉션을 사용할지 여부를 결정하는 데 걸리는 시간을 포함합니다.
connectTimeout
은 각 원본 시도에 독립적으로 적용되며,maxAttemptsTimeout
에는 장애 조치 및 리디렉션을 포함하여 모든 원본 시도 전반에서 연결에 필요한 시간이 포함됩니다. 리디렉션이 발생하면 원본에 연결하려는 추가 시도로 계산되며 구성된 원본에 대해 설정된maxAttempts
에 포함됩니다.Media CDN에 리디렉션 또는 장애 조치 원본에서와 같은 비리디렉션 응답이 발생하면
readTimeout
및responseTimeout
값이 적용됩니다. 리디렉션 원본은 리디렉션이 발생한EdgeCacheOrigin
에 대해 구성된connectTimeout
,readTimeout
,responseTimeout
값을 사용합니다.responseTimeout
및readTimeout
은 스트리밍 응답이 수행될 수 있는 시간을 제어합니다. Media CDN에서 업스트림 응답을 사용할 것으로 결정한 후에는connectTimeout
또는maxAttemptsTimeout
이 중요하지 않습니다. 이제부터는readTimeout
및responseTimeout
이 적용됩니다.
Media CDN은 각 EdgeCacheOrigin
에 설정된 maxAttempts
에 관계없이 모든 원본에서 최대 4번의 원본 시도를 수행합니다.
Media CDN은 기본 EdgeCacheOrigin
에서 maxAttemptsTimeout
값을 사용합니다. 시도당 제한 시간 값(connectTimeout
, readTimeout
, responseTimeout
)은 각 시도의 EdgeCacheOrigin
에 대해 구성됩니다.
다음 표에서는 제한 시간 필드에 대해 설명합니다.
필드 | 기본값 | 설명 |
---|---|---|
connectTimeout | 5초 | Media CDN이 응답 사용 가능 여부를 확인할 때까지 Media CDN이 원본에 대해 요청을 시작하는 데 걸리는 최대 시간입니다. 실제로 제한 시간은 1초~15초 사이의 값이어야 합니다. |
maxAttemptsTimeout | 15초 | 클라이언트에 오류를 반환하기 전에 장애 조치 출처를 포함한 모든 출처의 연결 시도에 소요되는 최대 시간입니다. 응답이 반환되기 전 제한 시간에 도달하면 HTTP 504가 반환됩니다. 제한 시간은 1초~30초 사이의 값이어야 합니다. 이 설정은 장애 조치 원본을 포함하여 모든 원본 연결 시도의 총 기간을 정의하여 클라이언트가 콘텐츠 스트리밍을 시작할 때까지 기다리는 최대 시간을 결정합니다. 첫 번째 |
readTimeout | 15초 | 단일 HTTP 응답의 읽기 작업 사이에 기다리는 최대 기간입니다.
|
responseTimeout | 30초 | 응답이 완료될 때까지 허용하는 최대 기간입니다. 제한 시간은 1초~120초 사이의 값이어야 합니다. 기간은 첫 번째 본문이 수신된 시간으로부터 측정됩니다. 응답이 완료되기 전에 이 제한 시간에 도달하면 응답이 잘리고 로깅됩니다. |
Manage quotas
Media CDN enforces quotas on resource usage for various reasons. For example, quotas protect the community of Google Cloud users by preventing unforeseen spikes in usage. Quotas also help users who are exploring Google Cloud with the free tier to stay within their trial.
All projects start with the same quotas, which you can change by requesting additional quota. Some quotas might increase automatically based on your use of a product.
Permissions
To view quotas or request quota increases, Identity and Access Management (IAM) principals need one of the following roles.
Task | Required role |
---|---|
Check quotas for a project | One of the following:
|
Modify quotas, request additional quota | One of the following:
|
Check your quota
Console
- In the Google Cloud console, go to the Quotas page.
- To search for the quota that you want to update, use the Filter table. If you don't know the name of the quota, use the links on this page instead.
gcloud
Using the Google Cloud CLI, run the following command to
check your quotas. Replace PROJECT_ID
with your own project ID.
gcloud compute project-info describe --project PROJECT_ID
To check your used quota in a region, run the following command:
gcloud compute regions describe example-region
Errors when exceeding your quota
If you exceed a quota with a gcloud
command,
gcloud
outputs a quota exceeded
error
message and returns with the exit code 1
.
If you exceed a quota with an API request, Google Cloud returns the
following HTTP status code: 413 Request Entity Too Large
.
Request additional quota
To adjust most quotas, use the Google Cloud console. For more information, see Request a quota adjustment.
Resource availability
Each quota represents a maximum number for a particular type of resource that you can create, if that resource is available. It's important to note that quotas don't guarantee resource availability. Even if you have available quota, you can't create a new resource if it is not available.
For example, you might have sufficient quota to create a new regional, external IP address in a given region. However, that is not possible if there are no available external IP addresses in that region. Zonal resource availability can also affect your ability to create a new resource.
Situations where resources are unavailable in an entire region are rare. However, resources within a zone can be depleted from time to time, typically without impact to the service level agreement (SLA) for the type of resource. For more information, review the relevant SLA for the resource.