이 페이지는 Cloud Translation API를 통해 번역되었습니다.

할당량 및 한도

이 문서에서는 Media CDN에 적용되는 할당량과 한도에 대해 설명합니다.

할당량에는 기본값이 있지만 일반적으로 조정을 요청할 수 있습니다.
시스템 한도는 변경할 수 없는 고정 값입니다.

Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.

Cloud Quotas 시스템은 다음을 수행합니다.

Google Cloud 제품 및 서비스 소비량 모니터링
리소스 소비 제한
할당량 값 변경을 요청하고 할당량 조정을 자동화하는 방법을 제공합니다.

대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.

할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.

Media CDN 리소스에도 시스템 한도가 있습니다. 한도는 변경할 수 없습니다.

한도

Media CDN에는 다음 한도가 적용됩니다.

구성

항목	한도	참고
최대 `EdgeCacheService` 수	프로젝트당 20개	이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요.
최대 `EdgeCacheOrigin` 수	프로젝트당 30개	이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요.
최대 `EdgeCacheKeyset` 수	프로젝트당 10개	이 한도를 늘려야 할 경우 Google Cloud 영업팀에 문의하세요.
`EdgeCacheService`당 최대 `RouteRules` 수	2000	각 `EdgeCacheService`는 최대 10개까지 `PathMatchers`를 정의하고 각 `PathMatcher`는 최대 200개까지 `RouteRules`를 정의할 수 있습니다. 이 한도는 상향 조정할 수 없습니다.
서비스별 최대 SSL 인증서	5	이 한도는 상향 조정할 수 없습니다. SSL 인증서에 대해서는 프로젝트별 할당량을 참조하세요.
`EdgeCacheKeyset`당 최대 공개 키 수	3	이 한도는 상향 조정할 수 없습니다. 키 세트의 여러 키가 키 순환을 사용 설정하도록 설계됩니다. 오래되고 사용되지 않은 키는 시간이 지남에 따라 삭제해야 합니다.
`EdgeCacheKeyset`당 최대 검증 공유 키 수	3	이 한도는 상향 조정할 수 없습니다. 키 세트의 여러 키가 키 순환을 사용 설정하도록 설계됩니다. 오래되고 사용되지 않은 키는 시간이 지남에 따라 삭제해야 합니다.

HTTP 헤더, 요청, 응답

항목	한도	참고
최대 요청 헤더 크기	대략적인 11KiB	이 한도는 상향 조정할 수 없습니다. 요청 URL과 요청 헤더를 합한 크기는 15KB로 제한됩니다. 요청은 HTTP/1.1 연결에 대한 HTTP 431 응답으로 거부됩니다. 응답 코드를 작성하지 않고 HTTP/2 연결이 닫힙니다. 이러한 요청은 로깅이 사용 설정된 경우 `headers_too_long`의 `statusDetails`로 로깅됩니다.
최대 요청 본문 크기	16KiB	이 한도를 초과하는 본문의 요청은 HTTP `413 Content Too Large` 상태 코드로 거부됩니다.
최대 응답 헤더 크기	대략적인 128KiB	이 한도는 상향 조정할 수 없습니다. 이 한도를 초과하는 헤더를 포함하는 원본 응답은 HTTP 502가 클라이언트에 전송되도록 만듭니다. 로깅이 사용 설정된 경우 `backend_response_headers_too_long`의 `statusDetails`로 로깅됩니다.
캐시 가능한 최대 객체 크기	100GiB	이 한도는 상향 조정할 수 없습니다. Media CDN이 캐시할 수 있는 원본의 최대 객체 크기입니다. 더 큰 객체는 캐시할 수 없는 것으로 취급됩니다.
캐시할 수 없는 최대 응답 크기	500MiB	이 한도는 상향 조정할 수 없습니다. 객체가 캐시 불가능할 때 Media CDN이 프록시하는 응답 본문의 최대 바이트 수입니다. 캐시할 수 없는 응답은 한도에 도달한 후 잘립니다.
헤더의 소문자 변환	Media CDN의 경우 항상	Media CDN은 요청 및 응답 헤더의 대소문자 표현에 대해 HTTP/2 규칙을 따릅니다. 사용된 프로토콜에 관계없이 모든 헤더가 소문자로 변환됩니다. 예를 들어 `Host`는 `host`가 되고 `Keep-Alive`는 `keep-alive`가 됩니다. 헤더 값의 대소문자는 변경되지 않습니다.

API 요청 비율 한도

API 요청에 더 높은 비율 한도가 필요한 경우 현재 사용을 검토하고 증가를 요청할 수 있습니다.

항목	한도
무효화	`EdgeCacheService`별 분당 10
`networkservices` 네임스페이스에 없는 모든 호출	프로젝트별 분당 호출 1,200개
*읽기 전용: `GetEdgeCache`, `ListEdgeCache`*	프로젝트별 분당 100개
읽기/쓰기: `networkservices` 네임스페이스의 모든 항목이 읽기 전용으로 표시되지 않음	프로젝트별 분당 100개

클라이언트 제한 시간

제한시간	최대 기간	응답 코드	설명
Maximum request duration	5분	HTTP 408 (Request Timeout)	단일 요청-응답의 최대 기간입니다.
Header timeout	10초	HTTP 408 (Request Timeout)	클라이언트가 전체 요청 헤더 집합을 전송해야 하는 시간입니다.

원본 제한 시간

connectTimeout 및 maxAttemptsTimeout은 Media CDN이 사용 가능한 응답을 찾는 데 걸리는 시간을 제한합니다.

두 제한 시간 모두 원본이 헤더를 반환하고 장애 조치 또는 리디렉션을 사용할지 여부를 결정하는 데 걸리는 시간을 포함합니다. connectTimeout은 각 원본 시도에 독립적으로 적용되며, maxAttemptsTimeout에는 장애 조치 및 리디렉션을 포함하여 모든 원본 시도 전반에서 연결에 필요한 시간이 포함됩니다. 리디렉션이 발생하면 원본에 연결하려는 추가 시도로 계산되며 구성된 원본에 대해 설정된 maxAttempts에 포함됩니다.

Media CDN에 리디렉션 또는 장애 조치 원본에서와 같은 비리디렉션 응답이 발생하면 readTimeout 및 responseTimeout 값이 적용됩니다. 리디렉션 원본은 리디렉션이 발생한 EdgeCacheOrigin에 대해 구성된 connectTimeout, readTimeout, responseTimeout 값을 사용합니다.
responseTimeout 및 readTimeout은 스트리밍 응답이 수행될 수 있는 시간을 제어합니다. Media CDN에서 업스트림 응답을 사용할 것으로 결정한 후에는 connectTimeout 또는 maxAttemptsTimeout이 중요하지 않습니다. 이제부터는 readTimeout 및 responseTimeout이 적용됩니다.

Media CDN은 각 EdgeCacheOrigin에 설정된 maxAttempts에 관계없이 모든 원본에서 최대 4번의 원본 시도를 수행합니다. Media CDN은 기본 EdgeCacheOrigin에서 maxAttemptsTimeout 값을 사용합니다. 시도당 제한 시간 값(connectTimeout, readTimeout, responseTimeout)은 각 시도의 EdgeCacheOrigin에 대해 구성됩니다.

다음 표에서는 제한 시간 필드에 대해 설명합니다.

필드	기본값	설명
connectTimeout	5초	Media CDN이 응답 사용 가능 여부를 확인할 때까지 Media CDN이 원본에 대해 요청을 시작하는 데 걸리는 최대 시간입니다. 실제로 `connectTimeout`에는 요청을 만들고, DNS 조회를 수행하고, HTTP 상태 코드를 포함하는 응답 헤더를 가져와서 TLS 핸드셰이크, TCP/QUIC 연결 설정을 수행하는 데 걸리는 시간이 포함됩니다. 제한 시간은 1초~15초 사이의 값이어야 합니다.
maxAttemptsTimeout	15초	클라이언트에 오류를 반환하기 전에 장애 조치 출처를 포함한 모든 출처의 연결 시도에 소요되는 최대 시간입니다. 응답이 반환되기 전 제한 시간에 도달하면 HTTP 504가 반환됩니다. 제한 시간은 1초~30초 사이의 값이어야 합니다. 이 설정은 장애 조치 원본을 포함하여 모든 원본 연결 시도의 총 기간을 정의하여 클라이언트가 콘텐츠 스트리밍을 시작할 때까지 기다리는 최대 시간을 결정합니다. 첫 번째 `maxAttemptsTimeout` 값만 사용되고, 첫 번째 값은 제공된 경로에 대해 구성된 원본에 따라 정의됩니다.
readTimeout	15초	단일 HTTP 응답의 읽기 작업 사이에 기다리는 최대 기간입니다. `readTimeout`은 `responseTimeout`에 따라 최대 값이 결정됩니다. HTTP 응답의 모든 읽기 작업은 `responseTimeout`으로 설정된 마감 시한까지 완료해야 합니다. 제한 시간은 1초~30초 사이의 값이어야 합니다. 응답이 완료되기 전에 이 제한 시간에 도달하면 응답이 잘리고 로깅됩니다.
responseTimeout	30초	응답이 완료될 때까지 허용하는 최대 기간입니다. 제한 시간은 1초~120초 사이의 값이어야 합니다. 기간은 첫 번째 본문이 수신된 시간으로부터 측정됩니다. 응답이 완료되기 전에 이 제한 시간에 도달하면 응답이 잘리고 로깅됩니다.

Manage quotas

Media CDN enforces quotas on resource usage for various reasons. For example, quotas protect the community of Google Cloud users by preventing unforeseen spikes in usage. Quotas also help users who are exploring Google Cloud with the free tier to stay within their trial.

All projects start with the same quotas, which you can change by requesting additional quota. Some quotas might increase automatically based on your use of a product.

Permissions

To view quotas or request quota increases, Identity and Access Management (IAM) principals need one of the following roles.

Task	Required role
Check quotas for a project	One of the following: Project Owner (`roles/owner`) Project Editor (`roles/editor`) Quota Viewer (`roles/servicemanagement.quotaViewer`)
Modify quotas, request additional quota	One of the following: Project Owner (`roles/owner`) Project Editor (`roles/editor`) Quota Administrator (`roles/servicemanagement.quotaAdmin`) A custom role with the `serviceusage.quotas.update` permission

Check your quota

Console

In the Google Cloud console, go to the Quotas page.
Go to Quotas
To search for the quota that you want to update, use the Filter table. If you don't know the name of the quota, use the links on this page instead.

gcloud

Using the Google Cloud CLI, run the following command to check your quotas. Replace PROJECT_ID with your own project ID.

    gcloud compute project-info describe --project PROJECT_ID

To check your used quota in a region, run the following command:

    gcloud compute regions describe example-region

Errors when exceeding your quota

If you exceed a quota with a gcloud command, gcloud outputs a quota exceeded error message and returns with the exit code 1.

If you exceed a quota with an API request, Google Cloud returns the following HTTP status code: 413 Request Entity Too Large.

Request additional quota

To adjust most quotas, use the Google Cloud console. For more information, see Request a quota adjustment.

Resource availability

Each quota represents a maximum number for a particular type of resource that you can create, if that resource is available. It's important to note that quotas don't guarantee resource availability. Even if you have available quota, you can't create a new resource if it is not available.

For example, you might have sufficient quota to create a new regional, external IP address in a given region. However, that is not possible if there are no available external IP addresses in that region. Zonal resource availability can also affect your ability to create a new resource.

Situations where resources are unavailable in an entire region are rare. However, resources within a zone can be depleted from time to time, typically without impact to the service level agreement (SLA) for the type of resource. For more information, review the relevant SLA for the resource.

할당량 및 한도 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

한도

구성