이 페이지에는 Cloud Run 사용 시 적용되는 사용 할당량 및 한도가 나와 있습니다.
Cloud Run 리소스 수는 제한되어 있습니다. Cloud Run 할당량에는 Cloud Run Admin API를 호출할 수 있는 비율에 영향을 주는 API 비율 제한이 포함됩니다.
다음 사항에 대한 직접적인 한도는 없습니다.
- 배포할 수 있는 컨테이너 이미지의 크기
- Cloud Run 서비스에서 제공하는 동시 요청의 수
Cloud Run의 리소스 한도
리소스 | 범위 | 설명 | 한도 | 상향 가능성 |
---|---|---|---|---|
서비스 | 프로젝트 및 리전별 | 최대 서비스 수 | 1,000 | 아니요 |
작업 | 프로젝트 및 리전별 | 최대 작업 수 | 1000 | 아니요 |
작업 실행 | 프로젝트 및 리전별 | 실행 중인 최대 작업 실행 수 | 1000 | 아니요 |
버전 | 서비스별 | 서비스당 최대 버전 수입니다. 한도에 도달하면 작동하지 않는 버전이 시간순으로 자동 삭제됩니다. | 1,000 | 아니요 |
버전 | 프로젝트 및 리전별 | 트래픽을 제공하는 최대 버전 수 | 4000 | 아니요 |
버전 태그 | 프로젝트 및 리전별 | 최대 버전 태그 수 버전 태그 수가 이 한도에 도달하면 트래픽 백분율이 없는 태그는 오래된 시간 순으로 자동으로 삭제됩니다. | 2000 | 아니요 |
작업 실행 | 작업당 | 완료된 작업 실행을 위한 보관 한도 작업의 완료된 실행 수가 이 한도에 도달하면 기록 순서에서 실행이 자동으로 삭제됩니다. | 1,000 | 아니요 |
작업 실행 태스크1 | 작업 실행별 | 동시에 실행되는 최대 태스크 수 | 선택한 리전, CPU 및 메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. | 예 |
작업 실행 태스크 | 작업 실행별 | 최대 태스크 제한 시간 값 | 24시간 | 아니요 |
작업 실행 태스크 | 작업 실행별 | 단일 작업의 최대 태스크 수 | 10,000 | 아니요 |
작업 실행 태스크 | 작업 실행별 | 한 작업의 최대 태스크 재시도 수 | 10 | 아니요 |
컨테이너 인스턴스1 | 버전별 | 최대 컨테이너 인스턴스 수 | 선택한 리전, CPU 및 메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. | 예 |
컨테이너 인스턴스1 | 프로젝트 및 리전별 | 실행 중인 모든 작업 실행의 최대 컨테이너 인스턴스 수 | 선택한 리전, CPU 및 메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. | 예 |
컨테이너 인스턴스2 | 버전 및 리전별 | 직접 VPC 이그레스를 사용하는 최대 컨테이너 인스턴스 수 | 선택한 리전 구성에 따라 100~200 | 예 |
컨테이너 인스턴스 | 컨테이너 인스턴스별 | 시작 제한 시간(분) | 4 | 아니요 |
메모리 | 컨테이너 인스턴스별 | 최대 메모리 크기(GiB) | 32 | 아니요 |
CPU | 컨테이너 인스턴스별 | 최대 vCPU 수 | 8 | 아니요 |
CPU | 프로젝트 및 리전별 | 1분 동안 모든 인스턴스에 할당된 최대 총 CPU입니다. | 선택한 리전에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. | 예 |
메모리 | 프로젝트 및 리전별 | 1분 동안 모든 인스턴스에 할당된 최대 총 메모리입니다. | 선택한 리전에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. | 예 |
디스크 | 컨테이너 인스턴스별 | 인스턴스 메모리에 따라 제한되는 최대 쓰기 가능 인메모리 파일 시스템(GiB) | 32 | 아니요 |
환경 변수 | 변수별 | 최대 변수 길이(KB) | 32 | 아니요 |
도메인 매핑 | 상위 도메인당, 주당 | 최대 SSL 인증서 수 | 50 | 아니요 |
도메인 매핑 | 상위 도메인당, 주당 | 최대 중복 SSL 인증서 수 | 5 | 아니요 |
액세스 토큰 | 초당 컨테이너 인스턴스별 | 생성된 고유 액세스 토큰 최대 개수 | 50 | 아니요 |
ID 토큰 | 초당 컨테이너 인스턴스별 | 생성된 고유 ID 토큰 최대 개수 | 50 | 아니요 |
열린 파일 | 컨테이너 인스턴스별 | 동시에 열 수 있는 최대 파일 수입니다. /proc/sys/fs/file-max 에 해당합니다. |
25000 | 아니요 |
1이 리전별 할당량은 다음과 같은 몇 가지 경우에 사용됩니다.
버전의 최대 인스턴스 속성에 대해 선택할 수 있는 최댓값을 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 버전에 부여된 한도까지 사용될 수 있습니다.
작업의 최대 동시 로드를 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 작업에 부여된 한도까지 사용될 수 있습니다.
한 리전에서 작업 실행을 실행하기 위한 총 컨테이너 인스턴스를 제어합니다.
2이 리전별 할당량은 다음과 같은 몇 가지 경우에 사용됩니다.
직접 VPC 이그레스를 사용하는 버전의 최대 인스턴스 속성에 대해 선택할 수 있는 최댓값을 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 버전에 부여된 한도까지 사용될 수 있습니다.
직접 VPC 이그레스를 사용하여 작업의 최대 동시 로드를 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 작업에 부여된 한도까지 사용될 수 있습니다.
Cloud Run의 네트워킹 한도
Cloud Run의 요청 한도
설명 | 한도 | 참고 |
---|---|---|
인스턴스당 최대 동시 요청 수 | 1000 | |
HTTP/2 클라이언트 연결당 최대 동시 스트림 수 | 100 | |
요청당 제한 시간까지의 최대 시간 | 60분 | |
최대 HTTP/1 요청 크기 | HTTP/1 서버를 사용하는 경우 32MiB. HTTP/2 서버를 사용하는 경우 제한 없음. | |
최대 HTTP/1 응답 크기 | Transfer-Encoding: chunked 또는 스트리밍 메커니즘을 사용하지 않는 경우 32MiB |
|
인스턴스별 초당 아웃바운드 연결 수 | 700 | |
인스턴스별 HTTP/1 컨테이너 포트에 대한 초당 인바운드 요청 수 | 800 | HTTP/2 컨테이너 포트에는 적용되지 않음 |
Cloud Run의 대역폭 한도
다음과 같은 대역폭 한도가 Cloud Run 인스턴스에 적용됩니다.
설명 | 한도 | 참고 |
---|---|---|
직접 VPC를 통한 이그레스의 인스턴스당 최대 바이트 수 | 1Gbps | VPC 네트워크에서 직접 VPC 이그레스를 통해 대상으로 이그레스합니다. |
직접 VPC를 통한 이그레스를 제외한 인스턴스당 최대 바이트 수 | 초당 75MB(MBps) | VPC 네트워크에서 대상에 대한 직접 VPC 이그레스를 통한 이그레스를 제외하고 인그레스 바이트 및 이그레스 바이트의 합계를 기반으로 합니다. |
직접 VPC를 통한 이그레스를 제외하고 인스턴스당 최대 총 패킷 속도 | 초당 패킷 64,000개 | VPC 네트워크에서 대상에 대한 직접 VPC 이그레스를 통한 이그레스를 제외한 인그레스 패킷 및 이그레스 패킷의 합계를 기반으로 합니다. |
두 한도 중 하나에 도달하면 Cloud Run 인스턴스의 대역폭이 제한됩니다.
Cloud Run Admin API 비율 제한
다음 비율 제한이 Cloud Run Admin API에 적용됩니다. 배포된 Cloud Run 서비스에 도달하는 요청에는 이 한도가 적용되지 않습니다.
할당량 | 설명 | 한도 | 상향 가능성 | 범위 |
---|---|---|---|---|
Cloud Run Admin API 읽기 요청 | 리전별 60초당 API 읽기 수입니다. 제한이 없는 Cloud Run 서비스에 대한 읽기 요청 수가 아닙니다. | 60초당 3,000회 | 예 | 프로젝트 및 리전별 |
Cloud Run Admin API 쓰기 요청 | 리전별 60초당 API 쓰기 수입니다. 제한이 없는 Cloud Run 서비스에 대한 쓰기 요청 수가 아닙니다. | 60초당 180회 | 예 | 프로젝트 및 리전별 |
작업 실행 | 리전별로 60초당 작업을 실행할 수 있는 최대 횟수입니다. | 60초당 180회 | 예 | 프로젝트 및 리전별 |
할당량을 늘리는 방법
Google Cloud 콘솔을 사용하여 할당량 값 상향을 요청하려면 다음 안내를 따르세요.
1. 할당량 및 시스템 한도 페이지로 이동합니다.할당량 열에서 상향 조정할 할당량을 찾습니다. 필터 검색창을 사용하여 할당량을 검색합니다.
할당량 왼쪽에 있는 체크박스를 선택합니다.
을 클릭합니다. 할당량 변경사항 양식이 표시됩니다. 수정 할당량 변경 양식의 새 한도 필드에 프로젝트에 사용하려는 증가된 할당량을 입력합니다.
양식의 추가 필드를 작성한 후 완료를 클릭합니다.
요청 제출을 클릭합니다.
이전 절차는 대부분의 할당량 증가 요청에 적용되지만 다음 예외 중 하나가 발생할 수 있습니다.
기존 사용량 한도가 있는 경우, 할당량을 늘리려면 먼저 사용량 한도를 삭제해야 합니다. 공개 및 동의 화면이 표시됩니다. 사용량 한도가 삭제되고 할당량의 기본 한도로 즉시 업데이트된다는 알림이 표시됩니다. 그런 후 할당량 증가 요청이 Google Cloud에서 정상적으로 처리됩니다.
경우에 따라 Google Cloud 콘솔은 한도를 늘리기 위해 별도의 양식으로 리디렉션합니다. 양식을 제출하면 Google Cloud가 이메일을 통해 요청을 확인합니다.
일부 할당량은 Google Cloud 콘솔을 사용하여 업데이트할 수 없습니다. 콘솔에서 할당량을 변경할 수 없는 경우 Cloud Customer Care에서 상향을 요청합니다. 결제팀은 할당량 조정을 처리하지 않습니다.
각 리소스 클래스에 대해 서로 다른 할당량 상향 요청을 만드는 것이 좋습니다. 예를 들어 프로젝트당 네트워크 할당량 상향 조정을 네트워크 이외의 Compute Engine 할당량 상향 조정과 분리해야 합니다. 서로 다른 클래스 요청이 결합되면 승인에 더 많은 평가 시간이 필요한 경우 한 번의 증가 요청으로 배치를 지연시킬 수 있습니다.
할당량 증가 요청에 승인이 필요한 경우 Google Cloud로부터 요청 수신 확인 이메일을 받을 수 있습니다. 추가 도움이 필요한 경우 이메일에 회신하면 됩니다. Cloud Customer Care는 일반적으로 요청을 영업일 기준 2~3일 이내에 처리합니다. 그런 다음 Cloud Customer Care에서 할당량 상향 승인 또는 거부 여부를 알려주는 두 번째 이메일을 전송합니다. 이메일에서 할당량이 상향된 시행일을 알립니다(해당하는 경우).
할당량 상향 요청 프로세스의 작동 방식에 대한 자세한 내용은 할당량 상향 요청 정보를 참조하세요.