이 페이지에는 Cloud Run 사용 시 적용되는 사용 할당량 및 한도가 나와 있습니다.
Cloud Run 리소스 수는 제한되어 있습니다. Cloud Run 할당량에는 Cloud Run Admin API를 호출할 수 있는 비율에 영향을 주는 API 비율 제한이 포함됩니다.
다음 사항에 대한 직접적인 한도는 없습니다.
- 배포할 수 있는 컨테이너 이미지의 크기
- Cloud Run 서비스에서 제공하는 동시 요청의 수
Cloud Run의 리소스 한도
늘릴 수 있는 한도를 초과하려면 할당량 상향을 요청하세요. 늘릴 수 없는 프로젝트별 한도를 초과하려면 다른 Google Cloud 프로젝트 또는 리전에서 새 리소스를 만드세요.
리소스 | 범위 | 설명 | 한도 | 상향 가능성 |
---|---|---|---|---|
서비스 | 프로젝트 및 리전별 | 최대 서비스 수 | 1000 | 아니요 |
작업 | 프로젝트 및 리전별 | 최대 작업 수 | 1000 | 아니요 |
작업 실행 | 프로젝트 및 리전별 | 실행 중인 최대 작업 실행 수 | 1000 | 아니요 |
버전 | 서비스별 | 서비스당 최대 버전 수입니다. 한도에 도달하면 작동하지 않는 버전이 시간순으로 자동 삭제됩니다. | 1000 | 아니요 |
버전 | 프로젝트 및 리전별 | 트래픽을 제공하는 최대 버전 수 | 4000 | 아니요 |
버전 태그 | 프로젝트 및 리전별 | 최대 버전 태그 수 버전 태그 한도가 초과되면 Cloud Run은 서비스에서 태그 정리를 실행합니다. 새 태그가 생성되는 서비스에서 지정된 트래픽 백분율에 미달하는 태그는 시간순으로 자동 삭제됩니다. | 2000 | 아니요 |
작업 실행 | 작업당 | 완료된 작업 실행을 위한 보관 한도 작업의 완료된 실행 수가 이 한도에 도달하면 기록 순서에서 실행이 자동으로 삭제됩니다. | 1,000 | 아니요 |
작업 실행 태스크1 | 작업 실행별 | 동시에 실행되는 최대 태스크 수 | 선택한 리전, CPU 및 메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. | 예 |
작업 실행 태스크 | 작업 실행별 | 최대 태스크 제한 시간 값 | 24시간 | 아니요 |
작업 실행 태스크 | 작업 실행별 | 단일 작업의 최대 태스크 수 | 10,000 | 아니요 |
작업 실행 태스크 | 작업 실행별 | 한 작업의 최대 태스크 재시도 수 | 10 | 아니요 |
환경 변수 | 작업별 또는 서비스별 | 컨테이너당 최대 환경 변수 수 | 1000 | 아니요 |
명령 인수 | 작업별 또는 서비스별 | 컨테이너당 최대 명령어 인수 수 | 1000 | 아니요 |
컨테이너 인스턴스1 | 버전별 | 최대 컨테이너 인스턴스 수 | 선택한 리전, CPU 및 메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. | 예 |
컨테이너 인스턴스1 | 프로젝트 및 리전별 | 실행 중인 모든 작업 실행의 최대 컨테이너 인스턴스 수 | 선택한 리전, CPU 및 메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. | 예 |
컨테이너 인스턴스2 | 버전 및 리전별 | 직접 VPC 이그레스를 사용하는 최대 컨테이너 인스턴스 수 | 선택한 리전 구성에 따라 100~200 | 예 |
컨테이너 인스턴스 | 컨테이너 인스턴스별 | 시작 제한 시간(분) | 4 | 아니요 |
메모리 | 컨테이너 인스턴스별 | 최대 메모리 크기(GiB) | 32 | 아니요 |
CPU | 컨테이너 인스턴스별 | 최대 vCPU 수 | 8 | 아니요 |
CPU | 프로젝트 및 리전별 | 1분 동안 모든 인스턴스에 할당된 최대 총 CPU(밀리 vCPU)입니다. | 선택한 리전에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. | 예 |
메모리 | 프로젝트 및 리전별 | 1분 동안 모든 인스턴스에 할당된 최대 총 메모리(바이트)입니다. | 선택한 리전에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. | 예 |
GPU 인스턴스3 | 리전별 프로젝트당 | GPU가 있는 최대 컨테이너 인스턴스 수 | 03 | 예 |
디스크 | 컨테이너 인스턴스별 | 인스턴스 메모리에 따라 제한되는 최대 쓰기 가능 인메모리 파일 시스템(GiB) | 32 | 아니요 |
환경 변수 | 변수별 | 최대 변수 길이(KB) | 32 | 아니요 |
도메인 매핑 | 상위 도메인당, 주당 | 최대 SSL 인증서 수 | 50 | 아니요 |
도메인 매핑 | 상위 도메인당, 주당 | 최대 중복 SSL 인증서 수 | 5 | 아니요 |
액세스 토큰 | 초당 컨테이너 인스턴스별 | 생성된 고유 액세스 토큰 최대 개수 | 50 | 아니요 |
ID 토큰 | 초당 컨테이너 인스턴스별 | 생성된 고유 ID 토큰 최대 개수 | 50 | 아니요 |
열린 파일 | 컨테이너 인스턴스별 | 동시에 열 수 있는 최대 파일 수입니다. /proc/sys/fs/file-max 에 해당합니다. |
25000 | 아니요 |
1이 리전별 할당량은 다음과 같은 몇 가지 경우에 사용됩니다.
버전의 최대 인스턴스 속성에 대해 선택할 수 있는 최댓값을 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 버전에 부여된 한도까지 사용될 수 있습니다.
작업의 최대 동시 로드를 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 작업에 부여된 한도까지 사용될 수 있습니다.
한 리전에서 작업 실행을 실행하기 위한 총 컨테이너 인스턴스를 제어합니다.
2이 리전별 할당량은 다음과 같은 몇 가지 경우에 사용됩니다.
직접 VPC 이그레스를 사용하는 버전의 최대 인스턴스 속성에 대해 선택할 수 있는 최댓값을 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 버전에 부여된 한도까지 사용될 수 있습니다.
직접 VPC 이그레스를 사용하여 작업의 최대 동시 처리를 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 작업에 부여된 한도까지 사용될 수 있습니다.
3
GPU에 액세스하려면 Total Nvidia L4 GPU allocation, per project per region
에 대한 할당량 증가를 요청해야 합니다.
Cloud Run의 네트워킹 한도
Cloud Run의 요청 한도
설명 | 한도 | 참고 |
---|---|---|
인스턴스당 최대 동시 요청 수 | 1000 | |
HTTP/2 클라이언트 연결당 최대 동시 스트림 수 | 100 | |
요청당 제한 시간까지의 최대 시간 | 60분 | |
최대 HTTP/1 요청 크기 | HTTP/1 서버를 사용하는 경우 32MiB. HTTP/2 서버를 사용하는 경우 제한 없음. | |
최대 HTTP/1 응답 크기 | Transfer-Encoding: chunked 또는 스트리밍 메커니즘을 사용하지 않는 경우 32MiB |
|
인스턴스별 초당 아웃바운드 연결 수 | 700 | |
인스턴스별 초당 아웃바운드 DNS 변환 수 | 1000 | |
인스턴스별 HTTP/1 컨테이너 포트에 대한 초당 인바운드 요청 수 | 800 | HTTP/2 컨테이너 포트에는 적용되지 않음 |
Cloud Run의 대역폭 한도
다음과 같은 대역폭 한도가 Cloud Run 인스턴스에 적용됩니다.
설명 | 한도 | 참고 |
---|---|---|
직접 VPC를 통한 이그레스의 인스턴스당 최대 비트 수 | 1Gbps | VPC 네트워크에서 직접 VPC 이그레스를 통해 대상으로 이그레스합니다. |
직접 VPC를 통한 이그레스를 제외한 인스턴스당 최대 비트 수 | 600Mbps | VPC 네트워크에서 대상에 대한 직접 VPC 이그레스를 통한 이그레스를 제외한 인그레스 및 이그레스 비트의 합계를 기반으로 합니다. |
직접 VPC를 통한 이그레스를 제외하고 인스턴스당 최대 총 패킷 속도 | 초당 패킷 64,000개 | VPC 네트워크에서 대상에 대한 직접 VPC 이그레스를 통한 이그레스를 제외한 인그레스 패킷 및 이그레스 패킷의 합계를 기반으로 합니다. |
두 한도 중 하나에 도달하면 Cloud Run 인스턴스의 대역폭이 제한됩니다.
Cloud Run Admin API 비율 제한
다음 비율 제한이 Cloud Run Admin API에 적용됩니다. 배포된 Cloud Run 서비스에 도달하는 요청에는 이 한도가 적용되지 않습니다.
할당량 | 설명 | 한도 | 상향 가능성 | 범위 |
---|---|---|---|---|
Cloud Run Admin API 읽기 요청 | 리전별 60초당 API 읽기 수입니다. 제한이 없는 Cloud Run 서비스에 대한 읽기 요청 수가 아닙니다. | 60초당 3,000회 | 예 | 프로젝트 및 리전별 |
Cloud Run Admin API 쓰기 요청 | 리전별 60초당 API 쓰기 수입니다. 제한이 없는 Cloud Run 서비스에 대한 쓰기 요청 수가 아닙니다. | 60초당 180회 | 예 | 프로젝트 및 리전별 |
작업 실행 | 리전별로 60초당 작업을 실행할 수 있는 최대 횟수입니다. | 60초당 180회 | 예 | 프로젝트 및 리전별 |
할당량을 늘리는 방법
더 높은 할당량 값을 요청하려면 다음 단계를 따르세요.할당량 및 시스템 한도 페이지로 이동합니다.
할당량 열에서 상향 조정할 할당량을 찾습니다. 필터 검색창을 사용하여 할당량을 검색할 수 있습니다.
늘리려는 할당량 옆에 있는 체크박스를 선택합니다.
을 클릭합니다. 할당량 변경사항 대화상자가 표시됩니다. 수정 선택사항: 화면에 표시된 숫자보다 할당량 값을 늘리려면 더 큰 할당량 신청을 선택합니다. 양식을 작성하고 제출한 후 나머지 단계를 건너뜁니다.
할당량 변경 양식의 새 값 필드에 원하는 증가된 할당량을 입력합니다. 요청 설명 필드가 표시되면 설명을 입력합니다. 완료를 클릭합니다.
'이 요청이 모든 재정의를 삭제함을 이해합니다.'라는 텍스트가 포함된 체크박스가 표시되면 할당량 값이 기본값보다 낮게 설정된 것입니다. 할당량 값을 기본값 이상으로 조정하면 재정의가 삭제됩니다. 계속하려면 체크박스를 선택합니다. 할당량 재정의 자세히 알아보기
다음 버튼이 표시되면 다음을 클릭하고 다음 화면에서 연락처 세부정보를 작성합니다.
요청 제출을 클릭합니다.
콘솔에서 조정을 요청할 수 없는 경우 Cloud Customer Care에서 상향을 요청합니다.
Cloud Quotas 조정 요청은 검토 대상입니다. 할당량 조정 요청에 검토가 필요한 경우 요청 접수 확인 이메일이 전송됩니다. 추가 지원이 필요한 경우 이 이메일에 회신해 주세요. 요청이 검토되면 요청이 승인되었는지 여부를 나타내는 이메일 알림이 전송됩니다.
할당량 상향 요청 프로세스의 작동 방식에 대한 자세한 내용은 할당량 상향 요청 정보를 참조하세요.
더 높은 할당량 값을 위한 요청 일괄 처리
포함하려는 각 할당량 옆의 체크박스를 선택하여 더 높은 할당량을 일괄 요청할 수 있습니다. 요청을 일괄 처리하면 Google Cloud에서 요청을 검토하는 데 걸리는 시간이 늘어날 수 있습니다. 검토 시간을 줄이기 위해 할당량 조정 요청을 제품 및 영역별로 그룹화합니다. 예를 들어 네트워킹 및 Compute Engine VM 할당량 조정을 요청하려면 네트워킹 할당량 요청 하나와 Compute Engine VM 할당량 요청 하나를 만듭니다.