Cloud Run 할당량 및 한도

이 페이지에는 Cloud Run 사용 시 적용되는 사용 할당량 및 한도가 나와 있습니다.

Cloud Run 리소스 수는 제한되어 있습니다. Cloud Run 할당량에는 Cloud Run Admin API를 호출할 수 있는 비율에 영향을 주는 API 비율 제한이 포함됩니다.

다음 사항에 대한 직접적인 한도는 없습니다.

  • 배포할 수 있는 컨테이너 이미지의 크기
  • Cloud Run 서비스에서 제공하는 동시 요청의 수

Cloud Run의 리소스 한도

리소스 설명 한도 상향 가능성 범위
서비스 최대 서비스 수 1,000 없음 프로젝트 및 리전별
작업 최대 작업 수 1,000 없음 프로젝트 및 리전별
서비스 및 작업 실행 최대 서비스 및 작업 실행 수 1,000 없음 프로젝트 및 리전별
버전 서비스당 최대 버전 수 한도에 도달하면 작동하지 않는 버전이 시간순으로 자동 삭제됩니다. 1,000 아니요 서비스별
버전 및 작업 실행 트래픽을 제공하고 작업 실행을 실행하는 최대 버전 수 4000 없음 프로젝트 및 리전별
버전 태그 최대 버전 태그 수 2,000 없음 프로젝트 및 리전별
작업 실행 완료된 작업 실행의 보관 한도 작업의 완료된 실행 수가 이 한도에 도달하면 실행 내역이 이전 순서로 자동 삭제됩니다. 1,000 없음 작업당
작업 실행 태스크1 동시에 실행되는 최대 태스크 수 선택한 리전, CPU메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. 작업 실행별
작업 실행 태스크 최대 태스크 제한 시간 값 24시간 없음 작업 실행별
작업 실행 태스크 단일 작업의 최대 태스크 수 10,000 없음 작업 실행별
작업 실행 태스크 한 작업의 최대 태스크 재시도 수 10 없음 작업 실행별
컨테이너 인스턴스1 최대 컨테이너 인스턴스 수 선택한 리전, CPU 및 메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. 버전별
컨테이너 인스턴스1 실행 중인 모든 작업 실행의 최대 컨테이너 인스턴스 수 선택한 리전, CPU메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. 프로젝트 및 리전별
컨테이너 인스턴스2 직접 VPC 이그레스를 사용하는 최대 컨테이너 인스턴스 수 선택한 리전 구성에 따라 100~200개 버전 및 리전별
컨테이너 인스턴스 시작 제한 시간(분) 4 아니요 컨테이너 인스턴스별
메모리 최대 메모리 크기(GiB) 32 없음 컨테이너 인스턴스별
CPU 최대 vCPU 수 8 없음 컨테이너 인스턴스별
디스크 인스턴스 메모리에 따라 제한되는 최대 쓰기 가능 인메모리 파일 시스템(GiB) 32 없음 컨테이너 인스턴스별
환경 변수 최대 변수 길이(KB) 32 아니요 변수별
도메인 매핑 최대 SSL 인증서 수 50 아니요 상위 도메인당, 주당
도메인 매핑 최대 중복 SSL 인증서 수 5 아니요 상위 도메인당, 주당
액세스 토큰 생성된 고유 액세스 토큰 최대 개수 50 아니요 초당 컨테이너 인스턴스별
ID 토큰 생성된 고유 ID 토큰 최대 개수 50 아니요 초당 컨테이너 인스턴스별

1이 리전 할당량은 다음과 같은 몇 가지 경우에 사용됩니다.

  1. 버전의 최대 인스턴스 속성에 대해 선택할 수 있는 최댓값을 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 버전에 부여된 한도까지 사용될 수 있습니다.

  2. 작업의 최대 동시 로드를 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 작업에 부여된 한도까지 사용될 수 있습니다.

  3. 한 리전에서 작업 실행을 실행하기 위한 총 컨테이너 인스턴스를 제어합니다.

2이 리전 할당량은 다음과 같은 몇 가지 경우에 사용됩니다.

  1. 직접 VPC 이그레스를 사용하여 버전의 최대 인스턴스 속성에 대해 선택할 수 있는 최댓값을 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 버전에 부여된 한도까지 사용될 수 있습니다.

  2. 직접 VPC 이그레스를 사용하여 작업의 최대 동시 로드를 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 작업에 부여된 한도까지 사용될 수 있습니다.

Cloud Run의 네트워킹 한도

Cloud Run의 요청 한도

설명 한도 참고
인스턴스당 최대 동시 요청 수 1,000
HTTP/2 클라이언트 연결당 최대 동시 스트림 수 100
요청당 제한 시간까지의 최대 시간 60분
최대 HTTP/1 요청 크기 HTTP/1 서버를 사용하는 경우 32MiB. HTTP/2 서버를 사용하는 경우 제한 없음.
최대 HTTP/1 응답 크기 Transfer-Encoding: chunked 또는 스트리밍 메커니즘을 사용하지 않는 경우 32MiB
인스턴스별 초당 아웃바운드 연결 수 700
인스턴스별 HTTP/1 컨테이너 포트에 대한 초당 인바운드 요청 수 800 HTTP/2 컨테이너 포트에는 적용되지 않음

Cloud Run의 대역폭 한도

다음 대역폭 한도는 Cloud Run 인스턴스에 적용됩니다.

설명 한도 참고
인스턴스당 최대 바이트 초당 75MB(MBps) 이 한도는 VPC 네트워크 대상으로의 직접 VPC 이그레스를 제외한 인그레스 바이트와 이그레스 바이트의 합계를 기준으로 합니다.
인스턴스당 최대 총 패킷 속도 초당 패킷 64,000개 이 한도는 VPC 네트워크 대상으로의 직접 VPC 이그레스를 제외한 인그레스 패킷과 이그레스 패킷의 합계를 기준으로 합니다.

두 한도 중 하나에 도달하면 Cloud Run 인스턴스의 대역폭이 제한됩니다.

Cloud Run Admin API 비율 제한

다음 비율 제한이 Cloud Run Admin API에 적용됩니다. 배포된 Cloud Run 서비스에 도달하는 요청에는 이 한도가 적용되지 않습니다.

할당량 설명 한도 상향 가능성 범위
Cloud Run Admin API 읽기 요청 리전별 60초당 API 읽기 수입니다. 제한이 없는 Cloud Run 서비스에 대한 읽기 요청 수가 아닙니다. 60초당 3,000회 프로젝트 및 리전별
Cloud Run Admin API 쓰기 요청 리전별 60초당 API 쓰기 수입니다. 제한이 없는 Cloud Run 서비스에 대한 쓰기 요청 수가 아닙니다. 60초당 180회 프로젝트 및 리전별
작업 실행 리전별 60초당 최대 작업 실행 횟수입니다. 60초당 180회 프로젝트 및 리전별

할당량을 늘리는 방법

Google Cloud 콘솔을 사용하여 할당량 값 상향을 요청하려면 다음 안내를 따르세요.

  1. 할당량 페이지로 이동합니다.

    할당량으로 이동

    나머지 단계는 Google Cloud 콘솔에서 자동으로 표시됩니다.

  2. 할당량 페이지의 할당량 열에서 늘릴 할당량을 찾습니다.

    필터 검색창을 사용하여 할당량을 검색할 수 있습니다.

  3. 할당량 왼쪽에 있는 체크박스를 선택합니다.

  4. 할당량 수정을 클릭합니다. 할당량 변경사항 양식이 표시됩니다.

  5. 할당량 변경 양식의 새 한도 필드에 프로젝트에 사용하려는 증가된 할당량을 입력합니다.

  6. 양식의 추가 필드를 작성한 후 완료를 클릭합니다.

  7. 요청 제출을 클릭합니다.

이전 절차는 대부분의 할당량 증가 요청에 적용되지만 다음 예외 중 하나가 발생할 수 있습니다.

  • 기존 사용량 한도가 있는 경우, 할당량을 늘리려면 먼저 사용량 한도를 삭제해야 합니다. 알림 및 동의 화면이 표시됩니다. 사용량 한도가 삭제되고 할당량의 기본 한도로 즉시 업데이트된다는 알림이 표시됩니다. 그런 후 할당량 증가 요청이 Google Cloud에서 정상적으로 처리됩니다.
  • 경우에 따라 Google Cloud 콘솔은 한도를 늘리기 위해 별도의 양식으로 리디렉션합니다. 양식을 제출하면 Google Cloud가 이메일을 통해 요청을 확인합니다.
  • 일부 할당량은 Google Cloud Console을 사용하여 업데이트할 수 없습니다. 콘솔에서 할당량을 변경할 수 없는 경우 Cloud Customer Care에서 상향을 요청합니다. 결제팀은 할당량 한도 증가를 처리하지 않습니다.

각 리소스 클래스에 대해 서로 다른 할당량 상향 요청을 만드는 것이 좋습니다. 예를 들어 프로젝트당 네트워크 할당량 증가를 네트워크 이외의 Compute Engine 할당량 증가와 분리해야 합니다. 서로 다른 클래스 요청이 결합되면 승인에 더 많은 평가 시간이 필요한 경우 한 번의 증가 요청으로 배치를 지연시킬 수 있습니다.

할당량 증가 요청에 승인이 필요한 경우 Google Cloud로부터 요청 수신 확인 이메일을 받을 수 있습니다. 추가 도움이 필요한 경우 이메일에 회신하면 됩니다. Cloud Customer Care는 일반적으로 요청을 영업일 기준 2~3일 이내에 처리합니다. 그런 다음 Cloud Customer Care에서 할당량 상향 승인 또는 거부 여부를 알려주는 두 번째 이메일을 전송합니다. 이메일에서 할당량이 상향된 시행일을 알립니다(해당하는 경우).

할당량 상향 요청 프로세스의 작동 방식에 대한 자세한 내용은 할당량 상향 요청 정보를 참조하세요.