Cloud Run 할당량 및 한도

이 페이지에는 Cloud Run 사용 시 적용되는 사용 할당량 및 한도가 나와 있습니다.

Cloud Run 리소스 수는 제한되어 있습니다. Cloud Run 할당량에는 Cloud Run Admin API를 호출할 수 있는 비율에 영향을 주는 API 비율 제한이 포함됩니다.

다음 사항에 대한 직접적인 한도는 없습니다.

  • 배포할 수 있는 컨테이너 이미지의 크기
  • Cloud Run 서비스에서 제공하는 동시 요청의 수

Cloud Run의 리소스 한도

리소스 설명 한도 상향 가능성 범위
서비스 최대 서비스 수 1,000 없음 프로젝트 및 리전별
작업 최대 작업 수 1,000 없음 프로젝트 및 리전별
버전 서비스당 최대 버전 수 한도에 도달하면 작동하지 않는 버전이 시간순으로 자동 삭제됩니다. 1,000 없음 서비스별
버전 트래픽을 제공하는 최대 버전 수 4,000 없음 프로젝트 및 리전별
버전 태그 최대 버전 태그 수 2,000 없음 프로젝트 및 리전별
작업 실행 완료된 작업 실행의 보관 한도 작업의 완료된 실행 수가 이 한도에 도달하면 실행 내역이 이전 순서로 자동 삭제됩니다. 1,000 없음 작업당
작업 실행 태스크1 동시에 실행되는 최대 태스크 수 1개의 CPU 및 2GiB 메모리를 사용하는 경우 2,000개이며 CPU 및 메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. 있음 작업 실행별
작업 실행 태스크 최대 태스크 제한 시간 값 1시간 없음 작업 실행별
작업 실행 태스크 단일 작업의 최대 태스크 수 10,000 없음 작업 실행별
작업 실행 태스크 한 작업의 최대 태스크 재시도 수 10 없음 작업 실행별
컨테이너 인스턴스1 최대 컨테이너 인스턴스 수 선택한 리전, CPU 및 메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. 있음 버전별
컨테이너 인스턴스1 실행 중인 모든 작업 실행의 최대 컨테이너 인스턴스 수 1개의 CPU 및 2GiB 메모리를 사용하는 경우 2,000개이며 CPU 및 메모리 구성에 따라 다릅니다. 이 한도는 대용량 리전에서 더 높을 수 있으며 최근에 열린 리전의 경우 더 낮을 수 있습니다. 있음 프로젝트 및 리전별
컨테이너 인스턴스 시작 제한 시간(분) 4 없음 컨테이너 인스턴스별
컨테이너 인스턴스 초당 아웃바운드 연결 700 없음 컨테이너 인스턴스별
컨테이너 인스턴스 HTTP/1 컨테이너 포트에 대한 초당 인바운드 요청(HTTP/2 컨테이너 포트에는 적용되지 않음) 800 없음 컨테이너 인스턴스별
메모리 최대 메모리 크기(GiB) 32 없음 컨테이너 인스턴스별
CPU 최대 vCPU 수 8 없음 컨테이너 인스턴스별
디스크 인스턴스 메모리에 따라 제한되는 최대 쓰기 가능 인메모리 파일 시스템(GiB) 32 없음 컨테이너 인스턴스별
환경 변수 최대 변수 길이(KB) 32 없음 변수별
요청 최대 동시 요청 수 1,000 없음 컨테이너 인스턴스별
요청 최대 동시 스트림 수 100 없음 HTTP/2 클라이언트 연결별
요청 시간 초과 전 최대 시간(분) 60 없음 요청별
요청 최대 HTTP/1 요청 크기(MiB) HTTP/1 서버를 사용하는 경우 32. HTTP/2 서버를 사용하는 경우 제한 없음. 없음 요청별
응답 최대 HTTP/1 응답 크기(MiB) 32(Transfer-Encoding: chunked 또는 스트리밍 메커니즘을 사용하지 않는 경우) 없음 응답별
도메인 매핑 최대 SSL 인증서 수 50 없음 상위 도메인당, 주당
도메인 매핑 최대 중복 SSL 인증서 수 5 없음 상위 도메인당, 주당
액세스 토큰 생성된 고유 액세스 토큰 최대 개수 50 없음 초당 컨테이너 인스턴스별
ID 토큰 생성된 고유 ID 토큰 최대 개수 50 없음 초당 컨테이너 인스턴스별

1이 리전 할당량은 다음과 같은 경우에 사용됩니다.

  1. 버전의 최대 인스턴스 속성에 대해 선택할 수 있는 최댓값을 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 버전에 부여된 한도까지 사용될 수 있습니다.

  2. 작업의 최대 동시 로드를 제어합니다. 특정 리전에 부여된 다음에는 해당 리전의 모든 작업에 부여된 한도까지 사용될 수 있습니다.

  3. 한 리전에서 작업 실행을 실행하기 위한 총 컨테이너 인스턴스를 제어합니다.

참고: 이 할당량이 작업에 사용되는 경우 먼저 값을 5로 나눕니다.

Cloud Run Admin API 비율 제한

다음 비율 제한이 Cloud Run Admin API에 적용됩니다. 배포된 Cloud Run 서비스에 도달하는 요청에는 이 한도가 적용되지 않습니다.

할당량 설명 한도 상향 가능 여부 범위
Cloud Run Admin API 읽기 요청 프로젝트별 60초당 API 읽기 수입니다. 제한이 없는 Cloud Run 서비스에 대한 읽기 요청 수가 아닙니다. 60초당 1,200 있음 리전
Cloud Run Admin API 쓰기 요청 프로젝트별 60초당 API 쓰기 수입니다. 제한이 없는 Cloud Run 서비스에 대한 쓰기 요청 수가 아닙니다. 60초당 60 있음 리전
작업 실행 리전별로 분당 실행될 수 있는 작업의 최대 횟수입니다. 10 있음 프로젝트 및 리전별

할당량을 늘리는 방법

이 페이지에 나열된 기본값보다 할당량을 늘리려면 다음 안내를 따르세요.

  1. Cloud Run 할당량 페이지로 이동합니다.

  2. 적용 가능한 리전을 수정할 할당량을 선택하고 할당량 수정을 클릭합니다.

  3. 메시지가 표시되면 사용자 정보를 입력하고 선택한 각 할당량에 대하여 새 할당량 한도를 입력합니다.

선택한 리전에서 Cloud Run이 사용 사례를 처리할 수 있도록 요청이 지원팀에 라우팅됩니다. 요청이 부여되기 전 구성에 대한 세부정보 및 예상 트래픽 패턴을 제공해야 할 수 있습니다. 대규모 증가 요청은 처리하는 데 다소 시간이 걸릴 수 있습니다.