리소스 모델

다음 다이어그램에서는 서비스에 대한 Cloud Run 리소스 모델을 보여줍니다.

Cloud Run 서비스 및 버전

이 다이어그램은 세 개의 Cloud Run 서비스(Service A, Service BService C)가 포함된 Google Cloud 프로젝트를 보여줍니다. 각 서비스에는 여러 버전이 있습니다.

이 다이어그램에서 볼 수 있듯이 Service A에는 수신되는 요청이 많기 때문에 각각 단일 컨테이너를 실행하는 여러 인스턴스가 시작 및 실행됩니다. Service B에는 현재 수신되는 요청이 없으므로 아직 인스턴스가 시작되지 않았습니다. Service C는 각 버전 내 인스턴스당 여러 컨테이너를 실행합니다. 인그레스 컨테이너만 요청을 수신합니다. 컨테이너가 여러 개인 모든 인스턴스는 독립적인 단위로 확장됩니다.

Cloud Run 서비스

이 서비스는 Cloud Run의 기본 리소스입니다. 각 서비스는 특정 Google Cloud 리전(Cloud Run)에 있습니다. 중복 및 장애 조치를 목적으로 서비스는 리전 내 여러 영역으로 자동 복제됩니다. 지정된 Google Cloud 프로젝트가 서로 다른 리전에서 여러 서비스를 실행할 수 있습니다.

각 서비스는 고유한 엔드포인트를 노출하고 기본 인프라를 자동으로 확장하여 수신 요청을 처리합니다.

Cloud Run 버전

서비스에 배포할 때마다 버전이 생성됩니다. 버전은 하나 이상의 컨테이너 이미지와 환경 변수, 메모리 한도, 동시 실행 값과 같은 환경 설정으로 구성됩니다.

버전은 변경할 수 없습니다. 버전이 생성된 후에는 이를 수정할 수 없습니다. 예를 들어 새 Cloud Run 서비스에 컨테이너 이미지를 배포하면 첫 번째 버전이 생성됩니다. 그런 다음 동일한 서비스에 다른 컨테이너 이미지를 배포하면 두 번째 버전이 생성됩니다. 이후에 환경 변수를 설정하면 세 번째 버전이 생성됩니다.

요청은 최근에 생성된 정상적인 서비스 버전으로 최대한 빨리 자동으로 라우팅됩니다.

Cloud Run 작업

각 작업은 특정 Google Cloud 리전에 있고 하나 이상의 컨테이너를 완료될 때까지 실행합니다. 작업은 지정된 작업 실행에서 병렬로 실행되는 하나 이상의 독립된 태스크로 구성됩니다. 각 태스크는 하나의 컨테이너를 실행하고 이를 재시도할 수 있습니다.

Cloud Run 작업 실행

작업이 실행되면 모든 작업 태스크가 시작되는 작업 실행이 생성됩니다. 작업이 성공적으로 실행될 수 있으려면 작업 하나에서 모든 태스크가 성공적으로 실행되어야 합니다. 태스크에 제한 시간을 설정하고 태스크가 실패할 경우 재시도 횟수를 지정할 수 있습니다. 최대 재시도 횟수를 초과하는 태스크는 실패로 표시되고 작업도 실패로 표시됩니다. 기본적으로 태스크는 최대 100까지 병렬로 실행되지만 지원 리소스에 필요한 경우 더 낮은 최댓값을 지정할 수 있습니다.

Cloud Run 인스턴스

요청을 수신하는 각 버전은 이러한 모든 요청을 처리하는 데 필요한 인스턴스 수로 자동 확장됩니다. 한 인스턴스 내의 인그레스 컨테이너가 동시에 여러 요청을 수신할 수 있습니다. 동시 실행 설정을 사용하면 특정 인스턴스에 동시에 전송할 수 있는 최대 요청 수를 설정할 수 있습니다.