리소스 모델

컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

다음 다이어그램에서는 서비스에 대한 Cloud Run 리소스 모델을 보여줍니다.

Cloud Run 서비스 및 버전

이 다이어그램은 두 개의 Cloud Run 서비스(Service AService B)가 포함된 Google Cloud 프로젝트를 보여줍니다. 각 서비스에는 여러 버전이 있습니다.

이 다이어그램에서 볼 수 있듯이 Service A에는 수신되는 요청이 많기 때문에 여러 컨테이너 인스턴스가 시작되고 실행되고 있습니다. Service B에는 현재 수신되는 요청이 없으므로 아직 컨테이너 인스턴스가 시작되지 않았습니다.

Cloud Run 서비스

이 서비스는 Cloud Run의 기본 리소스입니다. 각 서비스는 특정 GCP 리전(Cloud Run)에 있습니다. 중복 및 장애 조치를 목적으로 서비스는 리전 내 여러 영역으로 자동 복제됩니다. 특정 GCP 프로젝트는 여러 리전에서 많은 서비스를 실행할 수 있습니다.

각 서비스는 고유한 엔드포인트를 노출하고 기본 인프라를 자동으로 확장하여 수신 요청을 처리합니다.

Cloud Run 버전

서비스에 배포할 때마다 버전이 생성됩니다. 버전은 특정 컨테이너 이미지 외에 환경 변수, 메모리 한도, 동시 실행 값과 같은 환경 설정으로 구성됩니다.

버전은 변경할 수 없습니다. 버전이 생성된 후에는 이를 수정할 수 없습니다. 예를 들어 새 Cloud Run 서비스에 컨테이너 이미지를 배포하면 첫 번째 버전이 생성됩니다. 그런 다음 동일한 서비스에 다른 컨테이너 이미지를 배포하면 두 번째 버전이 생성됩니다. 이후에 환경 변수를 설정하면 세 번째 버전이 생성됩니다.

요청은 최근에 생성된 정상적인 서비스 버전으로 최대한 빨리 자동으로 라우팅됩니다.

Cloud Run 작업

각 작업은 특정 Google Cloud 리전에 있고 하나 이상의 컨테이너를 완료될 때까지 실행합니다. 작업은 지정된 작업 실행에서 병렬로 실행되는 하나 이상의 독립된 태스크로 구성됩니다. 각 태스크는 하나의 컨테이너 인스턴스를 실행하고 이를 재시도할 수 있습니다.

Cloud Run 작업 실행

작업이 실행되면 모든 작업 태스크가 시작되는 작업 실행이 생성됩니다. 작업이 성공적으로 실행될 수 있으려면 작업 하나에서 모든 태스크가 성공적으로 실행되어야 합니다. 태스크에 제한 시간을 설정하고 태스크가 실패할 경우 재시도 횟수를 지정할 수 있습니다. 최대 재시도 횟수를 초과하는 태스크는 실패로 표시되고 작업도 실패로 표시됩니다. 기본적으로 태스크는 최대 100까지 병렬로 실행되지만 지원 리소스에 필요한 경우 더 낮은 최댓값을 지정할 수 있습니다.

Cloud Run 컨테이너 인스턴스

요청을 수신하는 각 버전은 이러한 모든 요청을 처리하는 데 필요한 컨테이너 인스턴스 수로 자동 확장됩니다. 즉, 컨테이너 인스턴스 한 개가 동시에 여러 요청을 처리할 수 있습니다. 동시 실행 설정을 사용하면 특정 컨테이너 인스턴스에 동시에 전송할 수 있는 최대 요청 수를 설정할 수 있습니다.