컨테이너 이미지 배포
Cloud Run은 여러 가지 배포 옵션을 제공합니다. 모든 배포 옵션의 결과는 Cloud Run의 확장성 높은 완전 관리형 인프라에서 Cloud Run 서비스, 작업 또는 작업자 풀로 실행되는 컨테이너 이미지입니다.
배포 가능한 컨테이너 이미지
Cloud Run의 컨테이너 런타임 계약을 준수하는 모든 컨테이너 이미지를 Cloud Run 서비스, 작업 또는 작업자 풀에 배포할 수 있습니다.
소스 코드에서 배포
편의를 위해 Cloud Run에서는 단일 명령어로 소스 코드를 빌드하고 배포할 수 있습니다. 자세한 내용은 소스 코드에서 서비스 배포 및 소스 코드에서 작업자 풀 배포를 참조하세요.
소스 코드에서 배포할 때 Cloud Build는 코드를 Artifact Registry에 저장된 컨테이너 이미지로 변환합니다. Dockerfile
을 포함하거나 지원되는 언어 런타임 중 하나를 사용하는 소스 코드를 배포할 수 있습니다.
함수
클라우드 인프라와 서비스에서 발생하는 이벤트에 응답하는 단일 목적 함수를 배포할 수 있습니다. 감시 이벤트가 발생하면 Cloud Run이 함수를 트리거합니다.
함수 배포는 함수 코드만 제공하면 되는 특수한 유형의 소스 코드 배포입니다. 다양한 지원 프로그래밍 언어를 사용하여 Cloud Run 함수를 작성할 수 있습니다.
함수를 배포하면 Cloud Run 서비스가 생성됩니다.
git에서 지속적 소스 코드 배포
Cloud Run을 사용하면 Git에서 지속적 배포를 구성할 수 있습니다.
소스 배포와 마찬가지로 Dockerfile
을 포함하거나 지원되는 언어 런타임 중 하나로 작성된 소스 코드를 배포할 수 있습니다.
Git에서의 지속적 배포는 Cloud Run 서비스에 사용할 수 있습니다. Cloud Run 작업의 경우 Cloud Build에서 수동으로 구성할 수 있습니다.
Cloud Run 서비스
서비스는 Cloud Run의 기본 리소스 중 하나입니다. 각 서비스는 특정 Google Cloud 리전에 있습니다. 중복 및 장애 조치를 제공하기 위해 Cloud Run은 리전 내 여러 영역에 서비스를 자동으로 복제합니다. 지정된 Google Cloud 프로젝트는 여러 리전에서 다양한 서비스를 실행할 수 있습니다.
각 서비스는 고유한 엔드포인트를 노출합니다. 기본적으로 Cloud Run은 수신 요청을 처리하기 위해 자동으로 확장됩니다. 필요한 경우 확장 동작을 수동 확장으로 변경할 수 있습니다. 컨테이너, 저장소 또는 소스 코드에서 서비스를 배포할 수 있습니다.
다음 다이어그램에서는 서비스에 대한 Cloud Run 리소스 모델을 보여줍니다.
이 다이어그램은 서비스마다 버전이 여러 개 있는 Cloud Run 서비스 3개(서비스 A, 서비스 B, 서비스 C)가 포함된 Google Cloud 프로젝트를 보여줍니다.
서비스 A에 여러 요청이 들어오므로 Cloud Run이 부하를 처리하기 위해 여러 인스턴스를 시작했습니다. 이러한 각 인스턴스는 하나의 컨테이너(애플리케이션의 컨테이너)만 실행합니다.
서비스 B에는 요청이 없으므로 유휴 상태이며 Cloud Run은 애플리케이션의 사본을 실행하지 않습니다.
서비스 C에 요청이 있으며 여러 인스턴스를 만들어 부하를 처리하도록 확장되었습니다. 각 인스턴스에는 여러 컨테이너가 포함되어 있으며 독립적인 세트로 작동합니다. 각 세트에서 인그레스 컨테이너만 요청을 수신하지만 다른 컨테이너는 요청을 처리하는 데 도움이 됩니다.
Cloud Run 서비스 버전
서비스에 배포할 때마다 버전이 생성됩니다. 버전은 하나 이상의 컨테이너 이미지 외에 환경 변수, 메모리 한도, 요청 동시 실행 값과 같은 구성 설정으로 이루어집니다.
버전을 만든 후에는 수정할 수 없습니다. 예를 들어 새 서비스에 컨테이너 이미지를 배포하면 Cloud Run에서 첫 번째 버전을 만듭니다. 그런 다음 동일한 서비스에 다른 컨테이너 이미지를 배포하면 Cloud Run에서 두 번째 버전을 만듭니다. 이후에 환경 변수를 설정하면 Cloud Run에서 세 번째 버전을 만듭니다. 시간이 지나면 Cloud Run에서 사용하지 않는 이전 버전을 삭제합니다.
Cloud Run은 최근에 생성된 정상적인 서비스 버전으로 최대한 빨리 요청을 자동으로 라우팅합니다.
Cloud Run 서비스 인스턴스
Cloud Run은 요청을 수신하는 각 서비스 버전을 이러한 모든 요청을 처리하는 데 필요한 인스턴스 수로 자동 확장합니다. 인스턴스는 동시에 여러 요청을 수신할 수 있습니다. 요청 동시 실행 설정을 사용하면 버전의 각 인스턴스에 동시에 전송할 수 있는 최대 요청 수를 설정할 수 있습니다.
Cloud Run 작업
각 작업은 특정 Google Cloud 리전에 있으며, 하나 이상의 컨테이너를 완료될 때까지 실행하기 위해 실행되는 하나 이상의 작업 태스크로 구성됩니다. 작업 태스크는 독립적이며 지정된 작업 실행에서 동시에 실행될 수 있습니다.
Cloud Run 작업 실행
작업이 실행되면 모든 작업 태스크가 시작되는 작업 실행이 생성됩니다. 작업이 성공적으로 실행될 수 있으려면 작업 하나에서 모든 태스크가 성공적으로 실행되어야 합니다. 태스크에 제한 시간을 설정하고 태스크가 실패할 경우 재시도 횟수를 지정할 수 있습니다.
태스크가 최대 재시도 횟수를 초과하면 Cloud Run에서 해당 태스크를 실패로 표시하고 작업을 실패로 표시합니다. 기본적으로 태스크는 최대 100까지 동시에 실행되지만 데이터베이스와 같은 지원 리소스에 필요한 경우에는 낮은 최댓값을 지정할 수 있습니다.
Cloud Run 작업 태스크
모든 작업 실행은 여러 태스크를 동시에 실행하며 각 태스크는 하나의 인스턴스를 실행합니다. Cloud Run은 maxRetries에 대한 작업 구성에 따라 실패한 태스크를 자동으로 다시 실행하려고 시도합니다.
Cloud Run 작업자 풀
작업자 풀은 pull 큐와 같은 요청이 아닌 워크로드를 위해 특별히 설계된 Cloud Run 리소스입니다. 작업자 풀에는 다음 기능이 없습니다.
- 엔드포인트/URL 없음
- 배포된 컨테이너가 포트에서 요청을 리슨할 필요가 없음
- 자동 확장 없음
Cloud Run 서비스와 마찬가지로 작업자 풀을 배포하거나 업데이트하면 새 버전이 생성됩니다.
워크로드에 충분한 인스턴스를 확장하기 위해 필요에 따라 작업자 풀 인스턴스를 수동으로 확장할 수 있습니다. 하지만 필요한 경우 자체 자동 확장 처리기를 만들 수 있습니다. 이러한 예시로는 Kafka 메시지 대기열에서 수신되는 워크로드의 확장을 처리하는 Kafka 자동 확장 처리가 있습니다.