次の図は、Cloud Run のリソースモデルを表しています。
この図は、2 つの Cloud Run サービス Service A
と Service B
を含む Google Cloud プロジェクトを示しています。各サービスには複数のリビジョンがあります。
Service A
では、多くのリクエストを受信しているため、複数のコンテナ インスタンスが起動し、実行されています。Service B
では現在リクエストを受信していないため、コンテナ インスタンスは起動していません。
Cloud Run サービス
サービスは Cloud Run のメインリソースです。各サービスは特定の GCP リージョン(Cloud Run)にあります。冗長性とフェイルオーバーのため、サービスはリージョン内の複数のゾーンに自動的に複製されます。1 つの GCP プロジェクトで、複数のリージョンの多数のサービスを実行できます。
各サービスは固有のエンドポイントを公開し、受信リクエストを処理するため、基盤となるインフラストラクチャを自動的に拡張します。
Cloud Run のリビジョン
サービスをデプロイするたびに、リビジョンが作成されます。リビジョンは、環境変数、メモリ制限、同時実行などの環境設定と特定のコンテナ イメージから構成されています。
リビジョンは変更されません。作成されたリビジョンを変更することはできません。コンテナ イメージを新しい Cloud Run サービスにデプロイすると、最初のリビジョンが作成されます。その後、同じサービスに別のコンテナ イメージをデプロイすると、2 番目のリビジョンが作成されます。さらに、環境変数を設定すると、3 番目のリビジョンが作成されます。
リクエストは、最新で正常な状態のリビジョンに自動的にルーティングされます。
Cloud Run コンテナ インスタンス
リビジョンは、受信したすべてのリクエストを処理できるように、コンテナ インスタンスの数を自動的にスケーリングします。1 つのコンテナ インスタンスが同時に多くのリクエストを受信する場合があります。同時実行の設定を使用すると、1 つのコンテナ インスタンスに同時に送信されるリクエストの最大数を設定できます。