コンテナ インスタンスの最大数の設定

このページでは、Cloud Run サービスで使用できるコンテナ インスタンスの最大数を設定する方法について説明します。Cloud Run でインスタンスの最大数を指定すると、受信リクエストに応じてサービスのスケーリングを制限できます。この設定を使用して、コストの制御や、データベースなどのバッキング サービスへの接続数を制限できます。

Cloud Run(フルマネージド)のインスタンスの最大数に 1,000 より大きい数を指定するには、まず割り当ての増加のリクエストをする必要があるので注意してください。

Cloud Run がコンテナ インスタンスを自動スケーリングする方法については、インスタンスの自動スケーリングを参照してください。

最大インスタンス数の設定と更新

構成を変更すると、新しいリビジョンが作成されます。明示的に更新しない限り、以降のリビジョンでも、この構成が自動的に設定されます。

デフォルトでは、コンテナ インスタンスは最大 1,000 インスタンスまでスケールアウトできます。このデフォルトの数は、新しいサービスの作成時、または新しいリビジョンのデプロイ時に、Cloud Console、gcloud コマンドライン、YAML ファイルを使用して変更できます。

Console

  1. Cloud Run に移動します

  2. デプロイ先の新しいサービスを構成する場合は、[サービスの作成] をクリックします。既存のサービスを構成する場合は、サービスをクリックし、[新しいリビジョンの編集とデプロイ] をクリックします。

  3. [詳細設定] で [コンテナ] をクリックします。

    画像

  4. [インスタンスの最大数] フィールドで、希望するコンテナ インスタンスの最大数を指定します。割り当ての増加をリクエストした場合は、11000 の整数値またはそれ以上の整数値を使用します。

  5. [作成] または [デプロイ] をクリックします。

コマンドライン

次のコマンドを使用して、特定のサービスのコンテナ インスタンスの最大数を更新できます。

gcloud run services update SERVICE --max-instances MAX-VALUE

次のように置き換えます。

  • SERVICE は、サービスの名前に置き換えます。
  • MAX-VALUE は、希望するコンテナ インスタンスの最大数に置き換えます。割り当ての増加をリクエストした場合は、11000 の整数値またはそれ以上の整数値を使用します。インスタンスの最大数の設定を消去するには、default を指定してください。

デプロイの間に、次のコマンドを使用してコンテナ インスタンスの最大数を設定することもできます。

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

次のように置き換えます。

  • IMAGE_URL は、コンテナ イメージへの参照(gcr.io/myproject/my-image:latest など)に置き換えます。
  • MAX-VALUE は、希望するコンテナ インスタンスの最大数に置き換えます。割り当ての増加をリクエストした場合は、11000 の整数値またはそれ以上の整数値を使用します。インスタンスの最大数の設定を消去するには、default を指定してください。

YAML

既存のサービス構成をダウンロードして表示するには、gcloud run services describe --format export コマンドを使用します。読みやすく整えられた結果が YAML 形式で出力されます。次に、下記の手順に沿ってフィールドを変更し、gcloud beta run services replace コマンドを使用して変更後の YAML ファイルをアップロードします。必ず説明されているとおりにフィールドを変更してください。

  1. 次のコマンドで、構成を表示してダウンロードします。

    gcloud run services describe SERVICE --format export > service.yaml
  2. autoscaling.knative.dev/maxScale: 属性を更新します。

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' 

    次のように置き換えます。

    • MAX-INSTANCE は、希望する最大数に置き換えます。
  3. 次のコマンドを使用して、サービスを新しい構成に置き換えます。

    gcloud beta run services replace service.yaml

最大インスタンス設定の表示

サービスの現在の最大インスタンス設定を表示するには:

Console

  1. Cloud Run に移動します

  2. 目的のサービスをクリックして、[サービスの詳細] ページを開きます。

  3. [変更内容] タブをクリックします。

  4. 右側の詳細パネルの [コンテナ] タブに、最大インスタンス設定が表示されます。

コマンドライン

  1. 次のコマンドを使用します。

    gcloud run services describe SERVICE
  2. 返された構成で、最大インスタンス設定を見つけます。