Cloud Run for Anthos サービスに使用できるコンテナ インスタンスの最大数を設定する方法について説明します。Cloud Run for Anthos でインスタンスの最大数を指定すると、受信リクエストに応じてサービスのスケーリングを制限できます。この設定を使用して、コストの制御や、データベースなどのバッキング サービスへの接続数を制限できます。
Cloud Run for Anthos がコンテナ インスタンスを自動スケーリングする方法については、インスタンスの自動スケーリングをご覧ください。
最大インスタンス数の設定と更新
構成を変更すると、新しいリビジョンが作成されます。明示的に更新しない限り、以降のリビジョンでも、この構成が自動的に設定されます。
デフォルトでは、コンテナ インスタンスの数は無限にスケーリングできます。新しいサービスをデプロイするときか、既存のサービスを更新してリビジョンをデプロイするときに、Google Cloud コンソールまたは Google Cloud CLI を使用して、インスタンスの最大数の上限を設定できます。
Console
Google Cloud コンソールで Cloud Run for Anthos に移動します。
デプロイ先の新しいサービスを構成する場合は、[サービスの作成] をクリックします。既存のサービスを構成する場合は、そのサービスをクリックし、[新しいリビジョンの編集とデプロイ] をクリックします。
[詳細設定] で [コンテナ] をクリックします。
[インスタンスの最大数] フィールドに、コンテナ インスタンスの最大数を指定します。
[次へ] をクリックして、次のセクションに進みます。
[このサービスをトリガーする方法の構成] セクションで、サービスを呼び出すために使用する接続を選択します。
[作成] をクリックしてイメージを Cloud Run for Anthos にデプロイし、デプロイの完了を待ちます。
コマンドライン
既存のサービスの場合は、
--max-instances
パラメータを指定してgcloud run services update
コマンドを実行し、コンテナ インスタンスの最大数を設定します。gcloud run services update SERVICE --max-instances MAX-VALUE
以下のように置き換えます。
- SERVICE は、実際のサービスの名前に置き換えます。
- MAX-VALUE は、目的のコンテナ インスタンスの最大数に置き換えます。インスタンスの最大数の設定を消去するには、
default
を指定します。
新しいサービスの場合は、
--max-instances
パラメータを指定してgcloud run deploy
コマンドを実行し、コンテナ インスタンスの最大数を設定します。gcloud run deploy SERVICE --image=IMAGE_URL --max-instances MAX-VALUE
以下のように置き換えます。
- SERVICE は、実際のサービスの名前に置き換えます。
- IMAGE_URL は、コンテナ イメージへの参照(
gcr.io/myproject/my-image:latest
など)に置き換えます。 - MAX-VALUE は、目的のコンテナ インスタンスの最大数に置き換えます。インスタンスの最大数の設定を消去するには、
default
を指定します。
YAML
--format=export
フラグを使用して、gcloud run services describe
コマンドで既存のサービスの構成を YAML ファイルにダウンロードできます。次に YAML ファイルを変更し、gcloud beta run services replace
コマンドを使用してこれらの変更をデプロイします。指定した属性のみを変更する必要があります。
ローカル ワークスペースの
service.yaml
という名前のファイルにサービスの構成をダウンロードします。gcloud run services describe SERVICE --format export > service.yaml
SERVICE は、Cloud Run for Anthos サービスの名前に置き換えます。
ローカル ファイルで
autoscaling.knative.dev/maxScale:
属性を更新します。spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
次のように置き換えます。
- MAX-INSTANCE は、希望する最大数に置き換えます。
次のコマンドを使用して、サービスを新しい構成に置き換えます。
gcloud beta run services replace service.yaml