Cloud Run for Anthos on Google Cloud で特定のコンテナ インスタンスによって同時に処理できるリクエストの最大数を設定する方法を学習します。同時実行の詳細。
構成を変更すると、新しいリビジョンが作成されます。明示的に更新しない限り、以降のリビジョンでも、この構成が自動的に設定されます。
新しいサービスをデプロイするか、既存のサービスを更新してリビジョンデプロイするときに、Cloud Console または gcloud
コマンドライン ツールを使用して同時実行の設定を構成できます。
Console
デプロイ先の新しいサービスを構成する場合は、[サービスの作成] をクリックします。既存のサービスを構成する場合は、そのサービスをクリックし、[新しいリビジョンの編集とデプロイ] をクリックします。
[詳細設定] で [コンテナ] をクリックします。
[コンテナあたりの最大リクエスト数] テキスト ボックスに、同時実行の値を設定します。
[作成] または [デプロイ] をクリックします。
コマンドライン
既存のサービスの場合は、
--concurrency
パラメータを指定してgcloud kuberun core services update
コマンドを実行し、同時リクエストの最大数を設定します。gcloud kuberun core services update SERVICE --concurrency CONCURRENCY
次のように置き換えます。
SERVICE
は、実際のサービスの名前に置き換えます。CONCURRENCY
は、コンテナ インスタンスあたりの最大同時リクエスト数に置き換えます。同時実行の設定(--concurrency default
)をクリアするには、default
を指定します。
新しいサービスの場合は、
--concurrency
パラメータを指定してgcloud kuberun core services create
コマンドを実行し、同時リクエストの最大数を設定します。gcloud kuberun core services create SERVICE --image=IMAGE_URL --concurrency CONCURRENCY
次のように置き換えます。
SERVICE
は、実際のサービスの名前に置き換えます。- IMAGE_URL は、コンテナ イメージへの参照(
gcr.io/myproject/my-image:latest
など)に置き換えます。 CONCURRENCY
は、コンテナ インスタンスあたりの最大同時リクエスト数に置き換えます。同時実行の設定(--concurrency default
)をクリアするには、default
を指定します。
YAML
YAML ファイルを使用して既存のサービスの構成を変更するには、現在の構成のコピーを取得し、その構成を変更してローカル ファイルに保存してから、これらの変更をサービスにデプロイします。
YAML として表示し、サービスの構成をローカル ファイルにコピーします。例を示します。
service.yaml
:gcloud kuberun core services describe SERVICE --format yaml
SERVICE は、Cloud Run for Anthos サービスの名前に置き換えます。
ローカル ファイルで
containerConcurrency
属性を更新します。apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containerConcurrency: CONCURRENCY
次のように置き換えます。
- SERVICE は、Cloud Run for Anthos on Google Cloud サービスの名前に置き換えます。
- CONCURRENCY は、コンテナ インスタンスあたりの最大同時リクエスト数に置き換えます。同時実行の設定をクリアするには、
--concurrency default
のようにdefault
を指定します。
次のコマンドを使用して、サービスを新しい構成に置き換えます。
gcloud beta run services replace service.yaml