インスタンスあたりの最大同時リクエスト数については、コンセプト ドキュメントをご覧ください。
構成を変更すると、新しいリビジョンが作成されます。明示的に更新しない限り、以降のリビジョンでも、この構成が自動的に設定されます。
Cloud Run サービスの場合、新しいサービスを作成するとき、または新しいリビジョンをデプロイするときに、Google Cloud コンソール、gcloud コマンドライン、または .yaml ファイルを使用して、インスタンスあたりの最大同時リクエスト数を設定できます。
コンソール
デプロイ先の新しいサービスを構成する場合は、[サービスの作成] をクリックします。既存のサービスを構成する場合は、サービスをクリックし、[新しいリビジョンの編集とデプロイ] をクリックします。
新しいサービスを構成する場合は、最初のサービス設定のページに入力してから、[Container, Networking, Security] をクリックしてサービス構成ページを開きます。
[コンテナ] タブをクリックします。
[コンテナあたりの最大リクエスト数] テキスト ボックスに、インスタンスあたりの最大同時リクエスト数を設定します。
[作成] または [保存] をクリックします。
コマンドライン
インスタンスあたりの最大同時リクエスト数を設定するには、次のコマンドを使用します。
gcloud run services update SERVICE --concurrency CONCURRENCY
次のように置き換えます。
- SERVICE は、実際のサービスの名前に置き換えます。
CONCURRENCY は、インスタンスあたりの最大同時リクエスト数に置き換えます。たとえば、次の例では同時実行リクエストの最大数を 1 に設定します。
gcloud run services update SERVICE --concurrency 1
特定のサービスのインスタンスあたりの最大同時リクエスト数を変更すると、この設定が新しいリビジョンで取り込まれます。
デフォルトのインスタンスあたりの最大同時リクエスト数(80
)に戻すには、次のコマンドを使用します。
gcloud run services update SERVICE --concurrency default
SERVICE は、構成しているサービスの名前で置き換えます。
YAML
既存のサービス構成をダウンロードして表示するには、gcloud run services describe --format export
コマンドを使用します。読みやすく整えられた結果が YAML 形式で出力されます。次に、下記の手順に沿ってフィールドを変更し、gcloud run services replace
コマンドを使用して変更後の YAML ファイルをアップロードします。必ず説明されているとおりにフィールドを変更してください。
次のコマンドで、構成を表示してダウンロードします。
gcloud run services describe SERVICE --format export > service.yaml
containerConcurrency
属性を更新します。apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: name: REVISION spec: containerConcurrency: CONCURRENCY
次のように置き換えます。
- SERVICE は、Cloud Run サービスの名前に置き換えます。
- IMAGE_URL は、コンテナ イメージへの参照(
us-docker.pkg.dev/cloudrun/container/hello:latest
など)に置き換えます。 - CONCURRENCY は、インスタンスあたりの最大同時リクエスト数に置き換えます。
- REVISION は、新しいリビジョン名に置き換えるか、削除します(存在する場合)。新しいリビジョン名を指定する場合は、次の条件を満たす必要があります。
SERVICE-
で始まる- 小文字、数字、
-
のみが使用されている - 末尾が
-
ではない - 63 文字以内である
次のコマンドを使用して、サービスを新しい構成に置き換えます。
gcloud run services replace service.yaml
Terraform
Terraform 構成を適用または削除する方法については、基本的な Terraform コマンドをご覧ください。
Terraform 構成の template.spec.containers
の google_cloud_run_service
リソースに次の内容を追加します。80
は、必要な同時リクエストの最大数に置き換えます。
同時実行の設定を表示する
Cloud Run サービスの現在の同時実行の設定を表示するには:
コンソール
目的のサービスをクリックして、[サービスの詳細] ページを開きます。
[変更内容] タブをクリックします。
右側の詳細パネルの [コンテナ] タブに、同時実行設定が表示されます。
コマンドライン
次のコマンドを使用します。
gcloud run services describe SERVICE
返された構成で、同時実行の設定を見つけます。