最大同時実行の設定については、同時実行のコンセプトをご覧ください。
構成を変更すると、新しいリビジョンが作成されます。明示的に更新しない限り、以降のリビジョンでも、この構成が自動的に設定されます。
新しいサービスを作成するときや新しいリビジョンをデプロイするときに、Cloud Console、gcloud コマンドライン、または .yaml ファイルを使用して最大同時実行を設定できます。
Console
デプロイ先の新しいサービスを構成する場合は、[サービスの作成] をクリックします。既存のサービスを構成する場合は、サービスをクリックし、[新しいリビジョンの編集とデプロイ] をクリックします。
[詳細設定] で [コンテナ] をクリックします。
[コンテナあたりの最大リクエスト数] テキスト ボックスに、最大同時実行の値を設定します。
[作成] または [デプロイ] をクリックします。
コマンドライン
最大同時実行を設定するには、次のコマンドを使用します。
gcloud run services update SERVICE --concurrency CONCURRENCY
置換
- SERVICE は、実際のサービスの名前に置き換えます。
CONCURRENCY は、コンテナ インスタンスあたりの最大同時リクエスト数に置き換えます。たとえば、次の例では同時実行リクエストの最大数を 40 に設定します。
gcloud run services update SERVICE --concurrency 40
特定のサービスの最大同時実行を変更すると、この設定が新しいリビジョンで取り込まれます。
デフォルトの最大同時実行数(250
)に戻すには、次のコマンドを使用します。
gcloud run services update SERVICE --concurrency default
SERVICE を、構成しているサービスの名前で置き換えます。
YAML
既存のサービス構成をダウンロードして表示するには、gcloud run services describe --format export
コマンドを使用します。読みやすく整えられた結果が YAML 形式で出力されます。次に、下記の手順に沿ってフィールドを変更し、gcloud beta run services replace
コマンドを使用して変更後の YAML ファイルをアップロードします。必ず説明されているとおりにフィールドを変更してください。
次のコマンドで、構成を表示してダウンロードします。
gcloud run services describe SERVICE --format export > service.yaml
containerConcurrency
属性を更新します。apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containerConcurrency: CONCURRENCY
次のように置き換えます。
- SERVICE は、Cloud Run サービスの名前に置き換えます。
- IMAGE は、コンテナ イメージの URL に置き換えます。
- CONCURRENCY は、コンテナ インスタンスあたりの最大同時リクエスト数に置き換えます。
次のコマンドを使用して、サービスを新しい構成に置き換えます。
gcloud beta run services replace service.yaml