同時実行の設定

Knative serving で特定のコンテナ インスタンスが、同時に処理できるリクエストの最大数を設定する方法について説明します。同時実行の詳細

構成を変更すると、新しいリビジョンが作成されます。明示的に更新しない限り、以降のリビジョンでも、この構成が自動的に設定されます。

新しいサービスをデプロイするか、既存のサービスを更新してリビジョンをデプロイする際には、Google Cloud コンソールまたは Google Cloud CLI を使用して同時実行設定を構成できます。

コンソール

  1. Google Cloud コンソールで Knative serving に移動します。

    Knative serving に移動

  2. デプロイ先の新しいサービスを構成する場合は、[サービスを作成] をクリックします。既存のサービスを構成する場合は、そのサービスをクリックし、[新しいリビジョンの編集とデプロイ] をクリックします。

  3. [詳細設定] で [コンテナ] をクリックします。

  4. [コンテナあたりの最大リクエスト数] テキスト ボックスに、同時実行の値を設定します。

  5. [次へ] をクリックして、次のセクションに進みます。

  6. [このサービスをトリガーする方法の構成] セクションで、サービスを呼び出すために使用する接続を選択します。

  7. [作成] をクリックしてイメージを Knative serving にデプロイし、デプロイの完了を待ちます。

コマンドライン

  • 既存のサービスの場合は、--concurrency パラメータを指定して gcloud run services update コマンドを実行し、同時リクエストの最大数を設定します。

    gcloud run services update SERVICE --concurrency CONCURRENCY

    次のように置き換えます。

    • SERVICE は、実際のサービスの名前に置き換えます。
    • CONCURRENCY は、コンテナ インスタンスあたりの最大同時リクエスト数に置き換えます。同時実行の設定(--concurrency default)をクリアするには、default を指定します。
  • 新しいサービスの場合は、--concurrency パラメータを指定して gcloud run deploy コマンドを実行し、同時リクエストの最大数を設定します。

    gcloud run deploy SERVICE --image=IMAGE_URL --concurrency CONCURRENCY

    次のように置き換えます。

    • SERVICE: 実際のサービスの名前。
    • IMAGE_URL は、コンテナ イメージへの参照(gcr.io/cloudrun/hello など)に置き換えます。
    • CONCURRENCY は、コンテナ インスタンスあたりの最大同時リクエスト数に置き換えます。同時実行の設定(--concurrency default)をクリアするには、default を指定します。

YAML

--format=export フラグを使用して、gcloud run services describe コマンドで既存のサービスの構成を YAML ファイルにダウンロードできます。次に YAML ファイルを変更し、gcloud run services replace コマンドを使用してこれらの変更をデプロイします。指定した属性のみを変更する必要があります。

  1. ローカル ワークスペースの service.yaml という名前のファイルにサービスの構成をダウンロードします。

    gcloud run services describe SERVICE --format export > service.yaml

    SERVICE は、Knative serving サービスの名前に置き換えます。

  2. ローカル ファイルで containerConcurrency 属性を更新します。

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containerConcurrency: CONCURRENCY

    次のように置き換えます。

    • SERVICE は、Knative serving サービスの名前に置き換えます。
    • CONCURRENCY は、コンテナ インスタンスあたりの最大同時リクエスト数に置き換えます。同時実行の設定をクリアするには、--concurrency default のように default を指定します。
  3. 次のコマンドを使用して、サービスを新しい構成に置き換えます。

    gcloud run services replace service.yaml