コンテナ インスタンスの最大数の設定

Knative serving サービスに使用できるコンテナ インスタンスの最大数を設定する方法について説明します。Knative serving でインスタンスの最大数を指定すると、受信リクエストに応じてサービスのスケーリングを制限できます。この設定を使用して、コストの制御や、データベースなどのバッキング サービスへの接続数を制限できます。

Knative serving がコンテナ インスタンスを自動スケーリングする方法については、インスタンスの自動スケーリングをご覧ください。

最大インスタンス数の設定と更新

構成を変更すると、新しいリビジョンが作成されます。明示的に更新しない限り、以降のリビジョンでも、この構成が自動的に設定されます。

デフォルトでは、コンテナ インスタンスの数は無限にスケーリングできます。新しいサービスをデプロイするときか、既存のサービスを更新してリビジョンをデプロイするときに、Google Cloud コンソールまたは Google Cloud CLI を使用して、インスタンスの最大数の上限を設定できます。

コンソール

  1. Google Cloud コンソールで Knative serving に移動します。

    Knative serving に移動

  2. デプロイ先の新しいサービスを構成する場合は、[サービスを作成] をクリックします。既存のサービスを構成する場合は、そのサービスをクリックし、[新しいリビジョンの編集とデプロイ] をクリックします。

  3. [詳細設定] で [コンテナ] をクリックします。

  4. [インスタンスの最大数] フィールドに、コンテナ インスタンスの最大数を指定します。

  5. [次へ] をクリックして、次のセクションに進みます。

  6. [このサービスをトリガーする方法の構成] セクションで、サービスを呼び出すために使用する接続を選択します。

  7. [作成] をクリックしてイメージを Knative serving にデプロイし、デプロイの完了を待ちます。

コマンドライン

  • 既存のサービスの場合は、--max-instances パラメータを指定して gcloud run services update コマンドを実行し、コンテナ インスタンスの最大数を設定します。

    gcloud run services update SERVICE --max-instances MAX-VALUE
    

    以下のように置き換えます。

    • SERVICE は、実際のサービスの名前に置き換えます。
    • MAX-VALUE は、目的のコンテナ インスタンスの最大数に置き換えます。インスタンスの最大数の設定を消去するには、default を指定します。
  • 新しいサービスの場合は、--max-instances パラメータを指定して gcloud run deploy コマンドを実行し、コンテナ インスタンスの最大数を設定します。

    gcloud run deploy SERVICE --image=IMAGE_URL --max-instances MAX-VALUE
    

    以下のように置き換えます。

    • SERVICE: 実際のサービスの名前。
    • IMAGE_URL は、コンテナ イメージへの参照(gcr.io/cloudrun/hello など)に置き換えます。
    • MAX-VALUE は、目的のコンテナ インスタンスの最大数に置き換えます。インスタンスの最大数の設定を消去するには、default を指定します。

YAML

--format=export フラグを使用して、gcloud run services describe コマンドで既存のサービスの構成を YAML ファイルにダウンロードできます。次に YAML ファイルを変更し、gcloud run services replace コマンドを使用してこれらの変更をデプロイします。指定した属性のみを変更する必要があります。

  1. ローカル ワークスペースの service.yaml という名前のファイルにサービスの構成をダウンロードします。

    gcloud run services describe SERVICE --format export > service.yaml

    SERVICE は、Knative serving サービスの名前に置き換えます。

  2. ローカル ファイルで autoscaling.knative.dev/maxScale: 属性を更新します。

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' 

    次のように置き換えます。

    • MAX-INSTANCE は、希望する最大数に置き換えます。
  3. 次のコマンドを使用して、サービスを新しい構成に置き換えます。

    gcloud run services replace service.yaml