最小インスタンスの使用

最小インスタンス数を構成して、サービスのアイドル インスタンスを有効にする方法について説明します。

デフォルトでは、Cloud Run for Anthos on Google Cloud は受信リクエストの数に応じてインスタンス数をスケールアップします。ただし、サービスでレイテンシを短縮する必要があり、コールド スタートの数を制限する場合は、いつでもリクエストを処理できるコンテナ インスタンスの最小数を指定して、このデフォルトの動作を変更できます。

この方法で実行されているインスタンスは課金対象になります。

リビジョンと最小インスタンス数

最小インスタンスで開始するのは、リビジョンでアドレス指定が可能な場合に限ります。次のいずれかに該当する場合は、リビジョンでアドレス指定が可能です。

  • 一定の割合のトラフィックを受信している
  • リビジョンタグが割り当てられている

最小インスタンスの設定と更新

構成を変更すると、新しいリビジョンが作成されます。明示的に更新しない限り、以降のリビジョンでも、この構成が自動的に設定されます。

デフォルトでは 0 が設定され、コンテナ インスタンスの min-instances は無効になっています。このデフォルト値は、新しいサービスをデプロイするとき、または既存のサービスを更新してリビジョンをデプロイするときに、Cloud Console または gcloud コマンドライン ツールで変更できます。

Console

  1. Cloud Run for Anthos on Google Cloud に移動

  2. デプロイ先の新しいサービスを構成する場合は、[サービスの作成] をクリックします。既存のサービスを構成する場合は、そのサービスをクリックし、[新しいリビジョンの編集とデプロイ] をクリックします。

  3. [詳細設定] で [コンテナ] をクリックします。

    画像

  4. [インスタンスの最小数] フィールドに、ウォームアップ状態を維持し、リクエストを受信できるコンテナ インスタンスの数を指定します。

  5. [作成] または [デプロイ] をクリックします。

コマンドライン

  • 既存のサービスの場合、--min-instances パラメータを指定して gcloud kuberun core services update コマンドを実行し、コンテナ インスタンスの最小数を設定します。

    gcloud kuberun core services update SERVICE --min-instances MIN-VALUE
    

    次のように置き換えます。

    • SERVICE は、実際のサービスの名前に置き換えます。
    • MIN-VALUE は、ウォーム状態を維持し、リクエストを受信できるコンテナ インスタンスの数に置き換えます。インスタンスの最小数の設定を消去するには、default を指定します。
  • 新しいサービスの場合は、--min-instances パラメータを指定して gcloud kuberun core services create コマンドを実行し、コンテナ インスタンスの最小数を設定します。

    gcloud kuberun core services create SERVICE --image=IMAGE_URL --min-instances MIN-VALUE
    

    次のように置き換えます。

    • SERVICE は、実際のサービスの名前に置き換えます。
    • IMAGE_URL は、コンテナ イメージへの参照(gcr.io/myproject/my-image:latest など)に置き換えます。
    • MIN-VALUEcode> は、ウォーム状態を維持し、いつでもリクエストを受信できるようにしておくコンテナ インスタンスの数で置き換えます。インスタンスの最小数の設定を消去するには、default を指定します。

YAML

YAML ファイルを使用して既存のサービスの構成を変更するには、現在の構成のコピーを取得し、その構成を変更してローカル ファイルに保存してから、これらの変更をサービスにデプロイします。

  1. YAML として表示し、サービスの構成をローカル ファイルにコピーします。例を示します。service.yaml:

    gcloud kuberun core services describe SERVICE --format yaml

    SERVICE は、Cloud Run for Anthos サービスの名前に置き換えます。

  2. ローカル ファイルで autoscaling.knative.dev/minScale: 属性を更新します。

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/minScale: 'MIN-INSTANCE' 

    次のように置き換えます。

    • MIN-VALUEcode> は、ウォーム状態を維持し、いつでもリクエストを受信できるようにしておくコンテナ インスタンスの数で置き換えます。インスタンスの最小数の設定を消去するには、default を指定します。
  3. 次のコマンドを使用して、サービスを新しい構成に置き換えます。

    gcloud beta run services replace service.yaml