Cloud Run サービスには、次の 2 つの課金設定があります。
リクエスト ベースの課金(デフォルト): Cloud Run インスタンスは、リクエストの処理中、コンテナの起動中、コンテナのシャットダウン中にリクエストを処理する場合にのみ課金されます。詳細については、インスタンスのライフサイクルをご覧ください。この設定は、以前は「リクエストの処理中にのみ CPU を割り当てる」と呼ばれていました。
インスタンス ベースの課金: Cloud Run インスタンスは、受信リクエストがない場合でも、インスタンスのライフサイクル全体に対して課金されます。インスタンスベースの課金は、短期のバックグラウンド タスクやその他の非同期処理タスクの実行に役立ちます。この設定は以前は [CPU を常に割り当てる] と呼ばれていました。
リクエスト ベースの課金を選択した場合、インスタンスがリクエストを処理した場合にのみ、リクエストごとに課金されます。インスタンス ベースの課金を選択すると、インスタンスのライフサイクル全体に対して課金されます。詳細については、Cloud Run の料金表をご覧ください。
Recommender は、過去 1 か月間に Cloud Run サービスが受信したトラフィックを自動的に調べ、料金が安い場合、リクエストベースの課金からインスタンスベースの課金に切り替えるよう推奨します。
CPU 割り当ての影響
課金設定を選択すると、CPU の割り当て方法に影響します。
- リクエスト ベースの課金では、CPU はリクエストの処理中にのみ割り当てられます。
- インスタンス ベースの課金では、コンテナ インスタンスのライフサイクル全体で CPU が割り当てられます。
適切な課金設定を選択する方法
ユースケースに適した課金設定は、トラフィック パターン、バックグラウンド実行、費用など、いくつかの要素によって異なります。以降のセクションでは、これらの要素について説明します。
トラフィック パターンに関する考慮事項
- 受信トラフィックが散発的か、バーストまたは急増する場合は、リクエスト ベースの課金をおすすめします。
- 受信トラフィックが安定して緩やかであれば、インスタンスベースの課金をおすすめします。
バックグラウンド実行に関する考慮事項
[インスタンスベースの課金] を選択すると、リクエスト処理以外でも CPU が割り振られるため、レスポンスを返した後に短期のバックグラウンド タスクなどの非同期処理を実行できます。次に例を示します。
- バックグラウンドでの実行が想定される OpenTelemetry などのモニタリング エージェントを利用する。
- Go の Goroutine、Node.js async、Java スレッド、Kotlin コルーチンを使用する。
- 組み込みのスケジューリング / バックグラウンド機能に依存するアプリケーション フレームワークを使用する。
アイドル状態のインスタンス(最小インスタンスを使用してウォーム状態を維持したインスタンスを含む)は、いつでもシャットダウンできます。コンテナが終了する前に未処理のタスクを完了する必要がある場合は、SIGTERM をトラップして、インスタンスが停止するまでに 10 秒の猶予期間を設けることができます。
非同期タスクの実行には、Cloud Tasks の使用を検討してください。Cloud Tasks は、失敗したタスクを自動的に再試行し、最大 30 分の実行時間をサポートします。
費用に関する考慮事項
リクエストベースの課金を使用している場合、次の条件を満たしている場合は、インスタンスベースの課金の方が経済的です。
- Cloud Run サービスが、現在の多くのリクエストを一定の速度で処理している。
- インスタンス数の指標で、アイドル状態のインスタンスが多くない。
料金計算ツールを使用すると、費用の差額を見積もることができます。
自動スケーリングに関する考慮事項
Cloud Run は、コンテナ インスタンスの数をautoscalesします。
リクエストベースの課金に設定されたサービスの場合、Cloud Run はリクエストの処理中にのみ CPU 使用率に基づいてインスタンス数を自動スケーリングします。
インスタンス ベースの課金に設定されたサービスの場合、Cloud Run は、コンテナ インスタンスのライフサイクル全体で CPU 使用率に基づいてインスタンス数を自動スケーリングします。ただし、ゼロへのスケーリングとゼロからのスケーリングの場合は、リクエストのみを使用します。
インスタンスベースの課金に関する考慮事項
課金設定がインスタンス ベースの課金に設定されている場合でも、Cloud Run の自動スケーリングは引き続き有効であり、受信トラフィックやリクエスト以外の CPU 使用率の処理に必要ないインスタンスは停止できます。リクエスト処理後 15 分を過ぎるとインスタンスのアイドル状態は解除されます(ただし、最小インスタンス数を使用してアクティブ状態が保持されている場合は除きます)。
インスタンス ベースの課金と複数の最小インスタンスを組み合わせると、多数のインスタンスが起動され、CPU リソースへの完全アクセス権が付与されます。これにより、バックグラウンド処理のユースケースが有効になります。このパターンを使用すると、サービスがリクエスト以外で CPU を使用している場合でも、Cloud Run はインスタンスの自動スケーリングを適用します。
ヘルスチェック プローブを使用する場合は、すべてのプローブでインスタンスベースの課金を使用する必要があります。課金の詳細については、コンテナ ヘルスチェック プローブをご覧ください。
必要なロール
Cloud Run サービスの構成とデプロイに必要な権限を取得するには、次の IAM ロールを付与するよう管理者に依頼してください。
-
Cloud Run サービスに対する Cloud Run デベロッパー(
roles/run.developer
)ロール -
サービス ID に対するサービス アカウント ユーザー(
roles/iam.serviceAccountUser
)ロール
Cloud Run に関連付けられている IAM ロールと権限のリストについては、Cloud Run IAM ロールと Cloud Run IAM 権限をご覧ください。Cloud Run サービスがGoogle Cloud API(Cloud クライアント ライブラリなど)と連携している場合は、サービス ID の構成ガイドをご覧ください。ロールの付与の詳細については、デプロイ権限とアクセスの管理をご覧ください。
お支払い情報の設定と更新
構成を変更すると、新しいリビジョンが作成されます。明示的に更新しない限り、以降のリビジョンでも、この構成が自動的に設定されます。
インスタンス ベースの課金を選択する場合は、512 MiB 以上のメモリを指定する必要があります。
課金設定を変更するには、新しいサービスを作成するとき、または新しいリビジョンをデプロイするときに、 Google Cloud コンソール、gcloud CLI、または YAML ファイルを使用します。
Console
Google Cloud コンソールで、Cloud Run に移動します。
[コンテナをデプロイ] をクリックし、[サービス] を選択して、新しいサービスを構成します。既存のサービスを構成する場合は、サービスをクリックし、[新しいリビジョンの編集とデプロイ] をクリックします。
新しいサービスを構成する場合は、最初のサービス設定ページに入力します。
[お支払い] で、お支払い設定を選択します。インスタンスがリクエストの処理中にのみ課金されるようにするには、[リクエスト ベースの課金] を選択します。インスタンスのライフサイクル全体に対して課金されるように、インスタンスのインスタンス ベースの課金を選択します。
[作成] または [デプロイ] をクリックします。
gcloud
お支払い設定を更新できます。特定のサービスに対してインスタンスベースの課金を設定するには:
gcloud run services update SERVICE --no-cpu-throttling
SERVICE は、実際のサービス名に置き換えます。
リクエストベースの課金を設定するには:
gcloud run services update SERVICE --cpu-throttling
デプロイ中に課金設定を設定することもできます。請求設定をインスタンスベースの課金に設定するには:
gcloud run deploy --image IMAGE_URL --no-cpu-throttling
請求設定をリクエスト ベースの請求に設定するには:
gcloud run deploy --image IMAGE_URL --cpu-throttling
IMAGE_URL は、コンテナ イメージへの参照(us-docker.pkg.dev/cloudrun/container/hello:latest
など)に置き換えます。Artifact Registry を使用する場合は、リポジトリ REPO_NAME がすでに作成されている必要があります。URL の形状は LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
です
YAML
新しいサービスを作成する場合は、この手順をスキップします。既存のサービスを更新する場合は、その YAML 構成をダウンロードします。
gcloud run services describe SERVICE --format export > service.yaml
cpu
属性を更新します。apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: annotations: run.googleapis.com/cpu-throttling: 'BOOLEAN' name: REVISION
次のように置き換えます。
- SERVICE は、Cloud Run サービスの名前に置き換えます。
- BOOLEAN を
true
に置き換えてリクエスト課金を設定するか、false
に置き換えてインスタンス ベースの課金を設定します。 - REVISION を新しいリビジョン名に置き換えるか、削除(存在する場合)します。新しいリビジョン名を指定する場合は、次の条件を満たす必要があります。
SERVICE-
で始まる- 小文字、数字、
-
のみが使用されている - 末尾が
-
ではない - 63 文字以内である
次のコマンドを使用して、サービスを作成または更新します。
gcloud run services replace service.yaml
Terraform
Terraform 構成を適用または削除する方法については、基本的な Terraform コマンドをご覧ください。
Terraform 構成の template.containers.resources
の google_cloud_run_v2_service
リソースに次の内容を追加します。
課金設定を表示する
Cloud Run サービスの現在の課金設定を表示するには:
Console
Google Cloud コンソールで、Cloud Run に移動します。
目的のサービスをクリックして、[サービスの詳細] ページを開きます。
[変更内容] タブをクリックします。
右側の詳細パネルの [全般] タブに、課金設定が表示されます。
gcloud
次のコマンドを使用します。
gcloud run services describe SERVICE
返された構成で、課金の設定を見つけます。