Cloud Run の割り当てと上限

このページでは、Cloud Run の使用時に適用される使用量割り当てと上限について説明します。

Cloud Run のリソース数には上限が適用されます。Cloud Run の割り当ては、Cloud Run Admin API の呼び出しレートに影響を与える API のレート上限を包含します。

以下のものに対する直接的な上限はありません。

  • デプロイできるコンテナ イメージのサイズ
  • Cloud Run サービスによって処理される同時リクエストの数

Cloud Run のリソース制限

リソース 説明 上限 上限引き上げ可否 スコープ
サービス サービスの最大数 1,000 × プロジェクトとリージョンごと
ジョブ ジョブの最大数 1,000 × プロジェクトとリージョンごと
リビジョン サービスごとのリビジョンの最大数。上限に達すると、サービスを提供していないリビジョンが、古い順に自動的に削除されます。 1,000 × サービスごと
リビジョン トラフィックを処理するリビジョンの最大数 4000 × プロジェクトとリージョンごと
リビジョン タグ リビジョンタグの最大数 2000 × プロジェクトとリージョンごと
ジョブの実行 完了したジョブの実行の保持の上限。完了したジョブの実行数がこの上限に達すると、実行は古いものから自動的に削除されます。 1,000 いいえ ジョブごと
ジョブ実行タスク1 並列で実行されるタスクの最大数 1 個の CPU と 2 GiB のメモリを使用する場合は 200 です(CPU とメモリの構成によって異なります)。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。 ジョブ実行ごと
ジョブ実行タスク タスクの最大タイムアウト値 1 時間 × ジョブ実行ごと
ジョブ実行タスク 1 つのジョブの最大タスク数 10,000 × ジョブ実行ごと
ジョブ実行タスク ジョブのタスク再試行の最大数 10 × ジョブ実行ごと
コンテナ インスタンス1 コンテナ インスタンスの最大数 選択したリージョン、CPU、メモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。 リビジョンごと
コンテナ インスタンス1 実行中のすべてのジョブ実行のコンテナ インスタンスの最大数 1 個の CPU と 2 GiB のメモリを使用する場合は 200 です(CPU とメモリの構成によって異なります)。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。 プロジェクトとリージョンごと
コンテナ インスタンス 起動タイムアウト(分) 4 × コンテナ インスタンスごと
コンテナ インスタンス 1 秒あたりのアウトバウンド接続 700 × コンテナ インスタンスごと
コンテナ インスタンス HTTP/1 コンテナポートへの 1 秒あたりの受信リクエスト数(HTTP/2 コンテナポートには適用されません) 800 × コンテナ インスタンスごと
メモリ 最大メモリサイズ(GiB) 32 × コンテナ インスタンスごと
CPU vCPU の最大数 8 × コンテナ インスタンスごと
ディスク 書き込み可能なメモリ内ファイル システムの最大サイズ(GiB)。インスタンスのメモリによって制限されます。 32 × コンテナ インスタンスごと
環境変数 変数の最大長(KB) 32 × 変数ごと
リクエスト 同時リクエストの最大数 1,000 × コンテナ インスタンスごと
リクエスト 同時ストリームの最大数 100 × HTTP/2 クライアント接続ごと
リクエスト タイムアウトまでの最大時間(分) 60 × リクエストごと
リクエスト HTTP/1 リクエストの最大サイズ(MiB) HTTP/1 サーバーを使用する場合は 32。HTTP/2 サーバーを使用する場合は無制限。 × リクエストごと
レスポンス HTTP/1 レスポンスの最大サイズ(MiB) Transfer-Encoding: chunked またはストリーミング メカニズムを使用しない場合は 32 × レスポンスごと
ドメイン マッピング SSL 証明書の最大数 50 × トップドメインおよび週ごと
ドメイン マッピング 重複する SSL 証明書の最大数 5 × トップドメインおよび週ごと
アクセス トークン 生成される一意のアクセス トークンの最大数 50 × コンテナ インスタンスごと、1 秒あたり
ID トークン 生成される一意の ID トークンの最大数 50 × コンテナ インスタンスごと、1 秒あたり

1 このリージョンの割り当ては、いくつかのケースで使用されます。

  1. リビジョンの最大インスタンス属性に選択可能な最大値を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。

  2. ジョブの最大並列処理を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

  3. 1 つのリージョン内でジョブ実行を実行するためのコンテナ インスタンスの総数を制御します。

注: この割り当てをジョブに使用する場合、まず 5 で割ります。

Cloud Run Admin API のレート上限

Cloud Run Admin API には次のレート上限が適用されます。この上限は、デプロイされた Cloud Run サービスに到達するリクエストには適用されません。

割り当て 説明 上限 引き上げ可否 スコープ
Cloud Run Admin API 読み取りリクエスト プロジェクトごとの 60 秒あたりの API 読み取り数。これは、Cloud Run サービスへの読み取りリクエスト数ではありません。このリクエスト数に上限はありません。 60 秒あたり 1,200 リージョン
Cloud Run Admin API 書き込みリクエスト プロジェクトごとの 60 秒あたりの API 書き込み数。これは、Cloud Run サービスへの書き込みリクエスト数ではありません。このリクエスト数に上限はありません。 60 秒あたり 60 リージョン
ジョブ実行 1 リージョンで 1 分間にジョブを実行できる最大回数 10 プロジェクトとリージョンごと

割り当てを増やす方法

このページに示したデフォルトよりも割り当てを増やすには:

  1. Cloud Run の割り当てページに移動します。

  2. 該当するリージョンで変更する割り当てを選択して、[割り当てを編集] をクリックします。

  3. プロンプトが表示されたらユーザー情報を入力して、選択した各割り当ての新しい上限を入力します。

Cloud Run が選択したリージョンでユースケースを処理できるように、リクエストはサポートチームに転送されます。リクエストが承認される前に、構成と予想されるトラフィック パターンに関する詳細を入力するよう求められる場合があります。リクエストが多くなると、処理に時間がかかることがあります。