Cloud Run の割り当てと上限

このページでは、Cloud Run の使用時に適用される使用量割り当てと上限について説明します。

Cloud Run のリソース数には上限が適用されます。Cloud Run の割り当ては、Cloud Run Admin API の呼び出しレートに影響を与える API のレート上限を包含します。

以下のものに対する直接的な上限はありません。

  • デプロイできるコンテナ イメージのサイズ
  • Cloud Run サービスによって処理される同時リクエストの数

Cloud Run のリソース制限

リソース 説明 上限 引き上げ可能 スコープ
サービス サービスの最大数 1,000 いいえ プロジェクトとリージョンごと
ジョブ ジョブの最大数 1,000 いいえ プロジェクトとリージョンごと
サービスとジョブの実行 サービスと実行中のジョブの最大数 1000 いいえ プロジェクトとリージョンごと
リビジョン サービスごとのリビジョンの最大数。上限に達すると、サービスを提供していないリビジョンが、古い順に自動的に削除されます。 1,000 いいえ サービスごと
リビジョンとジョブの実行 トラフィックを処理するリビジョンと実行中のジョブの最大数 4000 いいえ プロジェクトとリージョンごと
リビジョン タグ リビジョンタグの最大数 2000 いいえ プロジェクトとリージョンごと
ジョブの実行 完了したジョブの実行の保持の上限。完了したジョブの実行数がこの上限に達すると、実行は古いものから自動的に削除されます。 1,000 いいえ ジョブごと
ジョブ実行タスク1 並列で実行されるタスクの最大数 選択したリージョン、CPUメモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。 はい ジョブ実行ごと
ジョブ実行タスク タスクの最大タイムアウト値 24 時間 いいえ ジョブ実行ごと
ジョブ実行タスク 1 つのジョブの最大タスク数 10,000 いいえ ジョブ実行ごと
ジョブ実行タスク ジョブのタスク再試行の最大数 10 いいえ ジョブ実行ごと
コンテナ インスタンス1 コンテナ インスタンスの最大数 選択したリージョン、CPU、メモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。 はい リビジョンごと
コンテナ インスタンス1 実行中のすべてのジョブ実行のコンテナ インスタンスの最大数 選択したリージョン、CPUメモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。 はい プロジェクトとリージョンごと
コンテナ インスタンス2 ダイレクト VPC 下り(外向き)を使用するコンテナ インスタンスの最大数 100~200。選択したリージョン構成によって異なります。 はい リビジョンとリージョンごと
コンテナ インスタンス 起動タイムアウト(分) 4 いいえ コンテナ インスタンスごと
メモリ 最大メモリサイズ(GiB) 32 いいえ コンテナ インスタンスごと
CPU vCPU の最大数 8 いいえ コンテナ インスタンスごと
ディスク 書き込み可能なメモリ内ファイル システムの最大サイズ(GiB)。インスタンスのメモリによって制限されます。 32 いいえ コンテナ インスタンスごと
環境変数 変数の最大長(KB) 32 いいえ 変数ごと
ドメイン マッピング SSL 証明書の最大数 50 いいえ トップドメインおよび週ごと
ドメイン マッピング 重複する SSL 証明書の最大数 5 いいえ トップドメインおよび週ごと
アクセス トークン 生成される一意のアクセス トークンの最大数 50 いいえ コンテナ インスタンスごと、1 秒あたり
ID トークン 生成される一意の ID トークンの最大数 50 いいえ コンテナ インスタンスごと、1 秒あたり

1 このリージョンの割り当ては、いくつかのケースで使用されます。

  1. リビジョンの最大インスタンス属性に選択可能な最大値を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。

  2. ジョブの最大並列処理を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

  3. 1 つのリージョン内でジョブ実行を実行するためのコンテナ インスタンスの総数を制御します。

2 このリージョンの割り当ては、いくつかのケースで使用されます。

  1. ダイレクト VPC 下り(外向き)を使用して、リビジョンの最大インスタンス属性に選択可能な最大値を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。

  2. ダイレクト VPC 下り(外向き)を使用してジョブの最大並列処理を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

Cloud Run のネットワークの上限

Cloud Run のリクエストの上限

説明 上限
インスタンスあたりの同時リクエストの最大数 1000
HTTP/2 クライアント接続あたりの同時ストリームの最大数 100
リクエストごとのタイムアウトまでの最大時間 60 分
HTTP/1 リクエストの最大サイズ HTTP/1 サーバーを使用する場合は 32 MiB。HTTP/2 サーバーを使用する場合は無制限。
HTTP/1 レスポンスの最大サイズ Transfer-Encoding: chunked またはストリーミング メカニズムを使用しない場合は 32 MiB
インスタンスごとの 1 秒あたりのアウトバウンド接続 700
インスタンスごとの HTTP/1 コンテナポートへの 1 秒あたりのインバウンド リクエスト数 800 HTTP/2 コンテナポートには適用されません。

Cloud Run の帯域幅の上限

Cloud Run インスタンスには、次の帯域幅の上限が適用されます。

説明 上限
インスタンスあたりの最大バイト数 75 MB/秒(MBps) この上限は、VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)を除く、上り(内向き)バイト数と下り(外向き)バイト数の合計に基づいています。
インスタンスあたりの最大合計パケットレート 1 秒あたり 64,000 パケット この上限は、VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)を除く、上り(内向き)パケットと下り(外向き)パケットの合計に基づいています。

この 2 つの上限のいずれかに達すると、Cloud Run インスタンスの帯域幅が制限されます。

Cloud Run Admin API のレート上限

Cloud Run Admin API には次のレート上限が適用されます。この上限は、デプロイされた Cloud Run サービスに到達するリクエストには適用されません。

割り当て 説明 上限 引き上げ可能 スコープ
Cloud Run Admin API 読み取りリクエスト リージョンごとの 60 秒あたりの API 読み取り数。これは、Cloud Run サービスに対する読み取りリクエスト数ではありません。このリクエスト数に上限はありません。 60 秒あたり 3,000 個 プロジェクトとリージョンごと
Cloud Run Admin API 書き込みリクエスト リージョンごとの 60 秒あたりの API 書き込み数。これは、Cloud Run サービスに対する書き込みリクエスト数ではありません。このリクエスト数に上限はありません。 60 秒あたり 180 個 プロジェクトとリージョンごと
ジョブ実行 各リージョンで 60 秒あたりにジョブを実行できる最大回数。 60 秒あたり 180 個 プロジェクトとリージョンごと

割り当てを増やす方法

Google Cloud コンソールで割り当て値の引き上げをリクエストするには:

  1. [割り当て] ページに移動します。

    [割り当て] に移動

    残りの手順は Google Cloud コンソールに自動的に表示されます。

  2. [割り当て] ページの [割り当て] 列で、引き上げる対象の割り当てを見つけます。

    [フィルタ] 検索ボックスを使用して割り当て量を検索できます。

  3. 割り当ての左側にあるチェックボックスをオンにします。

  4. [ 割り当てを編集] をクリックします。[割り当ての変更] フォームが表示されます。

  5. [割り当ての変更] フォームで、[新しい上限] フィールドにプロジェクトに必要な追加割り当てを入力します。

  6. フォームのその他のフィールドに入力して、[完了] をクリックします。

  7. [リクエストを送信] をクリックします。

上記の手順は、割り当て増加リクエストの大半に適用されますが、次のいずれかの例外が発生する可能性があります。

  • 既存の使用量の上限がある場合は、割り当てを増やす前に使用量の上限を削除する必要があります。開示と契約が表示されます。この開示には、使用量の上限が削除され、デフォルトの上限に即座に更新されることが示されます。その後、割り当ての増加リクエストが Google Cloud によって正常に処理されます。
  • 場合によっては、Google Cloud コンソールによって、上限の引き上げをリクエストするための別のフォームにリダイレクトされます。フォームを送信すると、Google Cloud がメールでリクエストを承認します。
  • 一部の割り当ては、Google Cloud コンソールで更新できません。コンソールで割り当てを変更できない場合は、Cloud カスタマーケアに割り当ての増加をリクエストしてください。課金チームは割り当ての上限の引き上げを処理しません。

リソースクラスごとに異なる割り当て増加リクエストを作成することをおすすめします。たとえば、プロジェクトごとのネットワーク割り当て増加と、Compute Engine のネットワーク以外の割り当ての増加は、別に行ってください。異なるクラスのリクエストを組み合わせると、承認の評価により多くの時間がかかることがあり、1 回の増加リクエストのバッチが遅くなる可能性があります。

割り当ての増加リクエストに対して承認が必要な場合は、リクエストの受領確認メールを Google Cloud から受け取ることができます。ご不明な点がある場合は、そのメールに返信してください。Cloud カスタマーケアでは通常、2~3 営業日以内にリクエストを処理します。次に、割り当ての増加が承認されたか拒否されたかを通知する 2 通目のメールが Cloud カスタマーケアから送信されます。このメールには発効日が記載されています(該当する場合)。

割り当ての増加のプロセスの詳細については、割り当ての増加リクエストについてをご覧ください。