Cloud Run の割り当てと上限

このページでは、Cloud Run の使用時に適用される使用量割り当てと上限について説明します。

Cloud Run のリソース数には上限が適用されます。Cloud Run の割り当ては、Cloud Run Admin API の呼び出しレートに影響を与える API のレート上限を包含します。

以下のものに対する直接的な上限はありません。

  • デプロイできるコンテナ イメージのサイズ
  • Cloud Run サービスによって処理される同時リクエストの数

Cloud Run のリソースの上限

増加可能な上限を引き上げるには、割り当ての増加をリクエストします。プロジェクトごとの上限を引き上げることができない場合は、別の Google Cloud プロジェクトまたはリージョンに新しいリソースを作成します。

リソース 範囲 説明 上限 上限引き上げ可能
サービス プロジェクトとリージョンごと サービスの最大数 1,000 ×
ジョブ プロジェクトとリージョンごと ジョブの最大数 1,000 ×
ジョブの実行 プロジェクトとリージョンごと 実行中のジョブの最大数 1000 ×
リビジョン サービスごと サービスごとのリビジョンの最大数。上限に達すると、サービスを提供していないリビジョンが、古い順に自動的に削除されます。 1,000 ×
リビジョン プロジェクトとリージョンごと トラフィックを処理するリビジョンの最大数 4000 ×
リビジョン タグ プロジェクトとリージョンごと リビジョンタグの最大数。リビジョンタグの数がこの上限に達すると、トラフィックの割合が設定されていないタグが古いものから順に自動的に削除されます。 2000 ×
ジョブの実行 ジョブごと 完了したジョブの実行の保持の上限。完了したジョブの実行数がこの上限に達すると、実行は古いものから自動的に削除されます。 1,000 ×
ジョブ実行タスク1 ジョブ実行ごと 並列で実行されるタスクの最大数 選択したリージョン、CPUメモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
ジョブ実行タスク ジョブ実行ごと タスクの最大タイムアウト値 24 時間 ×
ジョブ実行タスク ジョブ実行ごと 1 つのジョブの最大タスク数 10,000 ×
ジョブ実行タスク ジョブ実行ごと ジョブのタスク再試行の最大数 10 ×
コンテナ インスタンス1 リビジョンごと コンテナ インスタンスの最大数 選択したリージョン、CPU、メモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
コンテナ インスタンス1 プロジェクトとリージョンごと 実行中のすべてのジョブ実行のコンテナ インスタンスの最大数 選択したリージョン、CPUメモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
コンテナ インスタンス2 リビジョンとリージョンごと ダイレクト VPC 下り(外向き)を使用するコンテナ インスタンスの最大数 100~200。選択したリージョン構成によって異なります。
コンテナ インスタンス コンテナ インスタンスごと 起動タイムアウト(分) 4 ×
メモリ コンテナ インスタンスごと 最大メモリサイズ(GiB) 32 ×
CPU コンテナ インスタンスごと vCPU の最大数 8 ×
CPU プロジェクトとリージョンごと 1 分間にすべてのインスタンスに割り当てられる CPU の合計の上限(ミリ vCPU)。 選択したリージョンによって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
メモリ プロジェクトとリージョンごと 1 分間にすべてのインスタンスに割り当てられるメモリの合計の上限(バイト単位)。 選択したリージョンによって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
GPU インスタンス3 プロジェクトごと、リージョンあたり GPU を使用するコンテナ インスタンスの最大数 03
ディスク コンテナ インスタンスごと 書き込み可能なメモリ内ファイル システムの最大サイズ(GiB)。インスタンスのメモリによって制限されます。 32 ×
環境変数 変数ごと 変数の最大長(KB) 32 ×
ドメイン マッピング トップドメインおよび週ごと SSL 証明書の最大数 50 ×
ドメイン マッピング トップドメインおよび週ごと 重複する SSL 証明書の最大数 5 ×
アクセス トークン コンテナ インスタンスごと、1 秒あたり 生成される一意のアクセス トークンの最大数 50 ×
ID トークン コンテナ インスタンスごと、1 秒あたり 生成される一意の ID トークンの最大数 50 ×
ファイルのオープン コンテナ インスタンスごと 同時に開くことができるファイルの最大数。
/proc/sys/fs/file-max に対応しています。
25000 ×

1 このリージョンの割り当ては、いくつかのケースで使用されます。

  1. リビジョンの最大インスタンス属性に選択可能な最大値を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。

  2. ジョブの最大並列処理を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

  3. 1 つのリージョン内でジョブ実行を実行するためのコンテナ インスタンスの総数を制御します。

2 このリージョンの割り当ては、いくつかのケースで使用されます。

  1. ダイレクト VPC 下り(外向き)を使用して、リビジョンの最大インスタンス属性に選択可能な最大値を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。

  2. ダイレクト VPC 下り(外向き)を使用してジョブの最大並列処理を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

3 GPU にアクセスするには、Total Nvidia L4 GPU allocation, per project per region割り当ての増加をリクエストする必要があります。

Cloud Run のネットワークの上限

Cloud Run のリクエストの上限

説明 上限 備考
インスタンスあたりの同時リクエストの最大数 1000
HTTP/2 クライアント接続あたりの同時ストリームの最大数 100
リクエストごとのタイムアウトまでの最大時間 60 分
HTTP/1 リクエストの最大サイズ HTTP/1 サーバーを使用する場合は 32 MiB。HTTP/2 サーバーを使用する場合は無制限。
HTTP/1 レスポンスの最大サイズ Transfer-Encoding: chunked またはストリーミング メカニズムを使用しない場合は 32 MiB
インスタンスごとの 1 秒あたりのアウトバウンド接続 700
インスタンスごとの 1 秒あたりのアウトバウンド DNS 解決数 1000
インスタンスごとの HTTP/1 コンテナポートへの 1 秒あたりのインバウンド リクエスト数 800 HTTP/2 コンテナポートには適用されません。

Cloud Run の帯域幅の上限

Cloud Run インスタンスには、次の帯域幅の上限が適用されます。

説明 上限
ダイレクト VPC 経由の下り(外向き)のインスタンスあたりの最大ビット数 1 Gbps VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)。
インスタンスあたりの最大ビット数(ダイレクト VPC 経由の下り(外向き)を除く) 600 Mbps 上り(内向き)パケットと下り(外向き)の合計ビット数に基づきます。VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)は除きます。
インスタンスあたりの最大合計パケットレート(ダイレクト VPC 経由の下り(外向き)を除く) 1 秒あたり 64,000 パケット 上り(内向き)パケットと下り(外向き)パケットの合計に基づきます。VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)は除きます。

この 2 つの上限のいずれかに達すると、Cloud Run インスタンスの帯域幅が制限されます。

Cloud Run Admin API のレート上限

Cloud Run Admin API には次のレート上限が適用されます。この上限は、デプロイされた Cloud Run サービスに到達するリクエストには適用されません。

割り当て 説明 上限 引き上げ可能 スコープ
Cloud Run Admin API 読み取りリクエスト リージョンごとの 60 秒あたりの API 読み取り数。これは、Cloud Run サービスに対する読み取りリクエスト数ではありません。このリクエスト数に上限はありません。 60 秒あたり 3,000 個 プロジェクトとリージョンごと
Cloud Run Admin API 書き込みリクエスト リージョンごとの 60 秒あたりの API 書き込み数。これは、Cloud Run サービスに対する書き込みリクエスト数ではありません。このリクエスト数に上限はありません。 60 秒あたり 180 個 プロジェクトとリージョンごと
ジョブ実行 各リージョンで 60 秒あたりにジョブを実行できる最大回数。 60 秒あたり 180 個 プロジェクトとリージョンごと

割り当てを増やす方法

割り当て値の引き上げをリクエストする手順は次のとおりです。

  1. [割り当てとシステム上限] ページに移動します。

  2. [割り当て] 列で、引き上げる対象の割り当てを見つけます。[フィルタ] 検索ボックスを使用して割り当てを検索します。

  3. 割り当ての左側にあるチェックボックスをオンにします。

  4. [編集] をクリックします。[割り当ての変更] フォームが表示されます。

  5. [割り当ての変更] フォームで、[新しい上限] フィールドにプロジェクトに必要な追加割り当てを入力します。

  6. フォームのその他のフィールドに入力して、[完了] をクリックします。

  7. [リクエストを送信] をクリックします。

上記の手順は、割り当て増加リクエストの大半に適用されますが、次のいずれかの例外が発生する可能性があります。

  • 既存の使用量の上限がある場合は、割り当てを増やす前に使用量の上限を削除する必要があります。開示と契約が表示されます。この開示には、使用量の上限が削除され、デフォルトの上限に即座に更新されることが示されます。その後、割り当ての増加リクエストが Google Cloud によって正常に処理されます。

  • 場合によっては、Google Cloud コンソールによって、上限の引き上げをリクエストするための別のフォームにリダイレクトされます。フォームを送信すると、Google Cloud がメールでリクエストを承認します。

  • 一部の割り当ては、Google Cloud コンソールで更新できません。コンソールで割り当てを変更できない場合は、Cloud カスタマーケアに割り当ての増加をリクエストしてください。課金チームは割り当ての調整に対応していません。

リソースクラスごとに異なる割り当て増加リクエストを作成することをおすすめします。たとえば、プロジェクトごとのネットワーク割り当て増加と、Compute Engine のネットワーク以外の割り当て増加は、別々に行ってください。異なるクラスのリクエストを組み合わせると、承認の評価により多くの時間がかかることがあり、1 回の増加リクエストのバッチが遅くなる可能性があります。

割り当ての増加リクエストに対して承認が必要な場合は、リクエストの受領確認メールを Google Cloud から受け取ることができます。ご不明な点がある場合は、そのメールに返信してください。リクエストの審査後、割り当ての増加が承認されたか却下されたかを通知する 2 通目のメールが Cloud カスタマーケアから送信されます。割り当ての発効日が記載されています(該当する場合)。

割り当ての増加のプロセスの詳細については、割り当ての増加リクエストについてをご覧ください。