Cloud Run の割り当てと上限

このページでは、Cloud Run の使用時に適用される使用量割り当てと上限について説明します。

Cloud Run のリソース数には上限が適用されます。Cloud Run の割り当ては、Cloud Run Admin API の呼び出しレートに影響を与える API のレート上限を包含します。

以下のものに対する直接的な上限はありません。

デプロイできるコンテナイメージのサイズ
Cloud Run サービスによって処理される同時リクエストの数

Cloud Run のリソース制限

リソース	範囲	説明	上限	上限引き上げ可能
サービス	プロジェクトとリージョンごと	サービスの最大数	1,000	×
ジョブ	プロジェクトとリージョンごと	ジョブの最大数	1,000	×
ジョブの実行	プロジェクトとリージョンごと	実行中のジョブの最大数	1000	×
リビジョン	サービスごと	サービスごとのリビジョンの最大数。上限に達すると、サービスを提供していないリビジョンが、古い順に自動的に削除されます。	1,000	×
リビジョン	プロジェクトとリージョンごと	トラフィックを処理するリビジョンの最大数	4000	×
リビジョンタグ	プロジェクトとリージョンごと	リビジョンタグの最大数。リビジョンタグの数がこの上限に達すると、トラフィックの割合が設定されていないタグが古いものから順に自動的に削除されます。	2000	×
ジョブの実行	ジョブごと	完了したジョブの実行の保持の上限。完了したジョブの実行数がこの上限に達すると、実行は古いものから自動的に削除されます。	1,000	×
ジョブ実行タスク¹	ジョブ実行ごと	並列で実行されるタスクの最大数	選択したリージョン、CPU、メモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。	○
ジョブ実行タスク	ジョブ実行ごと	タスクの最大タイムアウト値	24 時間	×
ジョブ実行タスク	ジョブ実行ごと	1 つのジョブの最大タスク数	10,000	×
ジョブ実行タスク	ジョブ実行ごと	ジョブのタスク再試行の最大数	10	×
コンテナインスタンス¹	リビジョンごと	コンテナインスタンスの最大数	選択したリージョン、CPU、メモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。	○
コンテナインスタンス¹	プロジェクトとリージョンごと	実行中のすべてのジョブ実行のコンテナインスタンスの最大数	選択したリージョン、CPU、メモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。	○
コンテナインスタンス²	リビジョンとリージョンごと	ダイレクト VPC 下り（外向き）を使用するコンテナインスタンスの最大数	100～200。選択したリージョン構成によって異なります。	○
コンテナインスタンス	コンテナインスタンスごと	起動タイムアウト（分）	4	×
メモリ	コンテナインスタンスごと	最大メモリサイズ（GiB）	32	×
CPU	コンテナインスタンスごと	vCPU の最大数	8	×
CPU	プロジェクトとリージョンごと	1 分間にすべてのインスタンスに割り当てられる CPU の合計の上限。	選択したリージョンによって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。	○
メモリ	プロジェクトとリージョンごと	1 分間にすべてのインスタンスに割り当てられた最大合計メモリ。	選択したリージョンによって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。	○
GPU	プロジェクトごと、リージョンあたり	GPU の最大数	7	○
ディスク	コンテナインスタンスごと	書き込み可能なメモリ内ファイルシステムの最大サイズ（GiB）。インスタンスのメモリによって制限されます。	32	×
環境変数	変数ごと	変数の最大長（KB）	32	×
ドメインマッピング	トップドメインおよび週ごと	SSL 証明書の最大数	50	×
ドメインマッピング	トップドメインおよび週ごと	重複する SSL 証明書の最大数	5	×
アクセストークン	コンテナインスタンスごと、1 秒あたり	生成される一意のアクセストークンの最大数	50	×
ID トークン	コンテナインスタンスごと、1 秒あたり	生成される一意の ID トークンの最大数	50	×
ファイルのオープン	コンテナインスタンスごと	同時に開くことができるファイルの最大数。 `/proc/sys/fs/file-max` に対応しています。	25000	×

¹ このリージョンの割り当ては、いくつかのケースで使用されます。

リビジョンの最大インスタンス属性に選択可能な最大値を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。

ジョブの最大並列処理を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

1 つのリージョン内でジョブ実行を実行するためのコンテナインスタンスの総数を制御します。

² このリージョンの割り当ては、いくつかのケースで使用されます。

ダイレクト VPC 下り（外向き）を使用して、リビジョンの最大インスタンス属性に選択可能な最大値を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。
ダイレクト VPC 下り（外向き）を使用してジョブの最大並列処理を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

Cloud Run のネットワークの上限

Cloud Run のリクエストの上限

説明	上限	備考
インスタンスあたりの同時リクエストの最大数	1000
HTTP/2 クライアント接続あたりの同時ストリームの最大数	100
リクエストごとのタイムアウトまでの最大時間	60 分
HTTP/1 リクエストの最大サイズ	HTTP/1 サーバーを使用する場合は 32 MiB。HTTP/2 サーバーを使用する場合は無制限。
HTTP/1 レスポンスの最大サイズ	`Transfer-Encoding: chunked` またはストリーミングメカニズムを使用しない場合は 32 MiB
インスタンスごとの 1 秒あたりのアウトバウンド接続	700
インスタンスごとの HTTP/1 コンテナポートへの 1 秒あたりのインバウンドリクエスト数	800	HTTP/2 コンテナポートには適用されません。

Cloud Run の帯域幅の上限

Cloud Run インスタンスには、次の帯域幅の上限が適用されます。

説明	上限	備考
ダイレクト VPC 経由の下り（外向き）のインスタンスあたりの最大バイト数	1 Gbps	VPC ネットワーク上の宛先へのダイレクト VPC 下り（外向き）経由の下り（外向き）。
インスタンスあたりの最大バイト数（ダイレクト VPC 経由の下り（外向き）を除く）	75 MB/秒（Mbps）	上り（内向き）バイト数と下り（外向き）バイト数の合計に基づきます。VPC ネットワーク上の宛先へのダイレクト VPC 下り（外向き）経由の下り（外向き）は除きます。
インスタンスあたりの最大合計パケットレート（ダイレクト VPC経由の下り（外向き）を除く）	1 秒あたり 64,000 パケット	上り（内向き）パケットと下り（外向き）パケットの合計に基づきます。VPC ネットワーク上の宛先へのダイレクト VPC 下り（外向き）経由の下り（外向き）は除きます。

この 2 つの上限のいずれかに達すると、Cloud Run インスタンスの帯域幅が制限されます。

Cloud Run Admin API のレート上限

Cloud Run Admin API には次のレート上限が適用されます。この上限は、デプロイされた Cloud Run サービスに到達するリクエストには適用されません。

割り当て	説明	上限	引き上げ可能	スコープ
Cloud Run Admin API 読み取りリクエスト	リージョンごとの 60 秒あたりの API 読み取り数。これは、Cloud Run サービスに対する読み取りリクエスト数ではありません。このリクエスト数に上限はありません。	60 秒あたり 3,000 個	○	プロジェクトとリージョンごと
Cloud Run Admin API 書き込みリクエスト	リージョンごとの 60 秒あたりの API 書き込み数。これは、Cloud Run サービスに対する書き込みリクエスト数ではありません。このリクエスト数に上限はありません。	60 秒あたり 180 個	○	プロジェクトとリージョンごと
ジョブ実行	各リージョンで 60 秒あたりにジョブを実行できる最大回数。	60 秒あたり 180 個	○	プロジェクトとリージョンごと

割り当てを増やす方法

Google Cloud コンソールで割り当て値の引き上げをリクエストするには:

1. [割り当てとシステム上限] ページに移動します。

[割り当てとシステム上限] に移動

[割り当て] 列で、引き上げる対象の割り当てを見つけます。[フィルタ] 検索ボックスを使用して割り当てを検索します。
割り当ての左側にあるチェックボックスをオンにします。
[編集] をクリックします。[割り当ての変更] フォームが表示されます。
[割り当ての変更] フォームで、[新しい上限] フィールドにプロジェクトに必要な追加割り当てを入力します。
フォームのその他のフィールドに入力して、[完了] をクリックします。
[リクエストを送信] をクリックします。

上記の手順は、割り当て増加リクエストの大半に適用されますが、次のいずれかの例外が発生する可能性があります。

既存の使用量の上限がある場合は、割り当てを増やす前に使用量の上限を削除する必要があります。開示と契約が表示されます。この開示には、使用量の上限が削除され、デフォルトの上限に即座に更新されることが示されます。その後、割り当ての増加リクエストが Google Cloud によって正常に処理されます。
場合によっては、Google Cloud コンソールによって、上限の引き上げをリクエストするための別のフォームにリダイレクトされます。フォームを送信すると、Google Cloud がメールでリクエストを承認します。
一部の割り当ては、Google Cloud コンソールで更新できません。コンソールで割り当てを変更できない場合は、Cloud カスタマーケアに割り当ての増加をリクエストしてください。課金チームは割り当ての調整に対応していません。

リソースクラスごとに異なる割り当て増加リクエストを作成することをおすすめします。たとえば、プロジェクトごとのネットワーク割り当て増加と、Compute Engine のネットワーク以外の割り当て増加は、別々に行ってください。異なるクラスのリクエストを組み合わせると、承認の評価により多くの時間がかかることがあり、1 回の増加リクエストのバッチが遅くなる可能性があります。

割り当ての増加リクエストに対して承認が必要な場合は、リクエストの受領確認メールを Google Cloud から受け取ることができます。ご不明な点がある場合は、そのメールに返信してください。リクエストの審査後、割り当ての増加が承認されたか却下されたかを通知する 2 通目のメールが Cloud カスタマーケアから送信されます。割り当ての発効日が記載されています（該当する場合）。

割り当ての増加のプロセスの詳細については、割り当ての増加リクエストについてをご覧ください。