このページは Cloud Translation API によって翻訳されました。

コンテナランタイムの契約

このページでは、Cloud Run のコンテナの主な要件と動作について説明します。このページでは、必要に応じて Cloud Run サービス、Cloud Run ジョブ、Cloud Run ワーカープールの違いについても説明します。

サポートされる言語とイメージ

このページに記載されている制約を遵守すると、コンテナイメージでは任意のプログラミング言語で書かれたコードを実行でき、任意のベースイメージを使用できます。

コンテナイメージ内の実行可能ファイルは、Linux 64 ビット用にコンパイルする必要があります。Cloud Run は特に Linux x86_64 ABI 形式をサポートしています。

Cloud Run は、Docker イメージ Manifest V2、スキーマ 1、スキーマ 2、OCI のイメージ形式のコンテナイメージを受け入れます。Cloud Run は、Zstd で圧縮されたコンテナイメージも受け入れます。

マルチアーキテクチャイメージをデプロイする場合は、マニフェストリストに linux/amd64 を含める必要があります。

Cloud Run でデプロイされる関数の場合、Google Cloud の Buildpack によって公開されている Cloud Run ランタイムベースイメージのいずれかを使用して、セキュリティとメンテナンスの更新を自動的に受け取ることができます。サポートされているランタイムについては、ランタイムサポートのスケジュールをご覧ください。

正しいポートでのリクエストのリッスン（サービス）

Cloud Run サービスが、受信リクエストを処理するために Cloud Run インスタンスを起動します。Cloud Run インスタンスには、リクエストをリッスンする Ingress コンテナが常に 1 つあり、必要に応じて 1 つ以上のサイドカーコンテナがあります。次のポート構成の詳細は、Ingress コンテナにのみ適用され、サイドカーには適用されません。

インスタンス内の Ingress コンテナは、リクエストの送信先ポートで 0.0.0.0 のリクエストをリッスンする必要があります。特に、Ingress コンテナは 127.0.0.1 でリッスンする必要はありません。デフォルトでリクエストは 8080 に送信されますが、選択したポートにリクエストを送信するように Cloud Run を構成することもできます。Cloud Run は、PORT 環境変数を ingress コンテナに追加します。

ジョブの実行中に動作するコンテナは、完了時に終了しなければならない

Cloud Run ジョブの場合、ジョブが正常に完了したときに、コンテナは終了コード 0 で終了する必要があります。ジョブが失敗した場合は、ゼロ以外の終了コードで終了する必要があります。

ジョブはリクエストを処理しないため、コンテナでポートのリッスンや、ウェブサーバーの起動は行わないでください。

Transport Layer Encryption（TLS）

コンテナに Transport Layer Security を直接実装しないでください。TLS は HTTPS および gRPC 対応の Cloud Run によって終了し、リクエストは TLS なしで HTTP/1 または gRPC としてコンテナにプロキシされます。

Cloud Run サービスを構成して、HTTP/2 エンドツーエンドを使用する場合、コンテナは HTTP/2 クリアテキスト（h2c）形式でリクエストを処理する必要があります。これは、TLS が Cloud Run によって引き続き自動的に終了するためです。

レスポンス（サービス）

Cloud Run サービスの場合、コンテナは、リクエストを受信してからリクエストタイムアウト設定で指定された時間内に、コンテナの起動時間を含むレスポンスを送信する必要があります。その時間を過ぎると、リクエストが終了し、504 エラーが返されます。

レスポンスのキャッシュ保存と Cookie

Cloud Run サービスのレスポンスに Set-Cookie ヘッダーが含まれている場合、Cloud Run は Cache-Control ヘッダーを private に設定して、レスポンスがキャッシュに保存されないようにします。これにより、他のユーザーが Cookie を取得できなくなります。

環境変数

Cloud Run サービスとジョブでは、異なる環境変数のセットを使用できます。

サービスの環境変数

次の環境変数は、PORT を除くすべての実行中のコンテナに自動的に追加されます。PORT 変数は Ingress コンテナにのみ追加されます。

名前	説明	例
`PORT`	HTTP サーバーでリッスンするポート。	`8080`
`K_SERVICE`	実行されている Cloud Run サービスの名前。	`hello-world`
`K_REVISION`	実行されている Cloud Run リビジョンの名前。	`hello-world.1`
`K_CONFIGURATION`	リビジョンを作成した Cloud Run 構成の名前。	`hello-world`

ジョブの環境変数

Cloud Run ジョブの場合、次の環境変数が設定されます。

名前	説明	例
`CLOUD_RUN_JOB`	実行されている Cloud Run ジョブの名前。	`hello-world`
`CLOUD_RUN_EXECUTION`	実行されている Cloud Run 実行の名前。	`hello-world-abc`
`CLOUD_RUN_TASK_INDEX`	このタスクのインデックス。最初のタスクは 0 から始まり、タスクの最大数から 1 を引いた数まで、続けてタスクを実行するたびに 1 ずつ増えます。`--parallelism` を 1 より大きい値に設定すると、タスクがインデックス順に開始されない場合があります。たとえば、タスク 2 をタスク 1 の前に開始できます。	`0`
`CLOUD_RUN_TASK_ATTEMPT`	このタスクが再試行された回数。最初の試行は 0 から始まり、再試行の最大回数まで、続けて再試行するたびに 1 ずつ増加します。	`0`
`CLOUD_RUN_TASK_COUNT`	`--tasks` パラメータで定義されたタスクの数。	`1`

ワーカープールの環境変数

Cloud Run は、ワーカープールに次の環境変数を設定します。

名前	説明	例
`CLOUD_RUN_WORKER_POOL`	実行中の Cloud Run ワーカープールの名前。	`hello-world`
`CLOUD_RUN_WORKER_POOL_REVISION`	実行中の Cloud Run ワーカープールリビジョンの名前。	`hello-world.1`

リクエストヘッダーとレスポンスヘッダーの要件（サービス）

サービスの場合、Cloud Run はヘッダー名を印刷可能な非空白 ASCII に制限し、コロンを含めることはできません。Cloud Run では、IETF RFC 7230 に従って、ヘッダー値が目視可能な ASCII 文字とスペースと水平タブに制限されます。

ファイルシステムへのアクセス

各コンテナのファイルシステムは書き込み可能で、次の動作の影響を受けます。

これはインメモリファイルシステムであるため、書き込みにはインスタンスのメモリが使用されます。
インスタンスが停止すると、ファイルシステムに書き込まれたデータは保持されません。

このファイルシステムにはサイズの上限を指定できないため、インメモリファイルシステムに書き込むことでインスタンスに割り当てられたすべてのメモリを使い果たし、その結果、インスタンスがクラッシュする可能性があります。サイズの上限が設定された専用のインメモリボリュームを使用すると、この問題を回避できます。

インスタンスのライフサイクル

ライフサイクルの特性は、Cloud Run ジョブとサービスで異なるため、以降のサブセクションで分けて説明します。

サービスの場合

以下の特性は、サービスにのみ適用されます。

サービスのスケーリング

デフォルトでは、Cloud Run サービスは、すべての受信リクエスト、イベント、CPU 使用率を処理するために必要なインスタンス数に自動的にスケーリングされます。スケーリング動作をより細かく制御する必要がある場合は、手動スケーリングを使用できます。

すべてのインスタンスは、所定の数のコンテナ（1 つ Ingress コンテナと、オプションで 1 つ以上のサイドカーコンテナ）を実行します。

リビジョンがトラフィックを受信しない場合、構成されたインスタンスの最小数にスケールインされます（デフォルトはゼロ）。

スタートアップ

Cloud Run サービスの場合、インスタンスは起動後 4 分以内にリクエストをリッスンする必要があります。また、インスタンス内のすべてのコンテナが良好な状態である必要があります。この起動時間でインスタンスに CPU が割り当てられます。起動時の CPU ブーストを有効にすることで、インスタンスの起動時に一時的に CPU 割り当てを増やして起動レイテンシを短縮できます。

構成されたポートでリッスンしているので、リクエストはすぐに Ingress コンテナに送信されます。

インスタンスを待機しているリクエストは、次のようにキュー内で保留状態になります。

リクエストは、このサービスのコンテナインスタンスの平均起動時間の 3.5 倍、または 10 秒の、いずれか長い方の間は保留されます。

Startup Probe を構成して、コンテナが起動してリクエストに対応する準備ができているかどうかを判断できます。

マルチコンテナインスタンスで構成される Cloud Run サービスの場合、コンテナの起動順序を構成することで、インスタンス内でコンテナを起動する順序を指定できます。

リクエストの処理

Cloud Run サービスの場合、Cloud Run リビジョンが少なくとも 1 つのリクエストを処理している限り、CPU はインスタンス内のサイドカーを含むすべてのコンテナに必ず割り当てられます。

アイドル状態

Cloud Run サービスの場合、アイドル状態のインスタンスは、リクエストを処理していないインスタンスです。

アイドル状態のインスタンス内のすべてのコンテナに割り当てられる CPU は、構成された課金設定によって異なります。

インスタンスの最小数の構成でインスタンスをアイドル状態にする必要がある場合を除き、15 分以上アイドル状態になることはありません。

シャットダウン

Cloud Run サービスの場合、アイドル状態のインスタンスは、構成された最小数のインスタンスによりウォーム状態を維持するインスタンスを含め、いつでもシャットダウンできます。リクエストを処理しているインスタンスをシャットダウンする必要がある場合、すでに処理されているリクエストには完了までの時間が与えられ、新しい受信リクエストは他のインスタンスに転送されます。例外として、Cloud Run がシャットダウンを開始し、まだリクエストを処理しているコンテナに SIGTERM シグナルを送信する場合があります。

インスタンスをシャットダウンする前に、Cloud Run から SIGTERM シグナルがインスタンス内のすべてのコンテナに送信されます。これは、Cloud Run が SIGKILL シグナルを送信してから 10 秒後に実際のシャットダウンが開始することを表しています。この期間中、インスタンスに CPU が割り当てられ、課金されます。第 1 世代の実行環境を使用するサービスでは、インスタンスが SIGTERM シグナルをトラップしない場合、直ちにシャットダウンされます第 2 世代の実行環境を使用するサービスでは、Cloud Run がインスタンスをシャットダウンしようとしたときに警告を受け取るために、コンテナに SIGTERM ハンドラをインストールすることをおすすめします。

強制終了

1 つ以上の Cloud Run コンテナがコンテナのメモリ上限を超えると、インスタンスは終了します。インスタンスで処理中のすべてのリクエストは、HTTP 500 エラーで終了します。

ジョブの場合

Cloud Run ジョブの場合、コンテナインスタンスは、コンテナインスタンスが終了するか、タスクタイムアウトに達するか、コンテナがクラッシュするまで実行されます。

終了コード

ジョブの終了コードを使用すると、ジョブが正常に完了したかどうか、エラーが発生したかどうかを確認できます。終了コードは、正常な完了または特定の種類のエラーに対応する数値です。

次の表に、一般的な終了コードとその定義を示します。

終了コード	シグナル	説明
0		タスクは正常に完了しました。
4	`SIGILL`	タスクが、間違ったアドレスのメモリにアクセスしようとしました。
7	`SIGBUS`	タスクが、割り当てられた境界外のメモリにアクセスしようとしました。
9	`SIGKILL`	ユーザーの操作または手動による介入によってタスクが強制的に終了されました。
11	`SIGSEGV`	タスクが、承認されていないメモリにアクセスしようとしました。
15	`SIGTERM`	タスクが構成済みのタイムアウトを超えた場合、またはタスクがキャンセルされた場合、`SIGTERM` シグナルを受け取ります。アプリケーションサーバーは、コンテナインスタンスをシャットダウンするために `SIGTERM` シグナルを送信します。`SIGTERM` を受信してから数秒以内にインスタンスが自動的にシャットダウンしない場合、Cloud Run は強制終了の `SIGKILL` シグナルを送信します。インスタンスが `SIGTERM` で正しく終了した場合は、別のエラーコードが報告されることがあります。それ以外の場合は、`SIGTERM` が返されます。

強制終了

メモリ制限の上限を超える Cloud Run コンテナインスタンスは終了します。コンテナインスタンスで処理中のすべてのリクエストは、HTTP 500 エラーで終了します。

タスクがタスクタイムアウトを超えると、Cloud Run は実際のシャットダウンが発生する 10 秒前の開始を示す「SIGTERM」シグナルを送信します。シャットダウンの際は、Cloud Run が SIGKILL シグナルを送信し、コンテナインスタンスをシャットダウンします。

この期間中、コンテナインスタンスにはライフサイクル全体について CPU が割り当てられ、課金の対象になります。

SIGTERM シグナルをトラップする方法については、SIGTERM コードサンプルをご覧ください。

ワーカープールの場合

次の特性は、ワーカープールにのみ適用されます。

スケーリング

ワーカープールは自動的にスケーリングされません。Cloud Run ワーカープールがワークロードを処理するために必要なインスタンスの数を手動でスケーリングします。デフォルトでは、Cloud Run はインスタンス数を 1 に設定します。この数値を増減したり、数値を 0 に設定してスケーリングを無効にしたりできます。ワークロードを開始してアクティブな状態を維持するには、少なくとも 1 つのインスタンスが必要です。最小インスタンスを 0 に設定すると、デプロイが成功してもワーカーインスタンスは起動しません。

起動

Cloud Run ワーカープールインスタンスは、コンテナイメージまたはワーカープール構成で指定したエントリポイントを使用してコンテナを起動します。インスタンス内のすべてのコンテナが正常である必要があります。

デフォルトでは、Cloud Run コンテナインスタンスは 1 つの CPU を使用します。この値は、要件に基づいて増減できます。

起動プローブを構成して、コンテナが起動したかどうかを判断できます。起動プローブにより、Cloud Run は依存コンテナの状態を検査し、次のコンテナを起動する前に合格したことを確認します。ヘルスチェックを使用しない場合、Cloud Run は、依存するコンテナが起動に失敗した場合でも、指定された順序でコンテナを起動します。

リソースの割り当て

ワーカープールはアイドル状態になりません。状態に関係なく、Cloud Run は常に CPU をすべてのコンテナ（ワーカープールインスタンス内のサイドカーを含む）に割り当てます。インスタンスが実行されている限り、インスタンスはアクティブと見なされ、それに応じて課金されます。

シャットダウン

Cloud Run は、アイドル状態のインスタンスに基づいてワーカープールインスタンスをスケールダウンしません。ワークロード処理インスタンスをシャットダウンする必要がある場合、Cloud Run は処理中のタスクに完了までの時間を与え、新しいワークロードを他のインスタンスに転送します。Cloud Run がシャットダウンを開始し、まだワークロードを処理しているコンテナに SIGTERM シグナルを送信することもあります。

インスタンスをシャットダウンする前に、Cloud Run から SIGTERM シグナルがインスタンス内のすべてのコンテナに送信されます。このシグナルは、Cloud Run が SIGKILL シグナルを送信してから 10 秒後に実際のシャットダウンが開始することを示します。このシャットダウン期間中、インスタンスに CPU が割り当てられ、課金されます。Cloud Run がインスタンスをシャットダウンしようとしたときに警告を受け取るために、コンテナに SIGTERM ハンドラをインストールすることをおすすめします。

強制終了

1 つ以上の Cloud Run コンテナがコンテナのメモリ上限を超えると、Cloud Run はインスタンスを終了します。インスタンスで処理中のすべてのリクエストは、HTTP 500 エラーで終了します。

コンテナインスタンスのリソース

以降のセクションでは、コンテナインスタンスの次のリソースについて説明します。

CPU
メモリ
GPU
同時実行

CPU

インスタンス内の各 Cloud Run コンテナには、デフォルトで構成された vCPU（デフォルトでは 1 つ）が割り当てられます。各コンテナに対して個別に CPU の上限を構成できます。

vCPU は、基盤となるハードウェアを抽象化して実装し、利用可能な CPU プラットフォームに対して単一ハードウェアのハイパースレッドとほぼ同等の CPU 時間を提供します。Cloud Run で使用されるすべての CPU プラットフォームは、AVX2 命令セットをサポートしています。コンテナ契約には追加の CPU プラットフォームの詳細が含まれていないことに注意してください。

コンテナは複数のコアで同時に実行できます。

Cloud Run サービスの場合、CPU 割り当ては選択した課金方法によって異なります。

インスタンスベースの課金を選択すると、CPU はインスタンスの存続期間中に割り振られます。リクエストベースの課金（デフォルト）を選択した場合、インスタンスがリクエストを処理するときに CPU が割り当てられます。詳しくは、課金設定をご覧ください。

最小インスタンス数を構成している場合は、インスタンスベースの課金を使用して、リクエスト以外で CPU が割り当てられるようにする必要があります。

起動時の CPU ブーストを有効にすることで、インスタンスの起動時に一時的に CPU 割り当てを増やして起動レイテンシを短縮できます。

メモリ

デフォルトでは、各 Cloud Run コンテナに構成されたメモリが割り当てられます（デフォルトでは 512 MiB）。各コンテナに個別にメモリ上限を構成できます。

メモリの一般的な用途は次のとおりです。

サービスを実行するためのコードの読み込み
ファイルシステムへの書き込み
nginx サーバーなどのコンテナ内で実行する別のプロセス
PHP の OpCache などのメモリ内キャッシュシステム
リクエストごとのメモリ使用量
共有インメモリボリューム

GPU

GPU にアクセスするように Cloud Run インスタンスのコンテナを構成できます。Cloud Run サービスがサイドカーコンテナとともにデプロイされている場合、デプロイ内の 1 つのコンテナのみが GPU にアクセスできます。要件と詳細については、GPU を構成するをご覧ください。

NVIDIA ライブラリ

デフォルトでは、すべての NVIDIA L4 ドライバライブラリが /usr/local/nvidia/lib64 にマウントされます。Cloud Run は、このパスを GPU を含むコンテナの LD_LIBRARY_PATH 環境変数（${LD_LIBRARY_PATH}:/usr/local/nvidia/lib64）に自動的に追加します。これにより、ダイナミックリンカーは NVIDIA ドライバライブラリを見つけることができます。リンカーは、LD_LIBRARY_PATH 環境変数にリストされている順序でパスを検索して解決します。この変数で指定した値は、デフォルトの Cloud Run ドライバライブラリパス /usr/local/nvidia/lib64 よりも優先されます。

12.2 より大きい CUDA バージョンを使用する場合は、上位互換性パッケージがすでにインストールされている新しい NVIDIA ベースイメージを利用するのが最も簡単な方法です。別の方法として、NVIDIA の上位互換性パッケージを手動でインストールし、LD_LIBRARY_PATH に追加することもできます。NVIDIA の互換性マトリックスを参照して、提供されている NVIDIA ドライババージョン（535.216.03）と上位互換性がある CUDA バージョンを確認します。

同時実行（サービス）

Cloud Run サービスの場合、各 Cloud Run インスタンスにはデフォルトで複数の同時実行が設定されます。ここで、Ingress コンテナは複数のリクエストを同時に受信できます。これを変更するには、同時実行の設定を行います。

コンテナサンドボックス

第 1 世代の実行環境を使用する場合、Cloud Run コンテナは、gVisor コンテナランタイムサンドボックスを使用してサンドボックス化されます。gVisor syscall 互換性リファレンスに記載されているように、このコンテナサンドボックスでは一部のシステムコールがサポートされていない場合があります。

第 2 世代の実行環境を使用している場合は、Linux との完全な互換性があります。Cloud Run ジョブは、常に第 2 世代の実行環境を使用します。第 2 世代の実行環境では、/sys/class/dmi/id/product_name は Google Compute Engine に設定されます。

第 2 世代の実行環境では、サービスコードが別のプロセス名前空間で実行されるため、特別なプロセスセマンティクスを持つコンテナ init プロセスとして開始されます。第 1 世代の実行環境では、サービスコードはコンテナ init プロセスとして実行されません。

ファイル記述子の上限

Cloud Run 第 1 世代と第 2 世代の環境では、プロセスで開くことのできるファイル記述子の数に上限が設定されています。この上限は 25,000 です。これは、コンテナと、コンテナが作成するすべての子プロセス（フォーク）に適用されます。これはハードリミットです。上限を超えると、インスタンスのファイル記述子 / ソケットが不足することがあります。

第 2 世代の環境の上限

前述のファイル記述子の上限を除き、第 2 世代環境の上限は標準の Linux 上限です。

たとえば、開くことができるファイル記述子の数（/proc/sys/fs/file-max でキャプチャ）の上限にはデフォルト値（メモリの約 10%）が使用されます。詳細については、カーネルドキュメントの file-max と file-nr をご覧ください。

同様に、プロセスが使用できるメモリ領域の数を設定する max_map_count（/proc/sys/vm/max_map_count でキャプチャ）は、デフォルトの 65535 を使用しています。詳細については、カーネルドキュメントの max-map-count をご覧ください。

特権コンテナと setuid バイナリ

Cloud Run は特権コンテナをサポートしていません。そのため、Cloud Run は、gcsfuse や sudo など、非 root ユーザーに対して setuid フラグを使用するバイナリをサポートしておらず、権限が不十分なために失敗する可能性があります。

代替手段として、これらのバイナリを root ユーザーとして実行し、実行時に su コマンドを使用して別のユーザーに切り替える方法があります。

たとえば、Dockerfile で USER 命令を削除し、エントリポイントスクリプトで次のシーケンスを使用します。

gcsfuse ...                 # Run gcsfuse as root
su myuser -c "/yourapp.sh"  # Switch to 'myuser' and run 'yourapp.sh'

実行ユーザー

ユーザー名が存在しない場合、Cloud Run はコンテナを root ユーザー（uid=0）として実行します。

インスタンスメタデータサーバー

Cloud Run インスタンスは、プロジェクト ID、リージョン、インスタンス ID、サービスアカウントなど、コンテナに関する詳細情報を取得するために使用できるメタデータサーバーを公開します。メタデータサーバーを使用して、サービス ID のトークンを生成することもできます。

メタデータサーバーのデータにアクセスするには、Metadata-Flavor: Google ヘッダーを使用して http://metadata.google.internal/ エンドポイントに HTTP リクエストを送信します。クライアントライブラリは必要ありません。詳細については、メタデータの取得をご覧ください。

次の表に、利用可能なメタデータサーバー情報の一部を示します。

パス	説明
`/computeMetadata/v1/project/project-id`	Cloud Run サービスまたはジョブが属するプロジェクトのプロジェクト ID
`/computeMetadata/v1/project/numeric-project-id`	Cloud Run サービスまたはジョブが属するプロジェクトのプロジェクト番号
`/computeMetadata/v1/instance/region`	この Cloud Run サービスまたはジョブのリージョン。`projects/PROJECT-NUMBER/regions/REGION` を返します。
`/computeMetadata/v1/instance/id`	インスタンスの固有識別子（ログでも使用可能）
`/computeMetadata/v1/instance/service-accounts/default/email`	この Cloud Run サービスまたはジョブのサービス ID のメールアドレス。
`/computeMetadata/v1/instance/service-accounts/default/token`	この Cloud Run サービスまたはジョブのサービスアカウントの OAuth2 アクセストークンを生成します。Cloud Run サービスエージェントはトークンの取得に使用されます。このエンドポイントは、`access_token` 属性を含む JSON レスポンスを返します。このアクセストークンを抽出して使用する方法について詳しくは、こちらをご覧ください。

Cloud Run では、インスタンスが実行されている Google Cloud ゾーンに関する詳細情報は提供されません。そのため、メタデータ属性 /computeMetadata/v1/instance/zone は常に projects/PROJECT-NUMBER/zones/REGION-1 を返します。

ファイル名

コンテナで使用するファイルの名前は、UTF-8 との互換性があるか、UTF-8、または UTF-8 に安全に自動変換できるものにする必要があります。ファイル名に異なるエンコードが使用されている場合は、UTF-8 互換のファイル名を持つマシンで Docker ビルドを実行してください。互換性のない UTF-8 名を含むコンテナにはファイルをコピーしないようにしてください。

ファイル名が UTF-8 と互換性がない場合、コンテナのデプロイは失敗します。ファイル内で使用する文字エンコードに制限はありません。

アウトバウンドリクエストのタイムアウト

Cloud Run のサービスとジョブでは、コンテナから VPC へのリクエストで 10 分間アイドル状態が継続するとタイムアウトが発生します。コンテナからインターネットへのリクエストの場合は、20 分間のアイドル時間の後にタイムアウトが発生します。

アウトバウンド接続のリセット

コンテナから VPC とインターネットの両方への接続ストリームは、基盤となるインフラストラクチャの再起動や更新時に終了したり、置き換える場合があります。アプリケーションで長期間の接続を再利用する場合は、切断された接続の再利用を避けるため、接続を再確立してアプリケーションを構成することをおすすめします。

コンテナ ランタイムの契約

サポートされる言語とイメージ

正しいポートでのリクエストのリッスン（サービス）

ジョブの実行中に動作するコンテナは、完了時に終了しなければならない

Transport Layer Encryption（TLS）

レスポンス（サービス）

レスポンスのキャッシュ保存と Cookie

環境変数

サービスの環境変数

ジョブの環境変数

ワーカープールの環境変数

リクエスト ヘッダーとレスポンス ヘッダーの要件（サービス）

ファイル システムへのアクセス

インスタンスのライフサイクル

サービスの場合

サービスのスケーリング

スタートアップ

リクエストの処理

アイドル状態

シャットダウン

強制終了

ジョブの場合

終了コード

強制終了

ワーカープールの場合

スケーリング

起動

リソースの割り当て

シャットダウン

強制終了

コンテナ インスタンスのリソース

CPU

メモリ

GPU

NVIDIA ライブラリ

同時実行（サービス）

コンテナ サンドボックス

ファイル記述子の上限

第 2 世代の環境の上限

特権コンテナと setuid バイナリ

実行ユーザー

インスタンス メタデータ サーバー

ファイル名

アウトバウンド リクエストのタイムアウト

アウトバウンド接続のリセット

コンテナランタイムの契約

リクエストヘッダーとレスポンスヘッダーの要件（サービス）

ファイルシステムへのアクセス

コンテナインスタンスのリソース

コンテナサンドボックス

インスタンスメタデータサーバー

アウトバウンドリクエストのタイムアウト