このページは Cloud Translation API によって翻訳されました。

Cloud Run 用に Python アプリケーションを最適化する

このガイドでは、Python プログラミング言語で作成された Cloud Run サービスの最適化と、最適化の一部に関連したトレードオフの理解に役立つ背景情報について説明します。このページの情報は、Python にも適用される全般的な最適化のヒントを補完するものです。

一般的な Python ウェブベースアプリケーションのベストプラクティスと最適化の多くは、以下を中心に展開されています。

同時リクエストの処理（スレッドベースと非ブロッキング I/O の両方）。
バックグラウンドタスクへのトレースや指標の送信など、重要性が低い機能に接続プールとバッチ処理を適用してレスポンスレイテンシを短縮する。

コンテナイメージを最適化する

次の方法でコンテナイメージを最適化し、負荷と起動時間を短縮します。

起動時に読み込むファイルを最小限に抑える
WSGI サーバーを最適化する

起動時に読み込むファイルを最小限に抑える

起動時間を最適化するには、起動時に必要なファイルのみを読み込み、そのサイズを小さくします。大きなファイルの場合は、次のオプションを検討してください。

AI モデルなどの大規模なファイルをコンテナに保存すると、アクセスが高速化されます。これらのファイルは、起動後または実行時に読み込むことを検討してください。
メディアアセットなど、起動時に重要でない大きなファイルについては、Cloud Storage ボリュームのマウントを構成することを検討してください。
重い依存関係から必要なサブモジュールのみをインポートするか、アプリケーションの起動時にモジュールを読み込むのではなく、コードで必要なときにモジュールをインポートします。

WSGI サーバーを最適化する

Python は、WSGI 標準 PEP-3333 の実装により、アプリケーションとウェブサーバーの連携方法を標準化しました。サンプルドキュメントでよく使用されている WSGI サーバーの一つが gunicorn です。

gunicorn を最適化する

Dockerfile に次の CMD を追加して、gunicorn の呼び出しを最適化します。

CMD exec gunicorn --bind :$PORT --workers 1 --threads 8 --timeout 0 main:app

この設定を変更する場合は、アプリケーションごとにワーカーとスレッドの数を調整します。たとえば、使用可能なコア数と同じ数のワーカーを使用して、パフォーマンスが改善されることを確認してから、スレッド数を調整します。ワーカーまたはスレッドが多すぎると、コールドスタートのレイテンシが長くなる、メモリの消費量が増える、1 秒あたりのリクエストが少なくなる、などのデメリットが生じる可能性があります。

デフォルトでは、gunicorn は起動時にワーカーを生成し、アプリケーションコードを評価する前でも指定されたポートをリッスンします。この場合、Cloud Run のデフォルトの起動プローブは、$PORT でリッスンを開始するとすぐに、コンテナインスタンスを正常な状態としてマークします。このため、サービスにカスタム起動プローブを設定する必要があります。

この動作を変更する場合は、--preload 設定を使用して gunicorn を呼び出し、リッスンを開始する前にアプリケーションコードを評価します。これには次のような利点があります。

デプロイ時に重大なランタイムバグを特定する
メモリリソースを節約する

これを追加する前に、アプリケーションがプリロードする対象を検討する必要があります。

他の WSGI サーバー

コンテナで Python を実行する場合、gunicorn の使用に制限はありません。コンテナランタイムの契約に従い、コンテナが HTTP ポート $PORT をリッスンしている場合は、WSGI または ASGI ウェブサーバーを使用できます。

一般的な代替手段としては、uwsgi、uvicorn、waitress があります。

たとえば、app オブジェクトを含む main.py というファイルの場合、次の呼び出しで WSGI サーバーを起動します。

# uwsgi: pip install pyuwsgi
uwsgi --http :$PORT -s /tmp/app.sock --manage-script-name --mount /app=main:app

# uvicorn: pip install uvicorn
uvicorn --port $PORT --host 0.0.0.0 main:app

# waitress: pip install waitress
waitress-serve --port $PORT main:app

これらは Dockerfile に CMD exec 行として追加できます。また、Google Cloud Buildpack を使用する場合は Procfile に web: エントリとして追加することもできます。

アプリケーションを最適化する

Cloud Run サービスコードで、起動時間とメモリ使用量を最適化することもできます。

スレッドを減らす

メモリを最適化するには、スレッド数を減らし、非ブロッキング型の事後対応戦略を使用して、バックグラウンドアクティビティを回避します。また、一般的なヒントのページで説明されているように、ファイルシステムへの書き込みも回避します。

Cloud Run サービスでバックグラウンドアクティビティをサポートする場合は、リクエストの外部でもバックグラウンドアクティビティを実行できて、CPU にアクセスできるように、Cloud Run サービスをインスタンスベースの課金に設定します。

起動タスクを減らす

Python ウェブベースアプリケーションでは、起動中に完了するタスクが多数あります。たとえば、データのプリロード、キャッシュのウォームアップ、接続プールの確立などです。これらのタスクを順番に実行すると、処理が遅くなる可能性があります。ただし、同時に実行するには、CPU コアの数を増やす必要があります。

Cloud Run は、コールドスタートインスタンスをトリガーするために実際のユーザーリクエストを送信しています。新しく開始したインスタンスにリクエストが割り当てられているユーザーは、大幅な遅延が発生する可能性があります。

スリムなベースイメージでセキュリティを強化する

アプリケーションのセキュリティを強化するには、パッケージとライブラリが少ないスリムなベースイメージを使用します。

コンテナ内のソースから Python をインストールしない場合は、Docker Hub の公式の Python ベースイメージを使用します。これらのイメージは Debian オペレーティングシステムをベースにしています。

Docker Hub の python イメージを使用している場合は、slim バージョンの使用を検討してください。これらのイメージには、ホイールの作成に使用されるパッケージ（アプリケーションに不要なパッケージなど）が数多く含まれていないため、イメージのサイズは小さくなります。python イメージには、GNU C コンパイラ、プリプロセッサ、コアユーティリティが含まれています。

ベースイメージに含まれているパッケージをサイズの大きい順に 10 個まで表示するには、次のコマンドを実行します。

DOCKER_IMAGE=python # or python:slim
docker run --rm ${DOCKER_IMAGE} dpkg-query -Wf '${Installed-Size}\t${Package}\t${Description}\n' | sort -n | tail -n10 | column -t -s $'\t'

このような低レベルパッケージの数は少ないため、slim ベースのイメージは、潜在的な脆弱性に対する攻撃対象領域も少なくなります。これらのイメージには、ソースからホイールを作成するために必要な要素が含まれていないことがあります。

特定のパッケージを再び追加するには、Dockerfile に RUN apt install 行を追加します。詳細については、Cloud Run でのシステムパッケージの使用をご覧ください。

Debian 以外のコンテナ用のオプションもあります。python:alpine オプションを使用すると、コンテナのサイズをかなり小さくできますが、Python パッケージの多くは、alpine ベースのシステムをサポートするコンパイル済みのホイールを備えていない可能性があります。サポートは改善されていますが（PEP-656 を参照）、継続的に変更されています。パッケージマネージャー、シェル、その他のプログラムを含まない distroless base image の使用も検討してください。

ロギングに `PYTHONUNBUFFERED` 環境変数を使用する

Python アプリケーションのログをバッファに保持せずに表示するには、環境変数 PYTHONUNBUFFERED を設定します。この変数を設定すると、一定量のデータが蓄積されるかストリームが閉じられるまでバッファに保持されるのではなく、stdout と stderr のデータがコンテナログにすぐに表示されます。

次のステップ

その他のヒントについては、以下を参照してください。