注: 今後数か月にわたり、App Engine ドキュメントサイトの再編成を行い、コンテンツを見つけやすくして、他の Google Cloud プロダクトとより適切に連携できるようにします。同じコンテンツを使用できますが、ナビゲーションは残りの Cloud プロダクトと同じになります。

インスタンスの管理方法

Python |Java |Node.js |Go |Ruby |PHP |.NET

インスタンスは、アプリケーションを自動的にスケーリングするために App Engine で使われるコンピューティング単位です。ある時点において、アプリケーションは 1 つのインスタンスで実行されていることもあれば、複数のインスタンスで実行されていることもあります（このときリクエストはすべてのインスタンス間で分散されます）。

手動および基本スケーリングのインスタンスは継続的に実行されますが、稼働率の保証はありません。ハードウェアやソフトウェアの障害のため、事前の警告なくインスタンスが途中で終了したり、頻繁に再起動したりする場合があり、このような障害の解決には長い時間がかかることがあります。

すべてのフレキシブルインスタンスは毎週再起動されます。再起動中には、下位互換性のある重要な更新が基盤オペレーティングシステムに自動的に展開されます。アプリケーションのイメージは再起動後も同じままです。

ヘルスチェック

App Engine は、ヘルスチェックリクエストを定期的に送信して、インスタンスが動作していることと、インスタンスが完全に起動して受信リクエストを受け入れる準備ができていることを確認します。デフォルトでは、これらのヘルスチェックが有効になっており、スプリットヘルスチェックと呼ばれます。ヘルスチェックを受信するインスタンスは、指定された時間間隔内にそのヘルスチェックに応答する必要があります。

スプリットヘルスチェックのデフォルトの動作をアプリケーションに拡張する必要がある場合は、app.yaml ファイルをカスタマイズして次の 2 種類のヘルスチェックを構成します。

liveness チェックでは、VM インスタンスとそのコンテナが実行中であることを確認します。VM インスタンスが liveness チェックに失敗すると、インスタンスは自動的に再起動されます。liveness チェックは、構成されたしきい値と時間間隔、またはコンテナの障害が原因で失敗することがあります。
準備チェックでは、VM インスタンスが受信リクエストを受け入れる準備ができたことを確認します。VM インスタンスが準備チェックに失敗する場合、その VM インスタンスは起動が完了していないか、リクエストを受信する準備ができていないことを意味します。VM インスタンスが準備チェックに合格して起動が完了すると、使用可能なインスタンスのプールに追加されます。

スプリットヘルスチェックの動作の詳細については、スプリットヘルスチェックへの移行ガイドをご覧ください。

インスタンスでこれらのヘルスチェックが処理されると、App Engine ログでは、次のいずれかのインスタンス状態が示されます。

正常。インスタンスはヘルスチェックリクエストを受信し、リクエストを処理しています。正常なアプリケーションは、ヘルスチェックに 200 の HTTP ステータスコードで応答します。
異常。インスタンスがヘルスチェックリクエストを拒否し、特定の回数にわたって連続してヘルスチェックリクエストへの応答に失敗しました。App Engine は、ヘルスチェックリクエストを引き続き行い、異常なインスタンスが事前定義された回数にわたってヘルスチェックへの無応答を続ける場合は、そのインスタンスを再起動します。
レームダック。インスタンスには、シャットダウンまたは再起動がスケジュール設定されています。シャットダウン時には、インスタンスは進行中のリクエストを終了し、新しいリクエストを拒否します。アプリからは、インスタンスでリクエストを処理できないことを示す 503 コードが返されます。インスタンスがシャットダウンまたは再起動する前にシャットダウンスクリプトの実行期間は制限されており、短くすることや、長くするように構成することはできません。
アプリのレームダック。インスタンスでは、トラフィックを処理するための準備が進んでいます。アプリからは、インスタンスでリクエストを処理できないことを示す 503 コードが返されます。VM インスタンスが起動を完了しトラフィックを処理する準備が整うと、インスタンスは正常になりリクエストを処理します。VM インスタンスが時間内に起動しない場合は、インスタンスが異常に変更されて削除されます。

レームダックとアプリのレームダックの動作は、VM インスタンスが行う正常な処理の一部です。

リソース使用状況のモニタリング

Google Cloud コンソールの [インスタンス] ページでは、インスタンスのパフォーマンスを確認できます。各インスタンスのメモリと CPU の使用状況、稼働時間、リクエスト数と他の統計情報を確認できます。また、任意のインスタンスのシャットダウンプロセスを手動で開始できます。

App Engine フレキシブル環境での NTP

App Engine フレキシブル環境には、Google NTP サーバーを使用するネットワークタイムプロトコル（NTP）サービスがあります。ただし、フレキシブル環境の NTP サービスは変更できません。

インスタンスのロケーション

各インスタンスは、プロジェクトの設定に従って地理的なリージョンごとに自動的に配置されます。

インスタンスのスケーリング

アプリケーションの実行中、受信リクエストは適切なサービスやバージョンの既存または新規のインスタンスに転送されます。各アクティブバージョンでは少なくとも 1 つのインスタンスが動作しており、サービスまたはバージョンのスケーリングタイプによって追加のインスタンスの作成方法が制御されます。スケーリングタイプは、アプリの app.yaml で指定します。デフォルトでは、アプリは自動スケーリングを使用します。つまり、App Engine はアイドルインスタンスの数を管理します。

自動スケーリング: 自動スケーリングは、リクエスト率、レスポンスのレイテンシなどのアプリケーションの指標に基づいてインスタンスを作成します。automatic_scaling 要素を構成することで、それぞれの指標のしきい値と、常時稼働する最小数のインスタンスを指定できます。

手動スケーリング: 手動スケーリングでは、負荷レベルに関係なく、常に実行されるインスタンスの数を指定します。これにより、複雑な初期化などのタスクや、時間の経過に伴うメモリの状態に依存するアプリケーションが実行できるようになります。