インスタンスの管理方法

インスタンスは、アプリケーションを自動的にスケーリングするために App Engine で使われるコンピューティング単位です。ある時点において、アプリケーションは 1 つのインスタンスで実行されていることもあれば、複数のインスタンスで実行されていることもあります(このときリクエストはすべてのインスタンス間で分散されます)。

手動および基本スケーリングのインスタンスは継続的に実行されますが、稼働率の保証はありません。ハードウェアやソフトウェアの障害のため、事前の警告なくインスタンスが途中で終了したり、頻繁に再起動したりする場合があり、このような障害の解決には長い時間がかかることがあります。

すべてのフレキシブル インスタンスは毎週再起動されます。再起動中には、下位互換性のある重要な更新が基盤オペレーティング システムに自動的に展開されます。アプリケーションのイメージは再起動後も同じままです。

ヘルスチェック

App Engine は、ヘルスチェック リクエストを定期的に送信して、インスタンスが動作していることと、インスタンスが完全に起動して受信リクエストを受け入れる準備ができていることを確認します。デフォルトでは、これらのヘルスチェックが有効になっており、スプリット ヘルスチェックと呼ばれます。ヘルスチェックを受信するインスタンスは、指定された時間間隔内にそのヘルスチェックに応答する必要があります。

スプリット ヘルスチェックのデフォルトの動作をアプリケーションに拡張する必要がある場合は、app.yaml ファイルをカスタマイズして次の 2 種類のヘルスチェックを構成します。

  • liveness チェックでは、VM インスタンスとそのコンテナが実行中であることを確認します。VM インスタンスが liveness チェックに失敗すると、インスタンスは自動的に再起動されます。liveness チェックは、構成されたしきい値と時間間隔、またはコンテナの障害が原因で失敗することがあります。
  • 準備チェックでは、VM インスタンスが受信リクエストを受け入れる準備ができたことを確認します。VM インスタンスが準備チェックに失敗する場合、その VM インスタンスは起動が完了していないか、リクエストを受信する準備ができていないことを意味します。VM インスタンスが準備チェックに合格して起動が完了すると、使用可能なインスタンスのプールに追加されます。

スプリット ヘルスチェックの動作の詳細については、スプリット ヘルスチェックへの移行ガイドをご覧ください。

インスタンスでこれらのヘルスチェックが処理されると、App Engine ログでは、次のいずれかのインスタンス状態が示されます。

  • 正常。インスタンスはヘルスチェック リクエストを受信し、リクエストを処理しています。正常なアプリケーションは、ヘルスチェックに 200 の HTTP ステータスコードで応答します。
  • 異常。インスタンスがヘルスチェック リクエストを拒否し、特定の回数にわたって連続してヘルスチェック リクエストへの応答に失敗しました。App Engine は、ヘルスチェック リクエストを引き続き行い、異常なインスタンスが事前定義された回数にわたってヘルスチェックへの無応答を続ける場合は、そのインスタンスを再起動します。
  • レームダック。インスタンスには、シャットダウンまたは再起動がスケジュール設定されています。シャットダウン時には、インスタンスは進行中のリクエストを終了し、新しいリクエストを拒否します。アプリからは、インスタンスでリクエストを処理できないことを示す 503 コードが返されます。インスタンスがシャットダウンまたは再起動する前にシャットダウン スクリプトの実行期間は制限されており、短くすることや、長くするように構成することはできません。
  • アプリのレームダック。インスタンスでは、トラフィックを処理するための準備が進んでいます。アプリからは、インスタンスでリクエストを処理できないことを示す 503 コードが返されます。VM インスタンスが起動を完了しトラフィックを処理する準備が整うと、インスタンスは正常になりリクエストを処理します。VM インスタンスが時間内に起動しない場合は、インスタンスが異常に変更されて削除されます。

レームダックとアプリのレームダックの動作は、VM インスタンスが行う正常な処理の一部です。

リソース使用状況のモニタリング

Google Cloud コンソールの [インスタンス] ページでは、インスタンスのパフォーマンスを確認できます。各インスタンスのメモリと CPU の使用状況、稼働時間、リクエスト数と他の統計情報を確認できます。また、任意のインスタンスのシャットダウン プロセスを手動で開始できます。

App Engine フレキシブル環境での NTP

App Engine フレキシブル環境には、Google NTP サーバーを使用するネットワーク タイム プロトコル(NTP)サービスがあります。ただし、フレキシブル環境の NTP サービスは変更できません。

インスタンスのロケーション

各インスタンスは、プロジェクトの設定に従って地理的なリージョンごとに自動的に配置されます。

インスタンスのスケーリング

アプリケーションの実行中、受信リクエストは適切なサービスやバージョンの既存または新規のインスタンスに転送されます。各アクティブ バージョンでは少なくとも 1 つのインスタンスが動作しており、サービスまたはバージョンのスケーリング タイプによって追加のインスタンスの作成方法が制御されます。スケーリング タイプは、アプリの app.yaml で指定します。デフォルトでは、アプリは自動スケーリングを使用します。つまり、App Engine はアイドル インスタンスの数を管理します。

自動スケーリング
自動スケーリングは、リクエスト率、レスポンスのレイテンシなどのアプリケーションの指標に基づいてインスタンスを作成します。automatic_scaling 要素を構成することで、それぞれの指標のしきい値と、常時稼働する最小数のインスタンスを指定できます。
手動スケーリング
手動スケーリングでは、負荷レベルに関係なく、常に実行されるインスタンスの数を指定します。これにより、複雑な初期化などのタスクや、時間の経過に伴うメモリの状態に依存するアプリケーションが実行できるようになります。