GKE Autopilot の概要

Autopilot

このページでは、GKE クラスタのマネージドモードである Google Kubernetes Engine（GKE）Autopilot モードについて説明します。Autopilot モードのメリットと考慮事項を理解するために必要な情報を提供します。このコースでは、Autopilot クラスタの計画と作成、アプリケーションのデプロイと管理、ネットワーキングの構成、セキュリティの確保、ワークロードのスケーリングなど、さまざまなトピックを取り上げます。

このページは、GKE Autopilot モードがコンテナ化されたワークロードの運用要件にどの程度適合するかを評価する際に、十分な情報に基づいて意思決定を行う管理者、アーキテクト、オペレーターを対象としています。 Google Cloud のコンテンツで使用されている一般的なロールとタスクの例の詳細については、一般的な GKE Enterprise ユーザーのロールとタスクをご覧ください。

このページを読む前に、GKE Autopilot と GKE Standard の比較をご覧ください。

Autopilot とは

GKE Autopilot は GKE で運用されるモードの一つで、ノード、スケーリング、セキュリティ、その他の事前構成された設定など、クラスタ構成を Google が管理します。Autopilot クラスタは、ほとんどの本番環境ワークロードを実行するように最適化されており、Kubernetes マニフェストに基づいてコンピューティングリソースをプロビジョニングします。この合理化された構成は、クラスタとワークロードの設定、スケーラビリティ、セキュリティに関する GKE のベストプラクティスと推奨事項を遵守しています。組み込まれている設定のリストについては、Autopilot と Standard の比較表をご覧ください。

ベストプラクティス:

フルマネージドの Kubernetes エクスペリエンスを実現するには、Autopilot を使用します。

料金

ほとんどの場合、GKE Autopilot での実行中にワークロードがリクエストした CPU、メモリ、ストレージに対してのみ料金が発生します。ノードは GKE によって管理されるため、ノードの未使用の容量に対しては課金されません。Pod がノード仮想マシン（VM）のすべてのリソース容量を使用できる特定のコンピューティングクラスで Pod を実行する場合は、この料金モデルに例外があります。

システム Pod、オペレーティングシステムの費用、スケジュールされていないワークロードについては、料金は発生しません。料金の詳細については、Autopilot の料金をご覧ください。

利点

アプリケーションに専念する: Google がインフラストラクチャを管理するため、アプリケーションの構築とデプロイに専念できます。
セキュリティ: クラスタにはデフォルトのセキュリティ強化構成があり、多くのセキュリティ設定がデフォルトで有効になっています。GKE は、構成されたメンテナンススケジュールに従って、取得可能になった時点でノードにセキュリティパッチを自動的に適用します。
料金: Autopilot の料金モデルは、請求の予測とアトリビューションを簡素化します。
ノード管理: Google がワーカーノードを管理するため、ワークロードに対応する新しいノードを作成していただく必要はありません。また、自動アップグレードと修復を構成していただく必要もありません。
スケーリング: ワークロードに高い負荷がかかり、トラフィックに対応するために Pod を追加する（Kubernetes の水平 Pod 自動スケーリングなどにより）と、GKE はそれらの Pod に新しいノードを自動的にプロビジョニングし、必要に応じて既存のノードのリソースを自動的に拡張します。
スケジューリング: Autopilot は Pod のビンパッキングを管理します。したがって、各ノードで実行されている Pod の数を考慮する必要はありません。アフィニティや Pod スプレッドトポロジなどの Kubernetes メカニズムを使用して、Pod の配置を詳細に制御できます。
リソース管理: CPU やメモリなどのリソース値を設定せずにワークロードをデプロイする場合、Autopilot は事前構成済みのデフォルト値を自動的に設定し、ワークロードレベルでリソースリクエストを変更します。
ネットワーキング: Autopilot は、デフォルトでネットワーキングセキュリティ機能を有効にします。たとえば、すべての Pod ネットワークトラフィックが Virtual Private Cloud ファイアウォールルールを通過するようにします（トラフィックが他の Pod に送信される場合も同様です）。
リリース管理: すべての Autopilot クラスタは GKE リリースチャンネルに登録されます。これにより、コントロールプレーンとノードがそのチャンネル内の最新の認定バージョンで実行されます。
柔軟な管理: ワークロードに特定のハードウェアまたはリソース（高使用率の CPU やメモリなど）の要件が存在する場合、Autopilot にはそのようなワークロードに合わせて構築され事前構成されたコンピューティングクラスが用意されています。カスタマイズされたマシンタイプとハードウェアに基づく新しいノードを手動で作成する必要はなく、その代わりにデプロイメントでコンピューティングクラスをリクエストします。GPU を選択して、バッチアプリケーションや AI / ML アプリケーションなどのワークロードを高速化することもできます。
運用の複雑さの軽減: Autopilot では、ノードの継続的なモニタリングや、スケーリング、オペレーションのスケジュール設定を行う必要がなくなるため、プラットフォーム管理のオーバーヘッドが削減されます。

Autopilot には、コントロールプレーンと、Pod で使用されるコンピューティング容量の両方をカバーする SLA が用意されています。

Autopilot クラスタを計画する

クラスタを作成する前に、 Google Cloud アーキテクチャを計画して設計します。Autopilot では、ワークロードの仕様でハードウェアをリクエストします。GKE は、これらのワークロードを実行するために、対応するインフラストラクチャをプロビジョニングして管理します。たとえば、ML ワークロードを実行する場合は、ハードウェアアクセラレータをリクエストします。Android アプリを開発する場合は、Arm CPU をリクエストします。

ワークロードのスケールに基づいて、 Google Cloud プロジェクトまたは組織の割り当てを計画し、リクエストします。GKE がワークロードのインフラストラクチャをプロビジョニングできるのは、プロジェクトにそのハードウェアに対する十分な割り当てがある場合のみです。

計画するときは、次の要素を考慮してください。

クラスタのサイズとスケールの見積もり
ワークロードタイプ
クラスタのレイアウトと使用状況
ネットワークのレイアウトと構成
セキュリティの構成
クラスタの管理とメンテナンス
ワークロードのデプロイと管理
ロギングとモニタリング

以降のセクションでは、これらの考慮事項に関する情報と有用なリソースについて説明します。

ネットワーキング

パブリックネットワーキングを使用して Autopilot クラスタを作成すると、クラスタ内のワークロードは相互に通信でき、インターネットとも通信できます。これは、デフォルトのネットワークモードです。 Google Cloud と Kubernetes には、プライベートネットワークを使用するクラスタなど、ユースケースに基づいて利用できるさまざまな追加のネットワーキング機能が用意されています。

Kubernetes とクラウドのネットワーキングは複雑です。Google Cloud に設定されたデフォルトの変更を開始する前に、ネットワーキングの基本コンセプトを理解しておいてください。次の表では、ユースケースに基づいて GKE でのネットワーキングの詳細を確認するためのリソースを示します。

ユースケース	リソース
Kubernetes と GKE におけるネットワーキングの仕組みを理解する	Kubernetes ネットワークモデルについて学習します。 GKE ネットワーキングモデルについて学習します。ネットワーキングモデルについて学習したら、組織のネットワークとネットワークセキュリティの要件を検討します。これらの条件を満たす GKE と Google Cloud ネットワーキング機能を選択します。
GKE ネットワーク構成を計画する	Service あたりのエンドポイントや API リクエストの上限など、GKE のネットワーク割り当てを把握しておくことをおすすめします。以下のリソースは、ネットワーキング設定の特定の側面を計画するのに役立ちます。クラスタの内部と外部のネットワーキングオプションについては、GKE ネットワーキングの概要をご覧ください。ネットワーク設計に関する推奨事項については、GKE ネットワーキングのベストプラクティスをご覧ください。 IP アドレス管理を最適化する方法については、GKE アドレス管理のシリーズをご覧ください。作成した Kubernetes リソースに基づいて GKE によって作成されるファイアウォールルールについては、自動作成されるファイアウォールルールをご覧ください。
ワークロードを公開する	アプリをインターネットに公開するには、Service を使用します。これにより、Pod のグループで実行されているアプリを単一のネットワークサービスとして公開できます。 Google Cloud API と安全に通信するようにワークロードを構成するには、Workload Identity Federation for GKE を使用します。
複数のクラスタで高可用性の連携サービスを実行する	マルチクラスタサービス（MCS）を使用します。
受信トラフィックをロードバランシングする	複雑なウェブアプリケーションなど、URI とパスに基づいて外部 HTTP(S) トラフィックを複数の Service にロードバランシングするには、外部アプリケーションロードバランサ用 Ingress を使用します。一般公開メールサーバーを実行している Deployment など、単一の Service に外部トラフィックをロードバランシングするには、LoadBalancer Service を使用して外部パススルーネットワークロードバランサを作成します。企業のイントラネットのウェブアプリケーションなど、URI とパスに基づいて内部 HTTP(S) トラフィックを複数の Service にロードバランシングするには、内部アプリケーションロードバランサ用の Ingress を使用します。企業のメールサーバーなど、単一のサービスに内部トラフィックをロードバランシングするには、内部パススルーネットワークロードバランサを使用します。
クラスタネットワークセキュリティを構成する	公共のインターネットからクラスタへのアクセスを制御または防止するには、ネットワーク分離をカスタマイズします。コントロールプレーンへのアクセスを特定の IP アドレス範囲に制限するには、コントロールプレーン承認済みネットワークを使用します。 Pod トラフィックを制御するには、ネットワークポリシーを使用します。ネットワークポリシーの適用は GKE Dataplane V2 で使用できます。これは Autopilot クラスタでデフォルトで有効になっています。手順については、ネットワークポリシーをご覧ください。
Kubernetes ネットワークトラフィックを監視する	デフォルトでは、Autopilot は指標とオブザーバビリティに GKE Dataplane V2 を使用します。 GKE Dataplane V2 指標を取り込むには、Google Managed Service for Prometheus を構成します。デフォルトでは、GKE Dataplane V2 の指標は GKE Autopilot で公開されます。可視化、ネットワークポリシー判定結果、フローダンプにアクセスするには、GKE Dataplane V2 のオブザーバビリティを使用して追加のトラブルシューティングツールを構成します。

スケーリング

大規模なプラットフォームを効果的に運用するには、計画と慎重な検討が必要です。設計のスケーラビリティを考慮する必要があります。スケーラビリティとは、サービスレベル目標（SLO）内に収めつつ、クラスタを拡張できる能力のことです。プラットフォーム管理者とデベロッパー向けの詳細なガイダンスについては、スケーラブルなクラスタを作成するためのガイドラインをご覧ください。

また、GKE の割り当てと上限も考慮する必要があります。特に、数千もの Pod を含む可能性のある大規模なクラスタを実行する予定の場合は、注意が必要です。

Autopilot ワークロードをスケーリングする

Autopilot では、GKE はクラスタ内の Pod 数に基づいてノードを自動的にスケーリングします。クラスタに実行中のワークロードがない場合、Autopilot はクラスタをゼロノードまで自動的にスケールダウンします。クラスタのスケールダウン後、クラスタ内にノードが残らず、システム Pod はスケジュール不可の状態になります。これは想定された挙動です。新しく作成されるほとんどの Autopilot クラスタでは、最初にデプロイするワークロードのスケジュールに時間がかかることがあります。この理由は、新しい Autopilot クラスタでは作成時に使用可能なノード数がゼロであり、ワークロードをデプロイして追加ノードをプロビジョニングするまで待つためです。

ベストプラクティス:

クラスタ内の Pod の数を自動的にスケーリングするには、Kubernetes の水平 Pod 自動スケーリングなどのメカニズムを使用します。このメカニズムでは、組み込みの CPU とメモリの指標、または Cloud Monitoring のカスタム指標に基づいて Pod をスケーリングできます。さまざまな指標に基づいてスケーリングを構成する方法については、指標に基づいて Pod の自動スケーリングを最適化するをご覧ください。

セキュリティ

Autopilot クラスタは、デフォルトでセキュリティのベストプラクティスと設定を有効化して適用します。このベストプラクティスには、クラスタのセキュリティの強化および GKE セキュリティの概要の推奨事項の多くが含まれます。

Autopilot の強化策と特定のセキュリティ要件の実装方法については、Autopilot のセキュリティ対策をご覧ください。

クラスタの作成

環境を計画して要件を理解したら、Autopilot クラスタを作成します。新しい Autopilot クラスタは、一般公開されている IP アドレスを持つリージョンクラスタです。各クラスタには、ベースライン強化対策や自動スケーリングなどの機能があります。事前構成済みの機能の一覧については、GKE Autopilot と GKE Standard の比較をご覧ください。

外部 IP アドレスにアクセスできないクラスタを作成する場合は、ネットワーク分離を構成します。

Autopilot にワークロードをデプロイする

実行中の Autopilot クラスタにワークロードをデプロイするには、Kubernetes マニフェストを作成してクラスタに適用します。デフォルトでは、Autopilot クラスタはほとんどの本番環境ワークロードを実行するように最適化されています。

アプリのデプロイと公開に関する Google Cloud コンソールのインタラクティブなガイドについては、[ガイド] をクリックしてください。

ガイドを表示

一部のワークロードには、ハードウェアアクセラレータを必要とする ML ワークロードや、Arm アーキテクチャを必要とするモバイルアプリのテストなど、特殊なハードウェア要件がある場合があります。Autopilot には、特別なコンピューティング要件のあるワークロードを実行するようにGoogle Cloud が構成した事前定義のコンピューティングクラスがあります。より具体的なハードウェア要件がある場合は、独自のカスタムコンピューティングクラスを定義できます。これらの特別なワークロードをデプロイするときに、マニフェストでコンピューティングクラスをリクエストします。Autopilot は、専用マシンを基盤とするノードのプロビジョニング、スケジュール管理、ハードウェアの割り当てを自動的に行います。

次の表に、一般的な要件と推奨する対処方法を示します。

ユースケース	リソース
クラスタをスケーリングするときに個々のノードプロパティを制御する	カスタムコンピューティングクラスをデプロイし、ワークロードマニフェストでリクエストします。詳細については、カスタムコンピューティングクラスについてをご覧ください。
Arm ワークロードを実行する	マニフェストで `Scale-Out` コンピューティングクラスと `arm64` アーキテクチャをリクエストします。手順については、Arm アーキテクチャに Autopilot ワークロードをデプロイするをご覧ください。
高速化された AI / ML ワークロードを実行する	マニフェストで GPU をリクエストします。手順については、Autopilot に GPU ワークロードをデプロイするをご覧ください。
高いコンピューティングまたは高メモリ容量を必要とするワークロードを実行する	`Balanced` コンピューティングクラスをリクエストします。手順については、Autopilot Pod のコンピューティングクラスを選択するをご覧ください。
CPU 容量の効率的な水平方向のスケーリングとコアごとのシングルスレッドを必要とするワークロードを実行する	`Scale-Out` コンピューティングクラスをリクエストします。手順については、Autopilot Pod のコンピューティングクラスを選択するをご覧ください。
バッチジョブなどのフォールトトレラントなワークロードを低コストで実行する	マニフェストで Spot Pod を指定します。手順については、Spot Pod でフォールトトレラントワークロードを低コストで実行するをご覧ください。 Spot Pod では、任意のコンピューティングクラスまたはハードウェア構成を使用できます。
ゲームサーバーや作業キューなど、中断を最小限にする必要があるワークロードを実行する	Pod 仕様で `cluster-autoscaler.kubernetes.io/safe-to-evict=false` アノテーションを指定します。Pod は、最大 7 日間、ノードの自動アップグレードやスケールダウンイベントによって生じるエビクションから保護されます。詳細については、Autopilot Pod の実行時間を延長するをご覧ください。
ノード上の Pod リソースリクエストの合計で使用可能な未使用のリソースがある場合、ワークロードがリクエストを超えてバーストできるようにします。	リソース `limits` を `requests` よりも高く設定するか、リソース上限を設定しないでください。手順については、GKE で Pod バースト機能を構成するをご覧ください。

Autopilot を使用すると、ワークロード用の CPU、メモリ、エフェメラルストレージリソースをリクエストできます。許可される範囲は、Pod をデフォルトの汎用コンピューティングプラットフォームで実行するか、コンピューティングクラスで実行するかによって異なります。

デフォルトのコンテナリソースリクエストと許容リソース範囲については、Autopilot のリソースリクエストをご覧ください。

ワークロードの分離

Autopilot クラスタは、ノードセレクタとノードアフィニティを使用してワークロードの分離を構成します。ワークロードの分離は、カスタムノードラベルなどの特定の基準を満たすノードにワークロードを配置するように GKE に指示する必要がある場合に役立ちます。たとえば、GKE に game-server ラベルが付いているノードでゲームサーバー Pod をスケジュールするように指示して、それらのノード上の他の Pod がスケジュールされないようにします。

詳細については、GKE でワークロードの分離を構成するをご覧ください。

ゾーントポロジを使用して特定のゾーンで Pod をスケジューリングする

ゾーンの Compute Engine 永続ディスクの情報にアクセスするなど、特定の Google Cloud ゾーンに Pod を配置する必要がある場合は、GKE Pod を特定のゾーンに配置するをご覧ください。

Pod のアフィニティとアンチアフィニティ

Pod のアフィニティと反アフィニティを使用して、Pod を単一ノード上にともに配置するか、一部の Pod で他の Pod を避けるようにします。Pod のアフィニティと反アフィニティは、特定のリージョンやゾーンなど、特定のトポロジドメイン内のノードで実行されている Pod のラベルに基づいてスケジュールの決定を行うように Kubernetes に指示します。たとえば、同じノード上の他のフロントエンド Pod とともにフロントエンド Pod をスケジュールしないように GKE に指示することで、停止時の可用性を向上できます。

手順と詳細については、Pod のアフィニティとアンチアフィニティをご覧ください。

GKE では、topologyKey で次のラベルを持つ Pod のアフィニティと反アフィニティを使用できます。

topology.kubernetes.io/zone
kubernetes.io/hostname

Pod トポロジの分散の制約

Kubernetes が Pod の数をスケールアップまたはスケールダウンしたときにワークロードの可用性を向上させるには、Pod トポロジの分散の制約を設定します。これにより、Kubernetes がリージョンなどのトポロジドメイン内のノードにわたって Pod を分散する方法を制御します。たとえば、us-central1 リージョンの 3 つの Google Cloud ゾーンのそれぞれに特定の数のゲームサーバーセッション Pod を配置するように Kubernetes に指示できます。

例、詳細、手順については、Pod トポロジの分散の制約をご覧ください。

Autopilot クラスタの管理とモニタリング

Autopilot では、GKE がコントロールプレーンとワーカーノードの両方のクラスタのアップグレードとメンテナンスを自動的に管理します。Autopilot クラスタには、クラスタとワークロードをモニタリングするための機能も組み込まれています。

GKE バージョンのアップグレード

すべての Autopilot クラスタが GKE リリースチャンネルに登録されます。リリースチャンネルでは、GKE がクラスタの Kubernetes バージョンを管理し、チャンネルに応じて機能の可用性とバージョンの安定性のバランスをとります。デフォルトでは、Autopilot クラスタは Regular リリースチャンネルに登録されますが、安定性と機能のニーズを満たす別のチャンネルを選択することもできます。リリースチャンネルの詳細については、リリースチャンネルについてをご覧ください。

GKE は、アップグレードを自動的に開始し、進行状況をモニタリングして、問題が発生した場合はオペレーションを一時停止します。アップグレードプロセスは、次の方法で手動で制御できます。

GKE が自動アップグレードを実行できるタイミングを制御するには、メンテナンスの時間枠を作成します。たとえば、マルチプレーヤーゲームの毎週のリセットの前夜にメンテナンスの時間枠を設定すると、プレイヤーがリセット時に混乱なくログインできます。
特定の期間内で GKE が自動アップグレードを開始できないタイミングを制御するには、メンテナンスの除外を使用します。たとえば、ブラックフライデーとサイバーマンデーのセール期間中にメンテナンスの除外を設定すると、問題なくショッピングすることができます。
自動アップグレードを開始する前に新しいバージョンを取得するには、コントロールプレーンを手動でアップグレードします。GKE は、時間の経過とともにノードのバージョンとコントロールプレーンのバージョンを調整します。
新しいリリースチャンネルでのみ利用可能なパッチバージョンを取得するには、新しいチャンネルからパッチバージョンを実行するをご覧ください。たとえば、最近の脆弱性開示の影響を軽減するために、特定のパッチバージョンが必要になることがあります。

Autopilot クラスタをモニタリングする

Autopilot クラスタでは、Cloud Logging、Cloud Monitoring、Google Cloud Managed Service for Prometheus がすでに有効になっています。

Autopilot クラスタは、Google のテレメトリー収集のベストプラクティスに沿って、次のタイプのログと指標を自動的に収集します。

Cloud Logging のログ

システムログ
ワークロードログ
管理アクティビティ監査ログ
データアクセス監査ログ

Cloud Monitoring の指標

システム指標
ワークロード指標（Managed Service for Prometheus から）

ロギングとモニタリングを有効にするために、追加の構成は必要ありません。次の表は、要件に基づいて収集されたテレメトリーを操作する方法を示しています。

ユースケース	リソース
GKE ログを理解してアクセスする	自動的に収集されるログの種類については、収集されるログをご覧ください。ログにアクセスし、 Google Cloud コンソールで Cloud Logging ユーザーインターフェースを使用するには、GKE ログの表示をご覧ください。 Kubernetes のシステムログとワークロードのログをフィルタするために使用できるサンプルクエリについては、Kubernetes 関連のクエリをご覧ください。管理アクティビティ監査ログとデータアクセス監査ログをフィルタするために使用できるサンプルクエリについては、GKE 監査ロギングの情報をご覧ください。マルチテナント環境のログを構成するには、たとえば、1 つの GKE クラスタに特定の Namespace があり、各チームに独自の Google Cloud プロジェクトがある場合は、GKE でのマルチテナントロギングをご覧ください。
GKE クラスタのパフォーマンスを観察する	クラスタのパフォーマンスを効果的にモニタリングすることで、クラスタとワークロードの運用費用を最適化できます。 Monitoring の GKE ダッシュボードを使用して、クラスタのステータスを可視化します。詳細については、GKE クラスタの観察をご覧ください。 GKE では、 Google Cloud コンソールに [オブザーバビリティ] ダッシュボードも表示されます。詳細については、オブザーバビリティ指標を表示するをご覧ください。
クラスタのセキュリティポスチャーをモニタリングする	セキュリティポスチャーダッシュボードを使用して、実行中のワークロードを GKE のベストプラクティスに対して監査し、コンテナのオペレーティングシステムと言語パッケージの脆弱性をスキャンして、実行可能な緩和策を取得します。詳細は、セキュリティポスチャーダッシュボードについてをご覧ください。

ユースケース

リソース

GKE ログを理解してアクセスする

自動的に収集されるログの種類については、収集されるログをご覧ください。
ログにアクセスし、 Google Cloud コンソールで Cloud Logging ユーザーインターフェースを使用するには、GKE ログの表示をご覧ください。
Kubernetes のシステムログとワークロードのログをフィルタするために使用できるサンプルクエリについては、Kubernetes 関連のクエリをご覧ください。
管理アクティビティ監査ログとデータアクセス監査ログをフィルタするために使用できるサンプルクエリについては、GKE 監査ロギングの情報をご覧ください。
マルチテナント環境のログを構成するには、たとえば、1 つの GKE クラスタに特定の Namespace があり、各チームに独自の Google Cloud プロジェクトがある場合は、GKE でのマルチテナントロギングをご覧ください。

GKE クラスタのパフォーマンスを観察する

クラスタのパフォーマンスを効果的にモニタリングすることで、クラスタとワークロードの運用費用を最適化できます。

Monitoring の GKE ダッシュボードを使用して、クラスタのステータスを可視化します。詳細については、GKE クラスタの観察をご覧ください。
GKE では、 Google Cloud コンソールに [オブザーバビリティ] ダッシュボードも表示されます。詳細については、オブザーバビリティ指標を表示するをご覧ください。

クラスタのセキュリティポスチャーをモニタリングする

セキュリティポスチャーダッシュボードを使用して、実行中のワークロードを GKE のベストプラクティスに対して監査し、コンテナのオペレーティングシステムと言語パッケージの脆弱性をスキャンして、実行可能な緩和策を取得します。詳細は、セキュリティポスチャーダッシュボードについてをご覧ください。

トラブルシューティング

トラブルシューティングの手順については、Autopilot クラスタのトラブルシューティングをご覧ください。

GKE Autopilot の概要 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。