Autopilot クラスタの組み込みコンピューティングクラスについて

Autopilot

このページでは、特定のハードウェア要件を持つワークロード用に Google Kubernetes Engine（GKE）Autopilot クラスタで使用できる組み込みのコンピューティングクラスについて説明します。

Autopilot クラスタの組み込みコンピューティングクラスの概要

デフォルトでは、GKE Autopilot クラスタの Pod はコンテナ最適化コンピューティングプラットフォームで実行されます。このプラットフォームは、ウェブサーバーや中程度のバッチジョブなどの汎用ワークロードに最適です。コンテナ最適化コンピューティングプラットフォームは、信頼性が高く、スケーラブルで、コストが最適化されたハードウェア構成を備えています。これにより、ほとんどのワークロードの要件に対応できます。

独自のハードウェア要件（ML や AI タスクの実行、リアルタイムの高トラフィックデータベースの実行、特定の CPU プラットフォームとアーキテクチャの必要性）を持つワークロードがある場合、Autopilot ではコンピューティングクラスでそれに対応します。こうしたコンピューティングクラスは Compute Engine のマシンシリーズのキュレートされたサブセットであり、デフォルトの Autopilot コンピューティングプラットフォームを越えた柔軟性を備えています。たとえば、Scale-Out コンピューティングクラスは、同時マルチスレッディングをオフにし、スケールアウト用に最適化された VM を使用します。

各ワークロードの要件に基づいて、特定のコンピューティングクラスに基づくノードをリクエストできます。デフォルトの汎用コンテナ最適化コンピューティングプラットフォームと同様に、Autopilot は、実行中の Pod に基づいて、リクエストされたコンピューティングクラスのサイジングとリソース割り当てを管理します。Pod レベルでコンピューティングクラスをリクエストし、各 Pod のニーズに最適なものを選択することで、費用対効果を最適化できます。

GKE では、GKE Standard クラスタに Autopilot コンピューティングクラスをデプロイすることもできます。これらのコンピューティングクラスを使用すると、クラスタが Standard モードのクラスタであっても、Autopilot モードで特定のワークロードを実行できます。詳細については、GKE Standard の Autopilot モードのワークロードについてをご覧ください。

柔軟性を高めるカスタムコンピューティングクラス

Autopilot クラスタの組み込みコンピューティングクラスがワークロードの要件を満たしていない場合は、独自のコンピューティングクラスを構成できます。ComputeClass Kubernetes CustomResource をクラスタにデプロイできます。これには、GKE がクラスタ内の新しいノードの構成に使用するノード属性のセットが含まれています。カスタムコンピューティングクラスの詳細については、カスタムコンピューティングクラスについてをご覧ください。

特定の CPU アーキテクチャを選択する

ワークロードが特定の CPU プラットフォームやアーキテクチャ用に設計されている場合は、必要に応じて、Pod 仕様でそれらのプラットフォームやアーキテクチャを選択できます。たとえば、Arm アーキテクチャを使用するノードで Pod を実行する場合は、Scale-Out コンピューティングクラス内で arm64 を選択できます。

料金

GKE Autopilot Pod は、Pod がスケジュールされているノードに基づいて課金されます。特定のコンピューティングクラスの汎用ワークロードと Spot Pod の料金に関する情報と、確約利用割引については、Autopilot モードの料金をご覧ください。

汎用または専用のコンピューティングクラスでの Spot Pod は、確約利用割引の対象になりません。

コンピューティングクラス別の用途

次の表では、Autopilot がサポートする事前定義コンピューティングクラスの技術的な概要と、各プラットフォームで動作する Pod のユースケース例を示します。コンピューティングクラスをリクエストしない場合、Autopilot は、汎用コンピューティングプラットフォーム上に Pod を配置します。このプラットフォームは、ほとんどのワークロードを最適に実行するように設計されています。

これらのオプションが要件を満たさない場合は、GKE がクラスタのスケールアップ時に使うノードプロパティを指定する、独自のカスタムコンピューティングクラスを定義してデプロイできます。詳細については、カスタムコンピューティングクラスについてをご覧ください。

ワークロードの要件	コンピューティングクラス	説明	サンプルユースケース
特定のハードウェアを必要としないワークロード	汎用	Pod 仕様でコンピューティングプラットフォームを明示的にリクエストしない場合、Autopilot は汎用コンピューティングプラットフォームを使用します。仕様で汎用プラットフォームを明示的に選択することはできません。 E2 マシンシリーズを基盤とする。 Autopilot ノードのノードマシンシリーズとして `ek` が表示されることがあります。EK マシンは、GKE Autopilot 向けに最適化された E2 マシンタイプです。	ウェブサーバー中小規模のデータベース開発環境
GPU を必要とするワークロード	`Accelerator`	Pod はコンピューティングリソースにいつでもアクセスできる Pod のメモリや CPU の上限なし互換性のある GPU タイプは次のとおりです。 `nvidia-b200`: NVIDIA B200（180 GB） `nvidia-h200-141gb`: NVIDIA H200（141GB） `nvidia-h100-mega-80gb`: NVIDIA H100 Mega（80 GB） `nvidia-h100-80gb`: NVIDIA H100（80 GB） `nvidia-a100-80gb`: NVIDIA A100（80 GB） `nvidia-tesla-a100`: NVIDIA A100（40 GB） `nvidia-l4`: NVIDIA L4 `nvidia-tesla-t4`: NVIDIA T4	GPU 使用率の高い AI / ML のトレーニングと推論
CPU リクエストまたはメモリリクエストが汎用コンピューティングクラスの最大数または特定の CPU プラットフォームよりも大きい	`Balanced`	使用可能な CPU: AMD EPYC Rome、AMD EPYC Milan、Intel Ice Lake、Intel Cascade Lake 利用可能なアーキテクチャ: amd64 サポートされるリソースリクエストが汎用よりも大きい Pod に最小 CPU プラットフォームを設定できる（「Intel Ice Lake 以上」など）。 N2 マシンシリーズ（Intel）または N2D マシンシリーズ（AMD）を基盤とする。	ウェブサーバー中規模から大規模のデータベースキャッシュストリーミングとメディア配信 Hyperdisk Throughput と Extreme ストレージ
他のコンピューティングクラスでサポートされていない特定のマシンシリーズの要件があるワークロード	特定のマシンシリーズ	利用可能なアーキテクチャ: amd64、arm64 Pod はノード用に特定のマシンシリーズをリクエストできる Pod のメモリや CPU の上限なし詳細については、マシンシリーズを選択して Autopilot Pod のパフォーマンスを最適化するをご覧ください。	CPU 使用率の高い AI / ML のトレーニングと推論 HPC バッチワークロード Hyperdisk Balanced、Throughput、Extreme ストレージ
AI / ML トレーニングやハイパフォーマンスコンピューティング（HPC）など、CPU 使用率の高いワークロード	`Performance`	利用可能なアーキテクチャ: amd64、arm64 Pod はコンピューティングリソースにいつでもアクセスできる Pod のメモリや CPU の上限なしノードあたり 1 つの Pod Performance コンピューティングクラスで使用可能な Compute Engine マシンシリーズのリストについては、サポートされているマシンシリーズをご覧ください。	CPU 使用率の高い AI / ML のトレーニングと推論 HPC バッチワークロード Hyperdisk Balanced、Throughput、Extreme ストレージ
コアあたりのシングルスレッドコンピューティングと水平スケーリング	`Scale-Out`	利用可能な CPU: Ampere Altra Arm または AMD EPYC Milan Compute Engine のマシンファミリー: T2A（Arm）、T2D（x86）利用可能なアーキテクチャ: arm64 または amd64 SMT オフ。1 つの vCPU は 1 つの物理コアに相当。最大 3.5 GHz のクロック周波数 Tau T2A マシンシリーズ（Arm）または Tau T2D マシンシリーズ（x86）を基盤とする。	ウェブサーバーコンテナ化されたマイクロサービスデータログの処理大規模な Java アプリ Hyperdisk Throughput ストレージ

Autopilot でコンピューティングクラスを選択する方法

詳細な手順については、Autopilot Pod のコンピューティングクラスを選択するをご覧ください。

Pod を特定のコンピューティングクラスに配置するように Autopilot に指示するには、nodeSelector またはノードアフィニティルールで cloud.google.com/compute-class ラベルを使用します。次に例を示します。

nodeSelector

    apiVersion: apps/v1
    kind: Deployment
    metadata:
      name: hello-app
    spec:
      replicas: 3
      selector:
        matchLabels:
          app: hello-app
      template:
        metadata:
          labels:
            app: hello-app
        spec:
          nodeSelector:
            cloud.google.com/compute-class: "COMPUTE_CLASS"
          containers:
          - name: hello-app
            image: us-docker.pkg.dev/google-samples/containers/gke/hello-app:1.0
            resources:
              requests:
                cpu: "2000m"
                memory: "2Gi"

COMPUTE_CLASS は、ユースケースに基づいてコンピューティングクラスの名前に置き換えます（Scale-Out など）。Accelerator を選択した場合は、互換性のある GPU も指定する必要があります。手順については、Autopilot で GPU ワークロードをデプロイするをご覧ください。Performance を選択した場合は、必要に応じてノードセレクタで Compute Engine マシンシリーズを選択できます。マシンシリーズを指定しない場合、GKE はリージョンの可用性に応じて C4 マシンシリーズを使用します。手順については、CPU 使用率の高いワークロードを最適なパフォーマンスで実行するをご覧ください。

nodeAffinity

    apiVersion: apps/v1
    kind: Deployment
    metadata:
      name: hello-app
    spec:
      replicas: 3
      selector:
        matchLabels:
          app: hello-app
      template:
        metadata:
          labels:
            app: hello-app
        spec:
          terminationGracePeriodSeconds: 25
          containers:
          - name: hello-app
            image: us-docker.pkg.dev/google-samples/containers/gke/hello-app:1.0
            resources:
              requests:
                cpu: "2000m"
                memory: "2Gi"
                ephemeral-storage: "1Gi"
          affinity:
            nodeAffinity:
              requiredDuringSchedulingIgnoredDuringExecution:
                nodeSelectorTerms:
                - matchExpressions:
                  - key: cloud.google.com/compute-class
                    operator: In
                    values:
                    - "COMPUTE_CLASS"

ワークロードをデプロイすると、Autopilot は次の処理を行います。

指定された構成を基盤とするノードを自動的にプロビジョニングして Pod を実行します。
新しいノードに自動的に taint を追加して、他の Pod がそうしたノードでスケジュールされないようにします。taint はコンピューティングクラスごとに一意です。CPU アーキテクチャも選択している場合、GKE はそのアーキテクチャに固有の別の taint を追加します。
デプロイされた Pod に、適用された taint に対応する toleration を自動的に追加します。これにより、GKE はこれらの Pod を新しいノードに配置できます。

たとえば、Pod の Scale-Out コンピューティングクラスをリクエストした場合は、次のようになります。

Autopilot は、これらのノードに対して Scale-Out に固有の taint を追加します。
Autopilot は、その taint の toleration を Scale-Out Pod に追加します。

Scale-Out をリクエストしていない Pod は認められません。その結果、GKE はこれらの Pod を Scale-Out ノードにスケジュールしません。

ワークロードの仕様でコンピューティングクラスを明示的にリクエストしない場合、Autopilot はデフォルトの汎用コンピューティングクラスを使用するノードで Pod をスケジューリングします。ほとんどのワークロードは、汎用コンピューティングクラスで問題なく実行できます。

CPU アーキテクチャをリクエストする方法

場合によっては、ワークロードが Arm などの特定のアーキテクチャ用に構築されていることがあります。バランスやスケールアウトなど、一部のコンピューティングクラスは複数の CPU アーキテクチャをサポートしています。次の例に示すように、ノードセレクタやノードアフィニティルールでラベルを指定することで、コンピューティングクラスのリクエストと同時に特定のアーキテクチャをリクエストできます。

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-arm
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx-arm
  template:
    metadata:
      labels:
        app: nginx-arm
    spec:
      nodeSelector:
        cloud.google.com/compute-class: COMPUTE_CLASS
        kubernetes.io/arch: ARCHITECTURE
      containers:
      - name: nginx-arm
        image: nginx
        resources:
          requests:
            cpu: 2000m
            memory: 2Gi

ARCHITECTURE は、必要な CPU アーキテクチャ（arm64 や amd64 など）に置き換えます。

アーキテクチャを明示的にリクエストしない場合、Autopilot は指定されたコンピューティングクラスのデフォルトのアーキテクチャを使用します。

Autopilot の Arm アーキテクチャ

Autopilot は、Arm CPU アーキテクチャを使用するノードのリクエストをサポートしています。Arm ノードは、同様の x86 ノードよりも費用効率に優れ、パフォーマンスも向上します。Arm ノードをリクエストする手順については、Arm アーキテクチャに Autopilot ワークロードをデプロイするをご覧ください。

デプロイメントで正しいイメージを使用していることを確認してください。Pod が Arm イメージを使用していて、Arm ノードをリクエストしない場合、Autopilot は x86 ノードで Pod をスケジューリングし、Pod がクラッシュします。同様に、x86 イメージが誤って使用されて Pod の Arm ノードがリクエストされた場合、Pod はクラッシュします。

コンピューティングクラスのワークロードに対する Autopilot の検証

Autopilot は、ワークロードのマニフェストを検証し、ノードセレクタやノードアフィニティルールのコンピューティングクラスとアーキテクチャリクエストが正しくフォーマットされていることを確認します。次のルールが適用されます。

コンピューティングクラスは 1 つだけです。
サポートされていないコンピューティングクラスは使用できません。
GKE のバージョンは、コンピューティングクラスをサポートしている必要があります。
選択したアーキテクチャは 1 つだけです。
コンピューティングクラスは、選択したアーキテクチャをサポートしている必要があります。

ワークロードマニフェストがこれらの検証のいずれかに失敗すると、Autopilot はワークロードを拒否します。

コンピューティングクラスを利用できるリージョン

次の表は、特定のコンピューティングクラスと CPU アーキテクチャが利用可能なリージョンを示しています。

コンピューティングクラスの利用可否
汎用	すべての地域
`Balanced`	すべてのリージョン
`Performance`	サポートされているマシンシリーズを含むすべてのリージョン。
`Scale-Out`	対応する Compute Engine マシンシリーズを含むすべてのリージョン。特定のマシンシリーズの可用性を確認するには、利用可能なリージョンとゾーンのフィルタを使用します。

特定のリージョンでコンピューティングクラスが使用可能な場合、そのリージョンでは少なくとも 2 つのゾーンでハードウェアを使用できます。

デフォルト、最小、最大のリソースリクエスト

Autopilot ワークロードのコンピューティングクラスを選択する場合は、そのコンピューティングクラスの最小と最大を満たす数のリソースリクエストを指定してください。デフォルトのリクエスト数と、各コンピューティングクラスの最小リクエスト数と最大リクエスト数については、GKE Autopilot のリソースリクエストと上限をご覧ください。

Autopilot クラスタの組み込みコンピューティング クラスについて コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

Autopilot クラスタの組み込みコンピューティング クラスの概要

柔軟性を高めるカスタム コンピューティング クラス

特定の CPU アーキテクチャを選択する

料金

コンピューティング クラス別の用途

Autopilot でコンピューティング クラスを選択する方法