Autopilot Pod のコンピューティングクラスを選択する

Autopilot

このドキュメントでは、Google Kubernetes Engine（GKE）Autopilot クラスタで固有のハードウェア要件を持つワークロードを実行するために、特定のコンピューティングクラスを選択する方法について説明します。このドキュメントをお読みになる前に、GKE Autopilot のコンピューティングクラスのコンセプトを理解している必要があります。

Autopilot のコンピューティングクラスの概要

Autopilot は、特定のハードウェア要件を持つワークロードを実行するように設計されたコンピューティングクラスを提供します。これらのコンピューティングクラスは、機械学習や AI タスクなどのワークロードや、高トラフィックのリアルタイムデータベースの実行に適しています。

コンピューティングクラスは Compute Engine マシンシリーズのサブセットであり、デフォルトの Autopilot 汎用コンピューティングクラスよりも柔軟性があります。たとえば、Scale-Out クラスでは同時マルチスレッドがオフになるため、各 vCPU が 1 つの物理コアになります。

個々の Pod のニーズに基づいて、通常の Autopilot Pod または Spot Pod を構成して、これらのコンピューティングクラスに基づくノードをリクエストできます。また、特定の CPU アーキテクチャ（Arm など）を、そのアーキテクチャをサポートするコンピューティングクラスでリクエストすることもできます。

始める前に

始める前に、次の作業が完了していることを確認してください。

Google Kubernetes Engine API を有効にする。

Google Kubernetes Engine API の有効化

このタスクに Google Cloud CLI を使用する場合は、gcloud CLI をインストールして初期化する。すでに gcloud CLI をインストールしている場合は、gcloud components update を実行して最新のバージョンを取得する。
注: gcloud CLI がすでにインストールされている場合には、必ず compute/region と compute/zone のプロパティを設定してください。デフォルトのロケーションを設定することで、gcloud CLI のエラー（One of [--zone, --region] must be supplied: Please specify location など）を防止できます。

GKE バージョン 1.24.1-gke.1400 以降を実行している GKE Autopilot クラスタがあることを確認します。

Autopilot Pod でコンピューティングクラスをリクエストする

Pod を特定のコンピューティングクラスに配置するように Autopilot に指示するには、nodeSelector またはノードアフィニティルールで cloud.google.com/compute-class ラベルを使用します。次に例を示します。

nodeSelector

    apiVersion: apps/v1
    kind: Deployment
    metadata:
      name: hello-app
    spec:
      replicas: 3
      selector:
        matchLabels:
          app: hello-app
      template:
        metadata:
          labels:
            app: hello-app
        spec:
          nodeSelector:
            cloud.google.com/compute-class: "COMPUTE_CLASS"
          containers:
          - name: hello-app
            image: us-docker.pkg.dev/google-samples/containers/gke/hello-app:1.0
            resources:
              requests:
                cpu: "2000m"
                memory: "2Gi"

COMPUTE_CLASS は、ユースケースに基づいてコンピューティングクラスの名前に置き換えます（Scale-Out など）。Accelerator を選択した場合は、互換性のある GPU も指定する必要があります。手順については、Autopilot で GPU ワークロードをデプロイするをご覧ください。Performance を選択した場合は、必要に応じてノードセレクタで Compute Engine マシンシリーズを選択できます。マシンシリーズを指定しない場合、GKE はリージョンの可用性に応じて C4 マシンシリーズを使用します。手順については、CPU 使用率の高いワークロードを最適なパフォーマンスで実行するをご覧ください。

nodeAffinity

    apiVersion: apps/v1
    kind: Deployment
    metadata:
      name: hello-app
    spec:
      replicas: 3
      selector:
        matchLabels:
          app: hello-app
      template:
        metadata:
          labels:
            app: hello-app
        spec:
          terminationGracePeriodSeconds: 25
          containers:
          - name: hello-app
            image: us-docker.pkg.dev/google-samples/containers/gke/hello-app:1.0
            resources:
              requests:
                cpu: "2000m"
                memory: "2Gi"
                ephemeral-storage: "1Gi"
          affinity:
            nodeAffinity:
              requiredDuringSchedulingIgnoredDuringExecution:
                nodeSelectorTerms:
                - matchExpressions:
                  - key: cloud.google.com/compute-class
                    operator: In
                    values:
                    - "COMPUTE_CLASS"

Spot Pod に対して特定のコンピューティングクラスをリクエストすることもできます。

リソースリクエストを指定する

コンピューティングクラスを選択する場合は、選択したクラスの最小のリソースリクエストと最大のリソースリクエストに基づいて、Pod のリソースリクエストを指定してください。実際のリクエストが最小値未満の場合、Autopilot によりリクエストが自動的にスケールアップされます。ただし、リクエストが最大値を超えると、Autopilot による Pod のデプロイは行われず、エラーメッセージが表示されます。

CPU アーキテクチャを選択する

一部のコンピューティングクラスは複数の CPU アーキテクチャをサポートしています。たとえば、Scale-Out クラスは Arm と x86 の両方のアーキテクチャをサポートしています。特定のアーキテクチャをリクエストしない場合、Autopilot では、指定したコンピューティングクラスのデフォルトアーキテクチャを持つノードがプロビジョニングされます。Pod で別のアーキテクチャを使用する必要がある場合は、ノードセレクタまたはノードアフィニティルールで、使用するコンピューティングクラスのリクエストとともにそのアーキテクチャをリクエストします。リクエストするコンピューティングクラスは、指定する CPU アーキテクチャをサポートしている必要があります。

手順については、Arm アーキテクチャで Autopilot Pod をデプロイするをご覧ください。

Autopilot Pod のコンピューティング クラスを選択する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

Autopilot のコンピューティング クラスの概要