Google Distributed Cloud で VM ランタイムを有効または無効にする

このドキュメントでは、VMRuntime カスタム リソースを更新するか、bmctl コマンドを実行して、Google Distributed Cloud で VM ランタイムを有効または無効にする方法について説明します。

準備

Google Distributed Cloud 上の VM ランタイムを有効または無効にするには、次のリソースとツールへのアクセス権が必要です。

Google Distributed Cloud 上の VM ランタイムを有効にする

Google Distributed Cloud 上の VM ランタイムは、GKE on Bare Metal バージョン 1.10 以降では自動的にインストールされますが、デフォルトでは無効になっています。GKE on Bare Metal で VM リソースを実行するには、その前に Google Distributed Cloud 上の VM ランタイムを有効にする必要があります。

bmctl

  • ランタイムを有効にするには、bmctl ツールを使用します。

    bmctl enable vmruntime --kubeconfig KUBECONFIG_PATH
    

    クラスタの kubeconfig ファイルへのパスを指定します。GKE on Bare Metal は、クラスタの作成時に管理ワークステーションに kubeconfig ファイルを生成します。デフォルトでは、パスは bmctl-workspace/CLUSTER_NAME/CLUSTER_NAME-kubeconfig です。

    Google Distributed Cloud の VM ランタイムがすでに有効になっている場合、このコマンドはエラーを返します。

エミュレーションやイメージ形式などの追加設定は、VMRuntime カスタム リソースを編集することで構成できます。

カスタム リソース

ランタイムを有効にするには、VMRuntime カスタム リソースを更新します。このカスタム リソースはデフォルトでインストールされます。

  1. VMRuntime カスタム リソースを編集します。

    kubectl edit vmruntime
    
  2. 仕様に enabled:true を設定します。

    apiVersion: vm.cluster.gke.io/v1
    kind: VMRuntime
    metadata:
      name: vmruntime
    spec:
      enabled: true
      # useEmulation defaults to "false" if not set.
      useEmulation: true
      # vmImageFormat defaults to "qcow2" if not set.
      vmImageFormat: qcow2
    

    前述の spec セクションでは、次の値を設定できます。

    • enabled: Google Distributed Cloud 上の VM ランタイムを有効にするには、true に設定します。
    • useEmulation: ノードがハードウェア仮想化をサポートしていない場合や、それが不明な場合は、値を true に設定します。使用可能な場合、ハードウェア仮想化は、ソフトウェア エミュレーションよりもパフォーマンスが優れています。指定しない場合、useEmulation フィールドはデフォルトで false になります。
    • vmImageFormat: rawqcow2 の 2 つのディスク イメージ形式値をサポートします。vmImageFormat を設定しない場合、Google Distributed Cloud 上の VM ランタイムは raw ディスク イメージ形式を使用して VM を作成します。raw 形式によって、書き込み形式のコピーである qcow2 よりもパフォーマンスが向上しますが、より多くのディスクを使用する場合があります。VM のイメージ形式の詳細については、QEMU ドキュメントのディスク イメージのファイル形式をご覧ください。
  3. カスタム リソースをエディタに保存します。

  4. VMRuntime カスタム リソースが有効であることを確認します。

    kubectl describe vmruntime vmruntime
    

    VMRuntime カスタム リソースの詳細には、Status セクションが含まれています。VMRuntime.Status.Readytrue として表示されていれば、Google Distributed Cloud の VM ランタイムは有効であり、機能しています。

Google Distributed Cloud 上の VM ランタイムを無効にする

Google Distributed Cloud で VM ランタイムを使用する必要がなくなった場合は、この機能を無効にできます。

bmctl

  • ランタイムを無効にするには、bmctl ツールを使用します。

    bmctl disable vmruntime --kubeconfig KUBECONFIG_PATH \
      --force=true
    

    クラスタの kubeconfig ファイルへのパスと次の構成オプションの値を指定します。

    • --force: true に設定して、既存の VM リソースを削除することを確定します。デフォルト値は false です。

カスタム リソース

ランタイムを無効にするには、VMRuntime カスタム リソースを更新します。

  1. VMRuntime カスタム リソースを編集します。

    kubectl edit vmruntime
    
  2. 仕様に enabled:false を設定します。

    apiVersion: vm.cluster.gke.io/v1`
    kind: VMRuntime
    metadata:
      name: vmruntime
    spec:
      enabled: false
      useEmulation: true
      vmImageFormat: qcow2
    
  3. 更新したカスタム リソース仕様をエディタに保存します。

  4. VMRuntime カスタム リソースが無効になっていることを確認するには、vm-system 名前空間で実行されている Pod を表示します。

    kubectl get pods --namespace vm-system
    

    vmruntime-controller-manager デプロイメントに属する Pod のみが名前空間で実行されている場合は、Google Distributed Cloud の VM ランタイムが無効になります。

VM の実行の動作について理解する

baremetal.cluster.gke.io/vmrumtime-force-disable アノテーションを Google Distributed Cloud の VM ランタイム リソースで使用すると、クラスタ内で VM が実行されている間にランタイムが無効になっている場合の動作を定義できます。

次の例は、このアノテーションの値がデフォルトで false に設定されていることを示しています。

  // VM runtime yaml file
  apiVersion: vm.cluster.gke.io/v1
  kind: VMRuntime
  metadata:
    annotations:
      baremetal.cluster.gke.io/vmrumtime-force-disable: "false"
    name: vmruntime
  [...]

このアノテーションが false に設定されている場合、Google Distributed Cloud の VM ランタイムは実行中の VM の保護を試みます。Google Distributed Cloud の VM ランタイムを無効にする前に、実行中のすべての VM を削除するか、前のセクションで示したように bmctl disable vmruntime コマンドで --force=true パラメータを指定します。

次の表は、このアノテーションが true または false に設定されているときに、--force=true パラメータを指定している場合としていない場合に、実行中の VM に何が起こるかを示しています。

Cluster State --force parameter vmrumtime-force-disable アノテーション 動作
VM はありません なし 該当なし Google Distributed Cloud 上の VM ランタイムを無効にします。
既存の VM 正しい 正しい 実行中のすべての VM と関連リソースを削除します。Google Distributed Cloud 上の VM ランタイムを無効にします。
正しい 誤り 実行中のすべての VM と関連リソースを削除します。Google Distributed Cloud 上の VM ランタイムを無効にします。
誤り 正しい 実行中の VM と関連リソースの削除を求めます。実行中の VM をすべて削除したら、Google Distributed Cloud 上の VM ランタイムを無効にします。
誤り 誤り 実行中のいかなる既存の VM も削除しないでください。Google Distributed Cloud の VM ランタイムを無効にしないでください。bmctl コマンドは、エラーを返します。

Google Distributed Cloud の VM ランタイムのプリフライト チェック

Google Distributed Cloud の VM ランタイムのプリフライト チェックでは、Google Distributed Cloud の VM ランタイムと VM を使用する前に、マシンの環境に対する一連の前提条件を検証します。Google Distributed Cloud の VM ランタイムのプリフライト チェックが失敗すると、VM の作成はブロックされます。spec.enabled が true に設定されている場合、Google Distributed Cloud の VM ランタイムのプリフライト チェックは自動的に実行されます。

kubectl label nodes NODE_NAME   "kubevm.io/VM-SkipSchedule"= --kubeconfig KUBECONFIG_PATH

Google Distributed Cloud の VM ランタイムのプリフライト チェックは、次のいずれかの操作を行うと実行されます。

  1. Google Distributed Cloud 上の VM ランタイムを有効にする
  2. useEulation など、Google Distributed Cloud の VM ランタイムの機能を有効にする
  3. クラスタをアップグレードする
  4. ノードで kubevm.io/VM-SkipSchedule ラベルを削除する
  5. bmctl check vmruntimepfc --kubeconfig KUBECONFIG_PATH コマンドを実行するか、VMRuntimePreflightCheck YAML マニフェストを適用することで、Google Distributed Cloud 上の VM ランタイムのプリフライト チェック オブジェクトを個別に作成する

Google Distributed Cloud の VM ランタイムの最後のプリフライト チェックが正常に完了したら、VM を起動できます。プリフライト チェックが失敗すると、VM の作成はブロックされ、プリフライト チェック エラーが発生します。

プリフライト チェックの成功の確認

プリフライト チェックが成功したかどうかを確認するには、次のコマンドを実行します。

  1. 最後に実行されたプリフライト チェックを探します。

    kubectl get vmruntimepfc -n vm-system --kubeconfig KUBECONFIG_PATH
    

    出力は次のサンプルようになります。

    NAME                                                             PASS    AGE
    vmruntime-preflight-check-6ee61513-ea5d-4340-9374-90396cac129e   false   42s
    vmruntime-preflight-check-f8d71751-a01c-471e-bab5-3370fc2addd5   true    21s
    
  2. プリフライト チェックのステータスを確認するには、次のコマンドを実行します。

       kubectl get vmruntime vmruntime -o yaml --kubeconfig KUBECONFIG_PATH
    
       ...
         preflightCheckSummary:
         preflightCheckSummary:
           featureStatuses:
             CPU:
               passed: true
             KVM:
               passed: true
           preflightCheckName: vmruntime-preflight-check-f8d71751-a01c-471e-bab5-3370fc2addd5
           preflightCheckPassed: true
       ...
    
     ```
    

プリフライト チェックの失敗をデバッグする

プリフライト チェックに失敗した場合は、次の手順でデバッグします。

  1. 最後に実行されたプリフライト チェックを探します。

    kubectl get vmruntimepfc -n vm-system
    
  2. 詳細については、プリフライト チェックのステータスを確認してください。

    kubectl get vmruntimepfc -n vm-system \
        vmruntime-preflight-check-6ee61513-ea5d-4340-9374-90396cac129e -o yaml \
        --kubeconfig KUBECONFIG_PATH
    
      ...
      status:
      checks:
       worker-0--52229ee15841099-22c41577139a7b8c.lab.anthos:
         passed: false
         results:
         - checkName: CPU
           passed: true
         - checkName: KVM
           message: |
             command terminated with exit code 1
             ls: /mnt/dev/kvm: No such file or directory
           passed: false
      ...
    
  3. 問題を修正し、Google Distributed Cloud の VM ランタイムのプリフライト チェックを再度実行します。VMRuntimePreflightCheck YAML マニフェストの例を次に示します。

    apiVersion: vm.cluster.gke.io/v1
    kind: VMRuntimePreflightCheck
    metadata:
      name: vmruntime-preflight-check-manual
      namespace: vm-system
    

次のステップ