単一テナントのトラブルシューティング


このページでは、単一テナントノードの使用中に発生する可能性がある問題のトラブルシューティング方法について説明します。

ノードグループのサイズ制限

  • 問題: ノードグループのサイズが 100 に制限される。

    • 解決策: 複数のノードグループを作成して、各ノードグループに同じアフィニティ ラベルを使用します。これらのノードグループに VM をスケジューリングする場合は、ノードグループに割り当てたアフィニティ ラベルを使用します。

VM スケジューリングの失敗

  • 問題: 単一テナントノードで VM をスケジューリングできません。

    • 解決策:

      • VM のアフィニティまたは反アフィニティ仕様に一致するノードがゾーンにない場合、単一テナント VM をスケジューリングすることはできません。正しいアフィニティ ラベルが指定されていることを確認します。また、競合するアフィニティ ラベルを指定していないことも確認します。

      • 再起動のインプレース メンテナンス ポリシーを使用している場合は、VM の OnHostMaintenanceterminate に設定されていることを確認します。

      • ノードグループのメンテナンス ポリシーで移行を使用している場合は、特定のノードまたはアフィニティ ラベルではなく、ノードグループで VM をスケジューリングしていることを確認します。

      • 指定したノード名がゾーン内のノードの名前と一致していることを確認します。

      • 指定したノードグループ名がゾーン内のノードグループの名前と一致していることを確認します。

      • VM の最小 CPU プラットフォーム(--min-cpu-platform)が AUTOMATIC 以外の値に設定されていると、単一テナント VM をスケジューリングできません。

VM テナンシー

ノードグループの自動スケーリング

  • 問題: ノードグループのオートスケーラーを有効にできない。

    • 解決策: ノードグループのオートスケーラーを有効にするには、ノードグループのメンテナンス ポリシーをデフォルトのメンテナンス ポリシーに設定する必要があります。
  • 問題: ノードグループ内で移行のメンテナンス ポリシーで、予約済みのノードを保持できない。

    • 解決策: ノードグループ内で移行のメンテナンス ポリシーを使用する場合、ノードグループのオートスケーラーにスケールアウトのみを設定します。これにより、追加容量が必要になったときに、ノードグループにノードが追加されます。
  • 問題: リージョンに使用可能な CPU 割り当てがない。

    • 解決策: リージョンに CPU 割り当てが残っていないか、グループ内のノード数が最大数に達している場合、自動スケーリングが失敗する可能性があります。この問題は、請求関連の問題がある場合にも発生します。エラーの原因によっては、CPU 割り当ての増加を要求するか、新しい単一テナントノード グループを作成する必要があります。

お客様所有ライセンスの使用(BYOL)

  • 問題: 再起動のインプレース メンテナンス ポリシーの構成で問題が発生する。

    • 解決策: 再起動のインプレース メンテナンス ポリシーを使用する場合は、VM の OnHostMaintenanceSettingterminate に設定します。
  • 問題: ノードグループ内で移行のメンテナンス ポリシーを使用しているときに、ノードグループでの VM のスケジューリングで問題が発生する。

    • 解決策:

      • 特定のノードではなく、カスタマイズされたアフィニティ ラベルを使用して、VM をノードグループにスケジューリングします。

      • 2 つのノードを作成し、オートスケーラーを有効にします。この操作を行わなず、サイズが 1 のノードグループを作成すると、そのノードはホールドバック用に予約されます。

容量の問題

  • 問題: ノードまたはノードグループに十分な容量がない。

    • 解決策:

      • 複数の VM を並行してスケジュールしているノードを VM のスケジュール変更先にすると、まれに容量不足になることがあります。

      • 自動スケーリングを有効にしていないノードグループ内のノードを VM のスケジュール変更先にすると、容量不足になることがあります。

      • 自動スケーリングを有効にしているものの、CPU 割り当てを超過しているノードグループ内のノードを VM のスケジュール変更先にすると、容量不足になることがあります。

CPU のオーバーコミット

  • 問題: 最小 CPU 数を設定したときに、単一テナント ノードグループが指定されていないというエラーが発生する。

    Invalid value for field 'resource.scheduling.minNodeCpus': '2'. Node virtual
    CPU count may only be specified for sole-tenant instances.
    
    • 解決策: 最小 CPU 数を設定するときに、単一テナント ノードグループを指定します。
  • 問題: ノード上のすべての単一テナント VM の最小 CPU 数の合計が、ノードタイプの CPU 容量を超えていることを示すエラーが発生する。

    Node virtual CPU count must not be greater than the guest virtual CPU count.
    
    No feasible nodes found for the instance given its node affinities and other
    constraints.
    
    • 解決策: 各 VM の最小 CPU 数を指定し、すべての VM の合計が、単一テナント ノードタイプに指定された CPU 数を超えないようにします。
  • 問題: ノード上のすべての VM のマシンタイプで指定された CPU の合計数が、ノード上のすべての VM に指定された最小 CPU 数の 2 倍を超えていることを示すエラーが発生する。

    Guest virtual CPU count must not be greater than [~2.0] times the node
    virtual CPU count.
    
    • 解決策: このノード上の VM の最小 CPU 数の値を増やして、CPU の合計最小数がマシンタイプによって決定される合計 CPU 数の値の半分以上になるようにします。
  • 問題: 最小 CPU 数が 2 以上の偶数でないことを示すエラーが発生する。

    Invalid value for field 'resource.scheduling.minNodeCpus': '3'. Node virtual
    CPU count must be even.
    
    • 解決策: 最小 CPU 数に 2 以上の偶数を指定します。

GPU

  • 問題: ノード プロパティの非互換性が原因でインスタンスの作成に失敗したことを示すエラー。

    Instance could not be scheduled due to no matching node with property compatibility.
    
    • 解決策: GPU 対応の単一テナントノードは、GPU がアタッチされている VM のみをサポートします。この問題を解決するには、GPU を使用して単一テナント VM をプロビジョニングします。

次のステップ