このページは Cloud Translation API によって翻訳されました。

クラスタをアップグレードする

新しいバージョンの bmctl をインストールすると、以前のバージョンで作成した既存のクラスタをアップグレードできます。クラスタを Google Distributed Cloud の最新バージョンにアップグレードすると、クラスタに追加機能と修正が適用されます。また、引き続きクラスタのサポートを保証します。管理クラスタ、ハイブリッドクラスタ、スタンドアロンクラスタ、ユーザークラスタは、「bmctl upgrade cluster」コマンドを使用するか、kubectl を使用してアップグレードできます。

アップグレードプロセスとバージョニングルールの詳細については、クラスタアップグレードのライフサイクルとステージをご覧ください。

このページは、基盤となる技術インフラストラクチャのライフサイクルを管理する管理者、アーキテクト、オペレーターを対象としています。 Google Cloud のコンテンツで使用されている一般的なロールとタスクの例の詳細については、一般的な GKE ユーザーのロールとタスクをご覧ください。

アップグレードを計画する

このセクションでは、クラスタをアップグレードする前に考慮すべき情報とリンクを提供します。クラスタとノードプールのバージョニングルールなど、アップグレードの詳細については、クラスタアップグレードのライフサイクルとステージをご覧ください。

ベストプラクティス

クラスタのアップグレードの準備については、Google Distributed Cloud クラスタのアップグレードに関するベストプラクティスをご覧ください。

プリフライトチェックをアップグレードする

プリフライトチェックは、クラスタのアップグレードの一環として実行され、クラスタのステータスとノードの健全性を検証します。プリフライトチェックに失敗すると、クラスタのアップグレードは続行されません。プリフライトチェックの詳細については、プリフライトチェックをご覧ください。

アップグレードの前にプリフライトチェックを実行することで、クラスタのアップグレードの準備ができているかどうか確認できます。詳しくは、アップグレードのプリフライトチェックをご覧ください。

既知の問題

クラスタのアップグレードに関連する潜在的な問題については、Google Distributed Cloud for bare metal の既知の問題に移動し、問題のカテゴリとして「アップグレードと更新」を選択して詳細を確認してください。

アップグレードオプションを構成する

クラスタのアップグレードを始める前に、次のアップグレードオプションを構成して、アップグレードプロセスの動作を制御できます。

選択的なノードプールのアップグレード: 特定のワーカーノードプールをクラスタの残りの部分とは別にアップグレードします。
並列アップグレード: ノードのグループまたはノードプールを同時にアップグレードするようにアップグレードプロセスを構成します。

これらのオプションにより、重要なアプリケーションやサービスが停止するリスクを軽減し、全体的なアップグレード時間を大幅に短縮できます。これらのオプションは、多くのノードがある大規模なクラスタや、重要なワークロードを実行しているノードプールの場合に特に効果的です。これらのオプションの機能と使用方法の詳細については、以降のセクションをご覧ください。

アップグレードをスキップする

バージョン 1.33 以降、Google Distributed Cloud はすべてのクラスタタイプでスキップアップグレードをサポートしています。これにより、1 回のオペレーションで、クラスタを現在のバージョンより 2 つマイナーバージョン先のターゲットバージョンにアップグレードできます。たとえば、1 回のオペレーションでバージョン 1.N.X からバージョン 1.N+2.Z に直接アップグレードできます。

アップグレードのスキップにより、増分アップグレードよりも迅速に最新の機能と修正プログラムにアクセスできます。アップグレードのスキップは、必要なアップグレードオペレーションの間隔を延長し、中断の可能性を減らすこともできます。スキップアップグレードは、ワーカーノードプールの選択的アップグレードや並列アップグレードなどの他のアップグレードオプションとともに使用できます。

スキップアップグレードでは、システムはクラスタを中間マイナーバージョンにアップグレードし、すぐにターゲットバージョンにアップグレードします。この中間バージョンは、レジストリミラーを使用する場合に影響します。詳細については、レジストリミラーの追加要件をご覧ください。

この機能はプレビュー版であるため、本番環境クラスタでスキップアップグレードを実行することはおすすめしません。

アップグレードの前提条件をスキップする

スキップアップグレードの実行プロセスは、順次アップグレードの実行プロセスと変わりませんが、追加の前提条件がいくつかあります。

スキップアップグレードがクラスタとノードプールのバージョンのルールに違反しない状態であることを確認します。
- 管理クラスタまたはハイブリッドクラスタのスキップアップグレードを開始する前に、すべてのマネージドユーザークラスタが管理クラスタと同じマイナーバージョンであることを確認してください。
- ユーザークラスタのスキップアップグレードを開始する前に、クラスタが次の条件を満たしていることを確認してください。
  - 関連付けられている管理クラスタまたはハイブリッドクラスタのマイナーバージョンが、ユーザークラスタより 2 つ以上高い。
  - ユーザークラスタのすべてのワーカーノードプールが、ユーザークラスタと同じマイナーバージョンである。

preview.baremetal.cluster.gke.io/skip-minor-version-cluster-upgrade アノテーションをクラスタ構成ファイルに追加します。

apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: baremetal-demo
  namespace: cluster-baremetal-demo
  annotations:
    preview.baremetal.cluster.gke.io/skip-minor-version-cluster-upgrade: "enable"
spec:
  type: user
  profile: default
  anthosBareMetalVersion:   1.33.0-gke.799
  ...

クラスタ構成ファイルの anthosBareMetalVersion をスキップアップグレードのアップグレード対象バージョンに更新します。

シーケンシャルアップグレードと同様に、bmctl upgrade cluster または kubectl apply を使用してスキップアップグレードを開始できます。

レジストリミラーの追加要件

レジストリミラーからコンテナイメージを pull してクラスタをアップグレードする場合、レジストリミラーには、ターゲットバージョンとスキップアップグレードの中間バージョンの両方のイメージが必要です。

スキップアップグレード用にレジストリミラーを準備する手順は次のとおりです。

スキップアップグレードのターゲットバージョンに対応する bmctl のバージョンを使用して、スキップアップグレードの中間バージョンを確認します。
```
bmctl upgrade intermediate-version
```
コマンドレスポンスは、スキップアップグレード中にシステムが中間バージョンとして使用する特定の Google Distributed Cloud パッチバージョンで構成されます。たとえば、bmctl バージョン 1.33.0-gke.799 の場合、レスポンスは次のようになります。
```
1.32.200-gke.104
```
ターゲットバージョンと中間バージョンの両方のイメージパッケージをダウンロードします。

詳細については、イメージパッケージをダウンロードするをご覧ください。
スキップアップグレードを開始する前に、ターゲットバージョンと中間バージョンの両方のイメージパッケージをレジストリミラーに push します。

ターゲットバージョンと中間バージョンの両方のコンテナイメージをホストするには、レジストリミラーに追加のディスク容量が必要です。

シーケンシャルアップグレードと同様に、bmctl upgrade cluster または kubectl apply を使用してスキップアップグレードを開始できます。

選択的なノードプールのアップグレード

デフォルトでは、クラスタのアップグレードオペレーションによって、クラスタ内のすべてのノードとノードプールがアップグレードされます。クラスタをアップグレードすると、各ノードがドレインされ、関連するすべての Pod が再起動されて再スケジュールされます。このため、中断が発生し、処理に時間がかかる可能性があります。このセクションでは、クラスタのアップグレードのためにワーカーノードプールの一部を追加または除外して、ワークロードの中断を最小限に抑える方法について説明します。この機能は、ユーザークラスタ、ハイブリッドクラスタ、スタンドアロンクラスタを対象としています。管理クラスタは、ワーカーノードプールを持てないため、対象外となります。

選択的なノードプールのアップグレードは、次のような状況で使用します。

ワークロードを中断することなく、セキュリティ修正を適用する: コントロールプレーンノード（ロードバランサノードを含む）のみをアップグレードすることで、ワーカーノードプールを中断することなく、Kubernetes の脆弱性に対する修正を適用できます。
ワーカーノード全体をアップグレードする前に、ワーカーノードのサブセットをアップグレードして正常に動作することを確認する: ワーカーノードプールを選択してアップグレードすると、アップグレードされたノードプールでワークロードが正しく実行されていることを確認してから、残りのノードプールをアップグレードできます。
メンテナンスの時間枠を短縮する: 大規模なクラスタのアップグレードは時間がかかる場合があり、アップグレードが完了する正確な時間を予測することは困難です。クラスタのアップグレード時間は、アップグレードするノードの数に比例します。ノードプールを除外して、アップグレードするノード数を減らすと、アップグレード時間を短縮できます。アップグレードは複数回行いますが、メンテナンスの時間枠がより小規模で予測しやすいほどスケジューリングに役立ちます。

2 マイナーバージョンのノードプールバージョンスキュー

バージョン 1.28 以降のクラスタでは、ワーカーノードプールでクラスタ（コントロールプレーン）のバージョンより 2 つ前までのマイナーバージョンを使用できます。n-2 までのバージョンスキューがサポートされるため、ワーカーノードプールをアップグレードするときに、クラスタより 2 つ前のマイナーバージョンからクラスタと同じマイナーバージョンまでスキップすることもできます。

このようにワーカーノードプールに対する n-2 までのバージョンスキューがサポートされるため、フリートのアップグレードをより柔軟に計画できます。

たとえば、バージョン 1.33 クラスタを使用している場合、ワーカーノードプールはバージョン 1.33、1.32、または 1.31 バージョンで作成できます。

クラスタをアップグレードする前に、すべてのワーカーノードプールを現在のクラスタバージョンとターゲットクラスタバージョンの両方と互換性のあるバージョンにする必要があります。

たとえば、クラスタがバージョン 1.29 で、ワーカーノードプールがバージョン 1.29、バージョン 1.28、バージョン 1.16 の場合、クラスタをバージョン 1.30 にアップグレードする前に、バージョン 1.16 ノードプールをバージョン 1.28 または 1.29 にアップグレードする必要があります。

特定のクラスタバージョンに対してサポートされているワーカーノードプールのバージョンの詳細（バージョン 1.29 以前が対象）については、ノードプールのバージョニングルールをご覧ください。

1.30 以降

リリース 1.30 では、すべてのクラスタタイプに対してワーカーノードプールの n-2 バージョンスキューのサポートが一般提供されています。バージョン 1.30 のクラスタでは、この機能はデフォルトで有効になっています。

ノードプールのバージョンがクラスタバージョンと同じかそれより低い場合、1.28 と 1.29 マイナーバージョンの任意のパッチバージョンのノードプールは、1.30 の任意のパッチバージョンにアップグレードできます。

1.29

リリース 1.29 では、すべてのクラスタタイプに対してワーカーノードプールの n-2 バージョンスキューのサポートが一般提供されています。バージョン 1.29 のクラスタでは、この機能はデフォルトで有効になっています。

この機能はパブリックプレビューから一般提供に移行中のため、次の状況では、ハイブリッドクラスタに対して引き続きプレビューアノテーションが必要になります。バージョン 1.28.x のハイブリッドクラスタにバージョン 1.16.y のワーカーノードプールがある場合は、バージョン 1.29.z にアップグレードする前に、クラスタに preview.baremetal.cluster.gke.io/two-minor-version-node-pool: enable アノテーションを追加する必要があります。

apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: baremetal-demo
  namespace: cluster-baremetal-demo
  annotations:
    preview.baremetal.cluster.gke.io/two-minor-version-node-pool: enable
spec:
  type: hybrid
  profile: default
  anthosBareMetalVersion: 1.28.400-gke.77
  ...

1.28

ワーカーノードプールに対する n-2 バージョンスキューのサポートは、リリース 1.28 のプレビュー版で利用できます。このプレビュー機能を有効にするには、クラスタ構成ファイルに preview.baremetal.cluster.gke.io/two-minor-version-node-pool: enable アノテーションを追加します。

apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: baremetal-demo
  namespace: cluster-baremetal-demo
  annotations:
    preview.baremetal.cluster.gke.io/two-minor-version-node-pool: enable
spec:
...

このプレビュー機能を有効にしない場合、ワーカーノードプールとクラスタの間のバージョンスキューは、1 つ前までのマイナーバージョンです。

ワーカーノードプールを選択的にアップグレードするためのバージョニングルールの詳細については、ライフサイクルにおけるノードプールのバージョニングルールとクラスタアップグレードのステージをご覧ください。

クラスタコントロールプレーンと選択したノードプールをアップグレードする

最初のクラスタアップグレードでワーカーノードプールを選択してアップグレードするには:

クラスタのアップグレードに含めるワーカーノードプールの場合、NodePool 仕様で次のいずれかの変更を行います。
- NodePool 仕様で anthosBareMetalVersion をクラスタターゲットアップグレードバージョンに設定する。
- NodePool 仕様で anthosBareMetalVersion フィールドを省略するか、空の文字列に設定する。デフォルトでは、すべてのワーカーノードプールがクラスタアップグレードの対象となります。
アップグレードから除外するワーカーノードプールの場合は、anthosBareMetalVersion をクラスタの現在の（アップグレード前の）バージョンに設定します。
クラスタのアップグレードを開始するの説明に従って、アップグレードを続行します。

クラスタのアップグレードオペレーションで次のノードがアップグレードされます。
- クラスタのコントロールプレーンノード
- クラスタでロードバランサノードプールを使用している場合（spec.loadBalancer.nodePoolSpec）は、ロードバランサノードプール。デフォルトでは、ロードバランサノードは通常のワークロードを実行できます。ロードバランサノードプールは、最初のクラスタアップグレードに常に含まれるため、選択的にアップグレードすることはできません。
- アップグレードから除外していないワーカーノードプール。

たとえば、クラスタのバージョンが 1.32.0 で、2 つのワーカーノードプール（wpool01 と wpool02）があるとします。また、コントロールプレーンと wpool01 は 1.33.100-gke.89 にアップグレードしますが、wpool02 はバージョン 1.32.0 のままにするとします。

この部分的なアップグレードを行うには、次のクラスタ構成ファイルの例のように、クラスタ構成を変更します。

...
---
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: user001
  namespace: cluster-user001
spec:
  type: user
  profile: default
  anthosBareMetalVersion: 1.33.100-gke.89
---
apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: wpool01
  namespace: cluster-user001
spec:
  clusterName: user001
  anthosBareMetalVersion: 1.33.100-gke.89
  nodes:
  - address:  10.200.0.1
  - address:  10.200.0.2
  - address:  10.200.0.3
  ...
  - address:  10.200.0.8

apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: wpool02
  namespace: cluster-user001
spec:
  clusterName: user001
  anthosBareMetalVersion: 1.32.0
  nodes:
  - address:  10.200.1.1
  - address:  10.200.1.2
  - address:  10.200.1.3
  ...
  - address:  10.200.1.12

ノードプールを現在のクラスタバージョンにアップグレードする

クラスタのアップグレードからノードプールを除外した場合は、クラスタアップグレードを実行することで、ノードプールをターゲットクラスタのバージョンに引き上げることができます。クラスタのアップグレードから除外されたワーカーノードプールは、NodePool 仕様の anthosBareMetalVersion フィールドが以前の（アップグレード前の）クラスタバージョンに設定されています。

ワーカーノードプールを現在の（アップグレード後の）クラスタバージョンにアップグレードするには:

クラスタ構成ファイルで、現在のクラスタバージョンにアップグレードするワーカーノードプールの NodePool 仕様を編集します。anthosBareMetalVersion を現在の（アップグレード後の）クラスタバージョンに設定します。

アップグレードの対象として複数のワーカーノードプールが選択されている場合、Cluster 仕様の spec.nodePoolUpgradeStrategy.concurrentNodePools の値により、並列でアップグレードされるノードプールの数が決まります。これらのワーカーノードプールを同時にアップグレードしない場合は、アップグレードするノードプールを 1 つずつ選択します。
クラスタのアップグレードを開始するの説明に従って、アップグレードを続行します。

クラスタのアップグレードオペレーションでは、以前にアップグレードから除外され、anthosBareMetalVersion が現在の（アップグレード後の）クラスタバージョンに設定されているワーカーノードプールだけがアップグレードされます。

たとえば、クラスタはバージョン 1.33.100-gke.89 にアップグレード済みであるけれども、ノードプール wpool02 はまだアップグレード前の古いクラスタバージョン 1.32.0 であるとします。ワークロードがアップグレード後のノードプール（wpool01）で正常に動作しているので、wpool02 も現在のクラスタバージョンにアップグレードすることにします。wpool02 をアップグレードするには、anthosBareMetalVersion フィールドを削除するか、空の文字列に設定します。

次のクラスタ構成ファイルの例では、この部分的なアップグレードをサポートするためにクラスタ構成を変更する方法を示します。

...
---
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: user001
  namespace: cluster-user001
spec:
  type: user
  profile: default
  anthosBareMetalVersion: 1.33.100-gke.89
---
apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: wpool01
  namespace: cluster-user001
spec:
  clusterName: user001
  anthosBareMetalVersion: 1.33.100-gke.89
  nodes:
  - address:  10.200.0.1
  - address:  10.200.0.2
  - address:  10.200.0.3
  ...
  - address:  10.200.0.8

apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: wpool02
  namespace: cluster-user001
spec:
  clusterName: user001
  anthosBareMetalVersion: ""
  nodes:
  - address:  10.200.1.1
  - address:  10.200.1.2
  - address:  10.200.1.3
  ...
  - address:  10.200.1.12

ノードプールのアップグレードをロールバックする

kubelet やプラグインとの互換性など、ワークロードのパフォーマンスに影響する依存関係は数多く存在します。ワーカーノードプールのアップグレード後に問題が発生した場合は、ノードプールを以前のバージョンにロールバックできます。

この機能は、サポートされているすべてのクラスタバージョンで同じリリースフェーズにあるわけではありません。

1.30 以降

バージョン 1.30 クラスタ（バージョン 1.30 のコントロールプレーンノードのあるクラスタ）では、ノードプールのロールバック機能が一般提供され、デフォルトで有効になっています。

1.29

ノードプールのロールバック機能は、バージョン 1.29 クラスタ（バージョン 1.29 のコントロールプレーンノードのあるクラスタ）でプレビュー版として利用できます。この機能はプレビュー版のため、機能を有効にするには、Cluster リソースに次のアノテーションを追加する必要があります。

preview.baremetal.cluster.gke.io/worker-node-pool-upgrade-rollback: enable

1.28

ノードプールのロールバック機能は、マイナーバージョン 1.28 以前のクラスタでは使用できません。

ノードプールのアップグレードをロールバックするには、次の操作を行います。

`bmctl`

bmctl を使用してノードプールのアップグレードをロールバックする場合は、クラスタ構成ファイルを編集し、bmctl update コマンドで変更を適用します。

クラスタ構成ファイルで、以前のバージョンにロールバックするワーカーノードプールの NodePool 仕様を編集します。anthosBareMetalVersion を以前の（アップグレード前の）クラスタバージョンに設定します。
```
...
---
apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: wpool01
  namespace: cluster-user001
spec:
  clusterName: user001
  anthosBareMetalVersion: 1.32.500-gke.48
  nodes:
  - address:  10.200.0.1
  - address:  10.200.0.2
  - address:  10.200.0.3
  ...
```
ロールバックの対象として複数のワーカーノードプールが選択されている場合、Cluster 仕様の spec.nodePoolUpgradeStrategy.concurrentNodePools の値によって、並行してロールバックされるノードプールの数が決まります。ワーカーノードプールを同時にロールバックしない場合は、ロールバックするノードプールを 1 つずつ選択するか、nodePoolUpgradeStrategy 設定を更新します。同様に、NodePool 仕様の spec.upgradeStrategy.parallelUpgrade.concurrentNodes の値によって、並行してロールバックされるノードの数が決まります。
bmctl update を使用して、NodePool 仕様の変更を適用します。
```
bmctl update cluster -c CLUSTER_NAME --kubeconfig=ADMIN_KUBECONFIG
```
次のように置き換えます。
- CLUSTER_NAME: 更新するクラスタの名前。
- ADMIN_KUBECONFIG: 管理側のクラスタ（管理、ハイブリッド、スタンドアロン）の kubeconfig ファイルのパス。
ロールバックが自動的に開始します。bmctl update cluster コマンドはすぐに終了しますが、ロールバックは続行されます。ロールバックの進行中は、クラスタに対して他のオペレーションを実行しないでください。
ロールバックの実行時に、Google Distributed Cloud は各ノードに対して次の処理を行います。
- ノードをメンテナンスモードに切り替えます。
- ノードでリセットジョブを実行し、クリーンな状態に戻します。
- ノードでマシンのプリフライトチェックを実行します。
- ノードで machine-init ジョブを実行し、ターゲットのロールバック（アップグレード前の）バージョンで再インストールします。
- ノードをメンテナンスモードから切り替えます。
ロールバックに成功すると、NodePool リソースの nodePool.status.anthosBareMetalVersion の値がターゲットロールバックバージョンに設定されます。

クラスタ構成ファイルを編集するときに、bmctl update と kubectl apply -f を同じものとして使用しないでください。これらのコマンドを同じものとして使用すると、入力された内容が Cluster 仕様のヘッダーによって意図せず削除される可能性があります。たとえば、bmctl update を使用してクラスタ構成ファイルを更新し、レジストリミラーを構成できます。調整後に、クラスタに spec.nodeConfig.registryMirrors が設定されます。

その後、kubectl apply -f コマンドを使用してクラスタ構成を変更すると、クラスタの reconciler によって入力された spec.nodeConfig.registryMirrors が削除されます。この現象は、クラスタ構成仕様にない構成がクラスタに存在するために発生します。

`kubectl`

kubectl を使用して NodePool リソースを直接編集することで、ノードプールのアップグレードをロールバックできます。

ワーカーノードプールをロールバックするには、NodePool リソースを開いて編集します。
```
kubectl edit nodepool NODE_POOL_NAME \
    --namespace CLUSTER_NAMESPACE \
    --kubeconfig ADMIN_KUBECONFIG
```
次のように置き換えます。
- NODE_POOL_NAME: ロールバックするノードプールの名前。
- CLUSTER_NAMESPACE: ノードプールがデプロイされている Namespace の名前。これはクラスタの Namespace です。
- ADMIN_KUBECONFIG: 管理側のクラスタ（管理、ハイブリッド、スタンドアロン）の kubeconfig ファイルのパス。

spec.anthosBareMetalVersion の値を以前の（アップグレード前の）バージョンに変更します。

...
---
apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: wpool01
  namespace: cluster-user001
spec:
  clusterName: user001
  anthosBareMetalVersion: 1.32.500-gke.48
  nodes:
  - address:  10.200.0.1
  - address:  10.200.0.2
  - address:  10.200.0.3
  ...

エディタで NodePool リソースを保存して閉じます。

ロールバックが自動的に開始します。ロールバックの進行中は、クラスタに対して他のオペレーションを実行しないでください。
ロールバックの実行時に、Google Distributed Cloud は各ノードに対して次の処理を行います。
- ノードをメンテナンスモードに切り替えます。
- ノードでリセットジョブを実行し、クリーンな状態に戻します。
- ノードでマシンのプリフライトチェックを実行します。
- ノードで machine-init ジョブを実行し、ターゲットのロールバック（アップグレード前の）バージョンで再インストールします。
- ノードをメンテナンスモードから切り替えます。
ロールバックに成功すると、NodePool リソースの nodePool.status.anthosBareMetalVersion の値がターゲットロールバックバージョンに設定されます。

並列アップグレード

デフォルトのクラスタアップグレードでは、各クラスタノードが順番に（1 つずつ）アップグレードされます。このセクションでは、クラスタをアップグレードするときに複数のノードを並行してアップグレードするように、クラスタとワーカーノードプールを構成する方法について説明します。ノードを並行してアップグレードすると、特に数百のノードがあるクラスタの場合に、クラスタのアップグレードがかなり速くなります。

クラスタのアップグレードを高速化するために使用できる並列アップグレート方法には、次の 2 つがあります。

ノードの同時アップグレード: 複数のノードが並行してアップグレードされるようにワーカーノードプールを構成できます。ノードの並列アップグレードは NodePool 仕様（spec.upgradeStrategy.parallelUpgrade）で構成します。ワーカーノードプール内のノードだけが並列でアップグレードされます。コントロールプレーンとロードバランサのノードプール内のノードは 1 つずつアップグレードされます。詳細については、ノードのアップグレード方法をご覧ください。
ノードプールの同時アップグレード: 複数のノードプールが並行してアップグレードされるようにクラスタを構成できます。ワーカーノードプールのみ並列でアップグレードできます。コントロールプレーンとロードバランサのノードプールは 1 つずつアップグレードされます。

ノードのアップグレード方法

複数のノードが同時にアップグレードされるようにワーカーノードプールを構成できます（concurrentNodes）。また、アップグレードプロセス全体で、ワークロードを実行できるノード数の最小しきい値を設定することもできます（minimumAvailableNodes）。この構成は NodePool 仕様で行います。これらのフィールドの詳細については、クラスタ構成フィールドのリファレンスをご覧ください。

ノードのアップグレード方法は、ワーカーノードプールにのみ適用されます。コントロールプレーンとロードバランサのノードプールには、ノードのアップグレード方法を指定できません。コントロールプレーンとロードバランサのノードプール内のノードは、クラスタのアップグレードで 1 つずつアップグレードされます。コントロールプレーンノードプールとロードバランサノードプールは、Cluster 仕様（controlPlane.nodePoolSpec.nodes と loadBalancer.nodePoolSpec.nodes）で指定します。

ノードの並列アップグレードを構成する場合は、次の制限に注意してください。

concurrentNodes の値は、ノードプール内のノード数の 50% または定数（15）のいずれか小さいほうになります。たとえば、ノードプールに 20 個のノードがある場合、10 より大きい値は指定できません。ノードプールに 100 個のノードがある場合、指定可能な最大値は 15 です。
minimumAvailableNodes と一緒に concurrentNodes を使用する場合、その合計値はノードプール内のノードの合計数を超えることはできません。たとえば、ノードプールに 20 個のノードがあり、minimumAvailableNodes が 18 に設定されている場合、concurrentNodes は 2 以下にする必要があります。同様に、concurrentNodes が 10 に設定されている場合、minimumAvailableNodes は 10 以下にする必要があります。

次の例では、10 個ノードがあるワーカーノードプール np1 を示します。アップグレードでは、ノードは一度に 5 個アップグレードされます。アップグレードを継続するには、少なくとも 4 個のノードが使用可能である必要があります。

apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: np1
  namespace: cluster-cluster1
spec:
  clusterName: cluster1
  nodes:
  - address:  10.200.0.1
  - address:  10.200.0.2
  - address:  10.200.0.3
  - address:  10.200.0.4
  - address:  10.200.0.5
  - address:  10.200.0.6
  - address:  10.200.0.7
  - address:  10.200.0.8
  - address:  10.200.0.9
  - address:  10.200.0.10 
  upgradeStrategy:
    parallelUpgrade:
      concurrentNodes: 5
      minimumAvailableNodes: 4

ノードプールのアップグレード方法

複数のワーカーノードプールを並行してアップグレードするようにクラスタを構成できます。Cluster 仕様の nodePoolUpgradeStrategy.concurrentNodePools ブール値フィールドに、クラスタのすべてのワーカーノードプールを同時にアップグレードするかどうかを指定します。デフォルト（1）では、ノードプールが順番に（1 つずつ）アップグレードされます。concurrentNodePools を 0 に設定すると、クラスタ内のすべてのワーカーノードプールが並行してアップグレードされます。

コントロールプレーンノードプールとロードバランシングノードプールは、この設定の影響を受けません。これらのノードプールは常に 1 つずつ順番にアップグレードされます。コントロールプレーンノードプールとロードバランサノードプールは、Cluster 仕様（controlPlane.nodePoolSpec.nodes と loadBalancer.nodePoolSpec.nodes）で指定します。

apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: cluster1
  namespace: cluster-cluster1
spec:
  ...
  nodePoolUpgradeStrategy:
    concurrentNodePools: 0
  ...

並列アップグレードの実行方法

このセクションでは、並列アップグレード用にクラスタとワーカーノードプールを構成する方法について説明します。

ワーカーノードプールとワーカーノードプール内のノードの並列アップグレードを実行するには、次の操作を行います。

NodePool 仕様に upgradeStrategy セクションを追加します。

このマニフェストは個別に適用することも、クラスタの更新時にクラスタ構成ファイルで適用することもできます。

次に例を示します。
```
---
apiVersion: baremetal.cluster.gke.io/v1
kind: NodePool
metadata:
  name: np1
  namespace: cluster-ci-bf8b9aa43c16c47
spec:
  clusterName: ci-bf8b9aa43c16c47
  nodes:
  - address:  10.200.0.1
  - address:  10.200.0.2
  - address:  10.200.0.3
  ...
  - address:  10.200.0.30
  upgradeStrategy:
    parallelUpgrade:
      concurrentNodes: 5
      minimumAvailableNodes: 10
```
この例では、concurrentNodes フィールドの値は 5 に設定されています。つまり、5 個のノードが並列でアップグレードされます。minimumAvailableNodes フィールドは 10 に設定されています。つまり、アップグレード中は、少なくとも 10 ノードをワークロードに使用できる必要があります。

注: コントロールプレーンノードプールとロードバランサノードプールのノードのアップグレード方法は指定できません。
クラスタ構成ファイルの Cluster 仕様に nodePoolUpgradeStrategy セクションを追加します。
```
---
apiVersion: v1
kind: Namespace
metadata:
  name: cluster-user001
---
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: user001
  namespace: cluster-user001
spec:
  type: user
  profile: default
  anthosBareMetalVersion: 1.33.100-gke.89
  ...
  nodePoolUpgradeStrategy:
    concurrentNodePools: 0
  ...
```
この例では、concurrentNodePools フィールドが 0 に設定されています。つまり、クラスタのアップグレード中にすべてのワーカーノードプールが同時にアップグレードされます。ノードプール内のノードのアップグレード方法は、NodePool 仕様で定義します。
前の管理クラスタ、スタンドアロンクラスタ、ハイブリッドクラスタ、ユーザークラスタをアップグレードするのセクションの説明に沿ってクラスタをアップグレードします。

並列アップグレードのデフォルト値

並列アップグレードはデフォルトで無効になっています。並列アップグレードに関連するフィールドは変更可能です。フィールドはいつでも削除できます。後続のアップグレートの前にデフォルト値に戻し、この機能を無効にすることもできます。

次の表に、並列アップグレードに関連するフィールドとそのデフォルト値を示します。

フィールド	デフォルト値	意味
`nodePoolUpgradeStrategy.concurrentNodePools`（Cluster 仕様）	`1`	ワーカーノードプールを順番に（1 つずつ）アップグレードします。
`upgradeStrategy.parallelUpgrade.concurrentNodes`（NodePool 仕様）	`1`	ノードを順番に（1 つずつ）アップグレードします。
`upgradeStrategy.parallelUpgrade.minimumAvailableNodes`（NodePool 仕様）	デフォルトの `minimumAvailableNodes` 値は `concurrentNodes` の値によって異なります。 `concurrentNodes` を指定しない場合、`minimumAvailableNodes` はデフォルトでノードプールのサイズの 2/3 になります。 `concurrentNodes` を指定した場合、`minimumAvailableNodes` はデフォルトでノードプールのサイズから `concurrentNodes` を引いた値になります。	`minimumAvailableNodes` に達すると、アップグレードが停止します。使用可能なノード数が `minimumAvailableNodes` を超えると、アップグレードが再開します。

クラスタのアップグレードを開始する

このセクションでは、クラスタのアップグレード手順について説明します。

`bmctl`

新しいバージョンの bmctl をダウンロードしてインストールすると、以前のバージョンで作成した管理クラスタ、ハイブリッドクラスタ、スタンドアロンクラスタ、ユーザークラスタをアップグレードできます。bmctl のバージョンによっては、クラスタを同じバージョンにしかアップグレードできない場合があります。

ユーザー認証情報をアプリケーションのデフォルト認証情報（ADC）として設定します。
```
gcloud auth application-default login
```
画面の指示に沿って、ADC 用の Google アカウントを選択します。詳細については、アプリケーションのデフォルト認証情報を設定するをご覧ください。
Google Distributed Cloud のダウンロードの説明に従って、最新の bmctl をダウンロードします。
クラスタ構成ファイルの anthosBareMetalVersion をアップグレード対象のバージョンに更新します。

アップグレード対象のバージョンは、ダウンロードした bmctl ファイルのバージョンと一致している必要があります。次のクラスタ構成ファイルスニペットでは、anthosBareMetalVersion フィールドが最新バージョンに更新されています。
```
---
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: cluster1
  namespace: cluster-cluster1
spec:
  type: admin
  # Anthos cluster version.
  anthosBareMetalVersion: 1.33.100-gke.89
```
bmctl upgrade cluster コマンドを使用してアップグレードを完了します。
```
bmctl upgrade cluster -c CLUSTER_NAME --kubeconfig ADMIN_KUBECONFIG
```
次のように置き換えます。
- CLUSTER_NAME: アップグレードするクラスタの名前。
- ADMIN_KUBECONFIG: 管理クラスタの kubeconfig ファイルのパス。
注: bmctl upgrade コマンドは、Cluster カスタムリソースの anthosBareMetalVersion 値とプレビューアノテーションのみを更新します。クラスタ仕様の他のフィールドを変更する場合は、bmctl update コマンドを使用します。詳細については、クラスタを更新するをご覧ください。
クラスタアップグレードオペレーションでは、プリフライトチェックが実行され、クラスタのステータスとノードの健全性が検証されます。プリフライトチェックに失敗すると、クラスタのアップグレードは続行されません。トラブルシューティング情報については、クラスタのインストールまたはアップグレードに関するトラブルシューティングをご覧ください。

すべてのクラスタコンポーネントが正常にアップグレードされると、クラスタのヘルスチェックが実行されます。この最後の手順で、クラスタが正常な動作状態にあることが確認されます。クラスタがすべてのヘルスチェックに合格するまで、チェックが継続します。すべてのヘルスチェックに合格すると、アップグレードが正常に完了します。

クラスタのアップグレードのイベントの順序については、クラスタアップグレードのライフサイクルとステージをご覧ください。

`kubectl`

kubectl を使用してクラスタをアップグレードするには、次の操作を行います。

クラスタ構成ファイルを編集して、anthosBareMetalVersion をアップグレード先のターゲットバージョンに設定します。
アップグレードを開始するには、次のコマンドを実行します。
```
kubectl apply -f CLUSTER_CONFIG_PATH
```
CLUSTER_CONFIG_PATH は、編集したクラスタ構成ファイルのパスに置き換えます。

bmctl を使用したアップグレードプロセスと同様に、クラスタのアップグレードの一環としてプリフライトチェックが実行され、クラスタのステータスとノードの健全性が検証されます。プリフライトチェックが不合格の場合、クラスタのアップグレードは停止します。ブートストラップクラスタが作成されないため、クラスタと関連ログを調べてトラブルシューティングを行います。詳細については、クラスタのインストールまたはアップグレードに関するトラブルシューティングをご覧ください。

kubectl でクラスタをアップグレードする場合、bmctl の最新バージョンは必要ありませんが、最新の bmctl をダウンロードすることをおすすめします。クラスタが正常に動作するように、ヘルスチェックやバックアップなどの他のタスクを実行するには bmctl が必要です。

アップグレードの一時停止と再開

アップグレードの一時停止と再開機能を使用すると、クラスタのアップグレードが完了する前に処理を一時的に停止できます。クラスタのアップグレードが一時停止されると、アップグレードが再開されるまで、新しいワーカーノードのアップグレードはトリガーされません。

この機能は、コントロールプレーンノードがすべてマイナーバージョン 1.28 以降のクラスタでプレビュー版として利用できます。コントロールプレーンノードがすべてマイナーバージョン 1.29 以降のクラスタでは、一般提供版として利用できます。

次のような場合は、アップグレードの一時停止をおすすめします。

アップグレード中にクラスタワークロードに問題が見つかり、アップグレードを一時停止して問題を調査する必要がある
メンテナンスの時間枠が短いため、次の時間枠が始まるまでアップグレードを一時停止する

クラスタのアップグレードが一時停止している間、次の操作を行うことができます。

アップグレードが一時停止しているときに新しいノードが追加された場合、アップグレードが再開されて完了するまで、マシンチェックジョブは実行されません。

クラスタのアップグレードが一時停止されている間、次のクラスタ操作は実行できません。

アクティブなクラスタアップグレードが一時停止している間は、新しいクラスタのアップグレードを開始できません。

アップグレードの一時停止と再開を有効にする

Google Distributed Cloud 1.33

コントロールプレーンノードがすべてマイナーバージョン 1.29 以降のクラスタでは、アップグレードの一時停止と再開機能がデフォルトで有効になっています。

Google Distributed Cloud 1.32

アップグレードの一時停止と再開機能はプレビュー版ですが、Cluster リソースのアノテーションを使用して有効にできます。

アップグレードの一時停止と再開を有効にするには、次の手順を行います。

preview.baremetal.cluster.gke.io/upgrade-pause-and-resume アノテーションをクラスタ構成ファイルに追加します。

apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: baremetal-demo
  namespace: cluster-baremetal-demo
  annotations:
    preview.baremetal.cluster.gke.io/upgrade-pause-and-resume: enable
spec:
...

変更を適用するには、クラスタを更新します。
```
bmctl update cluster -c CLUSTER_NAME --kubeconfig=ADMIN_KUBECONFIG
```
次のように置き換えます。
- CLUSTER_NAME: 更新するクラスタの名前。
- ADMIN_KUBECONFIG: 管理クラスタ、ハイブリッドクラスタ、スタンドアロンクラスタの場合は、クラスタの kubeconfig ファイルのパス。ユーザークラスタの場合は、管理クラスタの kubeconfig ファイルのパスを入力します。
nodePoolUpgradeStrategy.pause フィールドは変更可能です。いつでも追加または更新できます。

アップグレードを一時停止する

クラスタのアップグレードを一時停止するには、Cluster 仕様の nodePoolUpgradeStrategy.pause を true に設定します。

アクティブなクラスタアップグレードを一時停止するには、次の操作を行います。

nodePoolUpgradeStrategy.pause をクラスタ構成ファイルに追加し、true に設定します。
```
apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: baremetal-demo
  namespace: cluster-baremetal-demo
  ...
spec:
  ...
  nodePoolUpgradeStrategy:
    pause: true
  ...
```
bmctl を使用してアップグレードを開始した場合は、次のステップを実行するために新しいターミナルウィンドウを開く必要があります。
変更を適用するには、クラスタを更新します。
```
bmctl update CLUSTER_NAME
```
アップグレードオペレーションが一時停止します。新しいノードのアップグレードはトリガーされません。
bmctl を使用してアップグレードを開始し、長期的な一時停止を予定している場合は、Ctrl+C キーを押して bmctl を終了します。そうしないと、bmctl の実行が継続します。

bmctl CLI は、アップグレードの一時停止ステータスの変更を検出できないため、自動的に終了しません。ただし、bmctl を終了すると、管理ワークステーションのクラスタフォルダにある cluster-upgrade-TIMESTAMP ログファイルと Cloud Logging に対するアップグレード状況のロギングが停止します。そのため、一時停止が短期の場合は、bmctl を実行したままにすることをおすすめします。アップグレードが一時停止している間に bmctl を長時間実行すると、最終的にはタイムアウトします。

一時停止したアップグレードを再開する

一時停止したクラスタのアップグレードを再開するには、Cluster 仕様で nodePoolUpgradeStrategy.pause を false に設定するか、仕様から nodePoolUpgradeStrategy.pause を削除します。

一時停止したクラスタのアップグレードを再開するには、次の操作を行います。

nodePoolUpgradeStrategy.pause をクラスタ構成ファイルに設定し、false に設定します。

apiVersion: baremetal.cluster.gke.io/v1
kind: Cluster
metadata:
  name: baremetal-demo
  namespace: cluster-baremetal-demo
  ...
spec:
  ...
  nodePoolUpgradeStrategy:
    pause: false
  ...

また、pause フィールドのデフォルトが false のため、このフィールドを削除できます。

変更を適用するには、クラスタを更新します。
```
bmctl update CLUSTER_NAME
```
アップグレードオペレーションは中断した時点から再開します。
アップグレードのステータスを確認するには、まず、status に anthosBareMetalVersion のあるリソースのリストを取得します。
```
kubectl get RESOURCE --kubeconfig ADMIN_KUBECONFIG --all_namespaces
```
次のように置き換えます。
- RESOURCE: 取得するリソースの名前。Cluster、NodePool、BareMetalMachine リソースには、anthosBareMetalVersion ステータス情報が含まれています。
- ADMIN_KUBECONFIG: 管理クラスタの kubeconfig ファイルのパス。
次の例は、BareMetalMachine カスタムリソースのレスポンスの形式を示しています。各 BareMetalMachine はクラスタノードに対応します。
```
NAMESPACE              NAME         CLUSTER        READY   INSTANCEID               MACHINE      ABM VERSION   DESIRED ABM VERSION
cluster-nuc-admin001   192.0.2.52   nuc-admin001   true    baremetal://192.0.2.52   192.0.2.52   1.28.0        1.28.0
cluster-nuc-user001    192.0.2.53   nuc-user001    true    baremetal://192.0.2.53   192.0.2.53   1.16.2        1.16.2
cluster-nuc-user001    192.0.2.54   nuc-user001    true    baremetal://192.0.2.54   192.0.2.54   1.16.2        1.16.2
```

status.anthosBareMetalVersion（リソースの現在のバージョン）を確認するには、個々のリソースの詳細を取得します。

kubectl describe RESOURCE RESOURCE_NAME \
    --kubeconfig ADMIN_KUBECONFIG \
    --namespace CLUSTER_NAMESPACE

次のサンプルでは、IP アドレス 192.0.2.53 のクラスタノードの BareMetalMachine の詳細を示します。

Name:         192.0.2.53
Namespace:    cluster-nuc-user001
...
API Version:  infrastructure.baremetal.cluster.gke.io/v1
Kind:         BareMetalMachine
Metadata:
  Creation Timestamp:  2023-09-22T17:52:09Z
  ...
Spec:
  Address:                    192.0.2.53
  Anthos Bare Metal Version:  1.16.2
  ...
Status:
  Anthos Bare Metal Version:  1.16.2

この例のノードは Google Distributed Cloud バージョン 1.16.2 です。

クラスタをアップグレードする

アップグレードを計画する

ベスト プラクティス

プリフライト チェックをアップグレードする

既知の問題

アップグレード オプションを構成する

アップグレードをスキップする

アップグレードの前提条件をスキップする

レジストリ ミラーの追加要件

選択的なノードプールのアップグレード

2 マイナー バージョンのノードプール バージョン スキュー

1.30 以降

1.29

1.28

クラスタ コントロール プレーンと選択したノードプールをアップグレードする

ノードプールを現在のクラスタ バージョンにアップグレードする

ノードプールのアップグレードをロールバックする

1.30 以降

1.29

1.28

bmctl

kubectl

並列アップグレード

ノードのアップグレード方法

ノードプールのアップグレード方法

並列アップグレードの実行方法

並列アップグレードのデフォルト値

クラスタのアップグレードを開始する

bmctl

kubectl

アップグレードの一時停止と再開

アップグレードの一時停止と再開を有効にする

Google Distributed Cloud 1.33

Google Distributed Cloud 1.32

アップグレードを一時停止する

一時停止したアップグレードを再開する

ベストプラクティス

プリフライトチェックをアップグレードする

アップグレードオプションを構成する

レジストリミラーの追加要件

2 マイナーバージョンのノードプールバージョンスキュー

クラスタコントロールプレーンと選択したノードプールをアップグレードする

ノードプールを現在のクラスタバージョンにアップグレードする

`bmctl`

`kubectl`

`bmctl`

`kubectl`