このページは Cloud Translation API によって翻訳されました。

gkectl を使用して高度なクラスタをバックアップして復元する

このドキュメントでは、高度なクラスタが有効になっている Google Distributed Cloud バージョン 1.32 以降の管理クラスタとユーザークラスタをバックアップして復元する方法について説明します。バックアップと復元機能は、バージョン 1.32 ではプレビュー版で、バージョン 1.33 以降では一般提供版です。

gkectl のバックアップと復元のプロセスに永続ボリュームは含まれません。ローカルボリュームプロビジョナー（LVP）によって作成されたボリュームは変更されません。

クラスタをバックアップする

gkectl backup cluster コマンドによって、etcd ストアからのクラスタ情報と、指定したクラスタの PKI 証明書が tar ファイルに追加されます。etcd ストアは、すべてのクラスタデータ用の Kubernetes バッキングストアであり、クラスタの状態の管理に必要なすべての Kubernetes オブジェクトとカスタムオブジェクトを格納しています。PKI 証明書は、Transport Layer Security（TLS）での認証に使用されます。このデータは、クラスタのコントロールプレーンか、高可用性（HA）デプロイメントのコントロールプレーンの 1 つからバックアップされます。

バックアップ tar ファイルには、サービスアカウントキーと SSH 認証鍵を含む機密性の高い認証情報が含まれています。バックアップファイルを安全な場所に保存してください。意図しないファイルの公開を防ぐため、バックアッププロセスはメモリ内ファイルのみを使用します。

クラスタは定期的にバックアップして、スナップショットデータが比較的新しくなるようにしてください。バックアップの頻度は、クラスタへの大きな変更の頻度が反映されるように調整します。

作業を始める前に、クラスタが正常に動作していて、認証情報とすべてのノードへの SSH 接続が機能していることを確認してください。バックアッププロセスの目的は、クラスタが正常な状態であるときのものを取得し、万一の重大な障害が発生した際に運用を再開できるようにすることです。

クラスタをバックアップするには:

次のコマンドを実行して、クラスタを確認します。
```
gkectl diagnose cluster --cluster-name CLUSTER_NAME \
    --kubeconfig ADMIN_KUBECONFIG
```
次のように置き換えます。
- CLUSTER_NAME: バックアップするクラスタの名前。
- ADMIN_KUBECONFIG: 管理クラスタの kubeconfig ファイルのパス。

次のコマンドを実行して、クラスタをバックアップします。

管理クラスタ

gkectl backup admin --kubeconfig ADMIN_KUBECONFIG

ユーザークラスタ

gkectl backup cluster --cluster-name CLUSTER_NAME \
    --kubeconfig ADMIN_KUBECONFIG

デフォルトでは、バックアップ tar ファイルは管理ワークステーションの gkectl-workspace/backups ディレクトリに保存されます。tar ファイルの名前は CLUSTER_NAME_backup_TIMESTAMP.tar.gz です。ここで、CLUSTER_NAME はバックアップされるクラスタの名前、TIMESTAMP はバックアップが実行された日時です。たとえば、クラスタ名が testuser の場合、バックアップファイルの名前は testuser_backup_2025-08-23T150405Z0700.tar.gz のようになります。

必要に応じて、--backup-file フラグを使用して、バックアップファイルに別の名前と場所を指定できます。

gkectl backup cluster testuser \
    --kubeconfig admin-cluster/kubeconfig \
    --backup-file cluster-backups/testuser-backup-aug-23-2025.tar.gz

バックアップファイルは 1 年経つと期限切れになり、クラスタ復元プロセスは期限切れのバックアップファイルでは動作しません。

vSphere へのバックアップ

管理クラスタとユーザークラスタの両方のバックアップファイルが管理ワークステーションに保存されるだけでなく、vSphere にもアップロードされるようにバックアップを構成するには、次の操作を行います。

管理クラスタ構成ファイルに clusterBackup.datastore フィールドを追加します。
```
clusterBackup:
    datastore: DATASTORE
```
DATASTORE は、バックアップを保存するデータストアに置き換えます。データストアは管理クラスタと同じデータセンター内にある必要があります。バックアップは、指定したデータストアの anthos/CLUSTER_NAME/backup ディレクトリにあります。
管理クラスタを更新します。
```
gkectl update admin --kubeconfig ADMIN_KUBECONFIG \
    --config ADMIN_CONFIG
```
次のように置き換えます。
- ADMIN_KUBECONFIG: 管理クラスタの kubeconfig ファイルのパス。
- ADMIN_CONFIG: 管理クラスタの構成ファイルのパス。

デフォルトでは、gkectl backup コマンドは vSphere に最新の 3 つのバックアップファイルを保存し、古いバックアップファイルを削除します。古いバックアップファイルを保持する場合は、バージョン 1.32.100 以降で使用できる --keep-all-backups フラグを追加します。

クラスタを復元する

バックアップからクラスタを復元するのは最後の手段であり、クラスタに重大な障害が発生し、他の方法ではサービスを復旧できない場合にのみ行うべきです。たとえば、etcd データが破損している、etcd Pod がクラッシュループの状態にある場合に使用します。

gkectl restore コマンドは、3 つのコントロールプレーンノードがすべて失敗した場合にのみ使用します。

1 つのノードのみで障害が発生し、管理クラスタ構成ファイルで autoRepair.enabled が true に設定されている場合、障害が発生したノードは自動的に修復されます。autoRepair.enabled が構成されていない場合は、管理クラスタ構成ファイルに追加して gkectl update admin を実行します。更新後、ノードは自動的に再作成されます。
2 つのコントロールプレーンノードでエラーが発生した場合は、このページのクォーラムを復元するをご覧ください。

バックアップ tar ファイルには、サービスアカウントキーと SSH 認証鍵を含む機密性の高い認証情報が含まれています。意図しないファイルの公開を防ぐため、Google Distributed Cloud の復元プロセスは、メモリ内ファイルのみを使用します。

クラスタを復元する前に、次の条件が満たされていることを確認してください。

バックアップの作成時点でクラスタに存在していたすべてのコントロールプレーンノードのマシンが正常に動作し、アクセス可能であること。
ノード間の SSH 接続がバックアップ時に使用された SSH 認証鍵で動作すること。これらの SSH 認証鍵は、復元プロセスの一環として復元されます。
バックアップ時に使用されたサービスアカウントキーがまだ有効であること。これらのサービスアカウントキーは、復元されたクラスタで再び有効化されます。

クラスタを復元するには:

該当するコマンドを実行して、クラスタを復元します。
管理クラスタ
```
gkectl restore admin --backup-file BACKUP_FILE \
    --config ADMIN_CONFIG
```
次のように置き換えます。
- BACKUP_FILE: 使用しているバックアップファイルのパスと名前。
- ADMIN_CONFIG: 管理クラスタの構成ファイルのパス。
ユーザークラスタ
```
gkectl restore cluster --cluster-name CLUSTER_NAME \
    --backup-file BACKUP_FILE \
    --kubeconfig ADMIN_KUBECONFIG
```
次のように置き換えます。
- CLUSTER_NAME: 復元するクラスタの名前。
- BACKUP_FILE: 使用しているバックアップファイルのパスと名前。
- ADMIN_KUBECONFIG: 管理クラスタの kubeconfig ファイルのパス。
復元プロセスの最後に、復元されたクラスタ用に新しい kubeconfig ファイルがワークスペースディレクトリ gkectl-workspace に生成されます。
復元が完了したら、次のコマンドを実行して、復元が成功したことを確認します。
```
gkectl diagnose cluster --cluster-name CLUSTER_NAME \
    --kubeconfig GENERATED_KUBECONFIG
```
GENERATED_KUBECONFIG は、生成された kubeconfig ファイルに置き換えます。

クォーラムを復元する

クラスタで 2 つのコントロールプレーンノードが失敗した場合は、gkectl restore コマンドを使用してクォーラムを復元できます。クォーラムを復元する場合は、gkectl restore コマンドにバックアップファイルを指定する代わりに、動作中のコントロールプレーンノードの IP アドレスを指定します。

コマンドを実行する前に、次の条件が満たされていることを確認してください。

動作しているコントロールプレーンノードが 1 つ（1 つのみ）あります。
動作中のコントロールプレーンノードには、SSH 認証鍵を使用してアクセスできます。詳細については、SSH を使用したクラスタノードへの接続をご覧ください。

クォーラムを復元するには、クラスタタイプに応じて該当するコマンドを実行します。

管理クラスタ

gkectl restore admin --kubeconfig ADMIN_KUBECONFIG \
    --config ADMIN_CONFIG \
    --control-plane-node WORKING_NODE_IP \
    --ssh-key ADMIN_SSH_KEY_PATH

次のように置き換えます。

ADMIN_KUBECONFIG: 管理クラスタの kubeconfig ファイルのパス。
ADMIN_CONFIG: 管理クラスタの構成ファイルのパス。
WORKING_NODE_IP: 動作中のコントロールプレーンノードの IP アドレス。
ADMIN_SSH_KEY_PATH: 管理クラスタの SSH 認証鍵のパス。

ユーザークラスタ

gkectl restore cluster --cluster-name CLUSTER_NAME \
    --kubeconfig ADMIN_KUBECONFIG \
    --control-plane-node WORKING_NODE_IP \
    --ssh-key USER_SSH_KEY_PATH

次のように置き換えます。

CLUSTER_NAME: 復元するクラスタの名前。
ADMIN_KUBECONFIG: 管理クラスタの kubeconfig ファイルのパス。
WORKING_NODE_IP: 動作中のコントロールプレーンノードの IP アドレス。
USER_SSH_KEY_PATH: ユーザークラスタの SSH 認証鍵のパス。

トラブルシューティング

バックアップまたは復元のプロセスで問題が発生した際は、以降のセクションをトラブルシューティングにお役立てください。

他にお困りのことがある際は、Cloud カスタマーケアチームまでお問い合わせください。

バックアップまたは復元中のメモリ不足

gkectl コマンドを実行するワークステーションに十分な RAM がない場合、バックアップまたは復元プロセスを行うのに必要なメモリが不足する可能性があります。バックアップまたは復元オペレーションを行う際は、必要に応じてバックアップコマンドで --use-disk パラメータを使用し、一時スクラッチディスクを作成して使用してください。ファイル権限を保持するために、このパラメータによってファイルの権限が変更されるため、コマンドは root ユーザーとして実行する必要があります（または sudo を使用してください）。

バックアップ後に SSH 鍵を更新すると、復元プロセスが中断される

バックアップの実行後に SSH 認証鍵が更新された場合、復元プロセス中の SSH 関連のオペレーションが失敗する可能性があります。この場合、新しい SSH 認証鍵を復元プロセスで使用することはできなくなります。この問題を解決するには、一時的に元の SSH 認証鍵を追加したうえで復元を実施してください。復元プロセスが完了したら、SSH 認証鍵をローテーションできます。

gkectl を使用して高度なクラスタをバックアップして復元する

クラスタをバックアップする

管理クラスタ

ユーザー クラスタ

vSphere へのバックアップ

クラスタを復元する

管理クラスタ

ユーザー クラスタ

クォーラムを復元する

管理クラスタ

ユーザー クラスタ

トラブルシューティング

バックアップまたは復元中のメモリ不足

バックアップ後に SSH 鍵を更新すると、復元プロセスが中断される

ユーザークラスタ

ユーザークラスタ

ユーザークラスタ