Cette page a été traduite par l'API Cloud Translation.

Augmenter la disponibilité des applications avec état avec l'opérateur HA avec état

L'opérateur haute disponibilité avec état vous permet d'utiliser l'intégration de GKE au disque persistant régional pour automatiser et contrôler la vitesse de basculement des pods StatefulSet. Lors du basculement, l'opérateur gère automatiquement la détection de la défaillance du nœud, le détachement d'un volume d'un nœud défaillant et la fixation sécurisée du volume au nœud de basculement.

Pourquoi utiliser l'opérateur haute disponibilité avec état

Une architecture avec état commune permettant d'atteindre une haute disponibilité utilise des disques persistants régionaux en tant que couche de stockage. Ces disques permettent une réplication synchrone des données entre deux zones d'une même région. Lors des défaillances de nœud ou de réseau zonal, cette architecture permet à vos charges de travail de basculer (en forçant l'association) des instances dupliquées vers le stockage sur un autre nœud dans un zone différente.

L'opérateur HA avec état vous permet d'effectuer les optimisations suivantes :

Améliorez le temps de récupération des applications à instance dupliquée unique : si vous n'utilisez qu'une seule instance dupliquée, vous pouvez utiliser l'opérateur HA avec état et remplacer le stockage zonal par un stockage régional lors du provisionnement de votre application, pour augmenter la durabilité et la disponibilité des données en cas de défaillance d'un nœud.
Réduire les coûts de mise en réseau interzone : la réplication de données sur plusieurs zones peut s'avérer coûteuse pour les applications à haut débit. Vous pouvez utiliser l'opérateur haute disponibilité avec état pour exécuter votre application dans une seule zone, tout en conservant un chemin de basculement vers une autre zone, conforme au contrat de niveau de service de votre application.

Limites

Le type de volume gcePersistentDisk n'est pas accepté. Utilisez un PersistentVolume qui utilise le pilote CSI de disque persistant.
Avec une architecture d'opérateur haute disponibilité avec état à instance unique, GKE conserve vos données dans deux zones via un disque persistant régional, mais les données ne sont accessibles que lorsque l'instance répliquée de votre application est opérationnelle. Lors d'un basculement, votre application sera temporairement indisponible pendant que votre réplica est reprogrammé sur un nouveau nœud sain. Si votre application a un objectif de temps de récupération (RTO, Recovery Time Objective) très faible, nous vous recommandons d'utiliser une approche multi-instance répliquée.

Avant de commencer

Avant de commencer, effectuez les tâches suivantes :

Activez l'API Google Kubernetes Engine.

Activer l'API Google Kubernetes Engine

Si vous souhaitez utiliser Google Cloud CLI pour cette tâche, installez puis initialisez gcloud CLI. Si vous avez déjà installé la gcloud CLI, obtenez la dernière version en exécutant la commande gcloud components update. Il est possible que les versions antérieures de gcloud CLI ne permettent pas d'exécuter les commandes de ce document.
Remarque : Pour les installations de la gcloud CLI existantes, veillez à définir la propriété compute/region. Si vous utilisez principalement des clusters zonaux, définissez plutôt compute/zone. En définissant un emplacement par défaut, vous pouvez éviter les erreurs gcloud CLI de ce type : One of [--zone, --region] must be supplied: Please specify location. Vous devrez peut-être spécifier l'emplacement dans certaines commandes si celui de votre cluster diffère de l'emplacement par défaut que vous avez défini.

Conditions requises

Lorsque vous utilisez un opérateur HA avec état, il configure automatiquement votre StatefulSet associé pour utiliser des disques persistants régionaux. Toutefois, vous êtes responsable de la configuration des pods pour qu'ils utilisent ces disques et qu'ils puissent s'exécuter dans toutes les zones associées au stockage sous-jacent.
Assurez-vous que votre application s'exécute sur des formes de machines compatibles avec les disques persistants régionaux : E2, N1, N2, N2D.
Assurez-vous que le pilote CSI de disque persistant Compute Engine est activé. Le pilote CSI de disque persistant est activé par défaut sur les nouveaux clusters Autopilot et Standard, et ne peut pas être désactivé ni modifié avec Autopilot. Si vous devez ajouter manuellement le pilote CSI Persistent Disk depuis votre cluster, consultez la page Activer le pilote CSI Persistent Disk sur un cluster existant.
Si vous utilisez une ressource StorageClass personnalisée, configurez le pilote CSI de disque persistant avec l'approvisionneur pd.csi.storage.gke.io et les paramètres suivants :
- availability-class: regional-hard-failover
- replication-type: regional-pd

Configurer et utiliser l'opérateur HA avec état

Pour configurer l'opérateur HA avec état pour vos charges de travail avec état, procédez comme suit :

Activez le module complémentaire StatefulHA.
Installez une ressource HighAvailabilityApplication.
Installez un StatefulSet
Inspectez la ressource HighAvailabilityApplication.

Activez le module complémentaire `StatefulHA`.

Pour utiliser l'opérateur haute disponibilité avec état, le module complémentaire StatefulHA doit être activé sur votre cluster.

Clusters Autopilot : GKE active automatiquement le module complémentaire StatefulHA lors de la création du cluster. Si vous souhaitez utiliser l'opérateur Stateful HA sur une charge de travail existante, vous devez activer manuellement le pilote CSI de disque persistant Compute Engine. Pour en savoir plus, consultez Activer le pilote CSI Persistent Disk sur un cluster existant.
Clusters Standard :
- Création d'un cluster : suivez les instructions de gcloud CLI pour créer un cluster standard et ajoutez l'option suivante : --add-on=StatefulHA.
- Cluster standard existant : suivez les instructions de gcloud CLI pour mettre à jour les paramètres d'un cluster Standard et utilisez l'option suivante pour activer le module complémentaire : --update-addons=StatefulHA=ENABLED.

GKE installe automatiquement une ressource StorageClass nommée standard-rwo-regional lorsque le module complémentaire est activé.

Installer une ressource HighAvailabilityApplication

HighAvailabilityApplication est une ressource Kubernetes qui simplifie les paramètres StatefulSet et augmente la disponibilité des pods sur GKE. L'opérateur haute disponibilité avec état rapproche les ressources HighAvailabilityApplication sur GKE.

Dans la spécification HighAvailabilityApplication, vous devez définir HighAvailabilityApplication.spec.resourceSelection.resourceKind sur StatefulSet.

Pour savoir comment configurer la ressource HighAvailability, consultez la documentation de référence sur HighAvailabilityApplication.

Consultez l'exemple suivant pour PostgreSQL :

Enregistrez le fichier manifeste suivant dans un fichier nommé stateful-ha-example-resource.yaml :
```
kind: HighAvailabilityApplication
apiVersion: ha.gke.io/v1
metadata:
  name: APP_NAME
  namespace: APP_NAMESPACE
spec:
  resourceSelection:
    resourceKind: StatefulSet
  policy:
    storageSettings:
      requireRegionalStorage: true
    failoverSettings:
      forceDeleteStrategy: AfterNodeUnreachable
      afterNodeUnreachable:
        afterNodeUnreachableSeconds: 20
```
Remplacez les éléments suivants :
- APP_NAME : nom d'une application de votre cluster que vous souhaitez protéger. Ce nom doit être partagé par HighAvailabilityApplication et StatefulSet.
- APP_NAMESPACE : espace de noms de l'application. Cet espace de noms doit être partagé par HighAvailabilityApplication et StatefulSet protégés.
Dans cet exemple :
- La propriété HighAvailabilityApplication.spec.policy.storageSettings.requireRegionalSettings est définie sur true. Cela applique un stockage régional.
- La propriété HighAvailabilityApplication.spec.policy.failoverSettings est définie sur AfterNodeUnreachable. Ce paramètre détermine comment la suppression forcée est déclenchée en cas d'échec du nœud.
- La propriété HighAvailabilityApplication.spec.policy.failoverSettings.afterNodeUnreachable est définie sur 20. Il s'agit du délai avant la suppression forcée d'un pod après que le nœud dans lequel il s'exécute a été marqué comme inaccessible.
Créez la ressource. La ressource HighAvailabilityApplication identifie un StatefulSet avec un espace de noms et un nom correspondants.
```
kubectl apply -f stateful-ha-example-resource.yaml
```

Installez un StatefulSet

Installez un StatefulSet Par exemple, vous pouvez installer un StatefulSet PostgreSQL à l'aide de Helm (Cloud Shell est préinstallé avec Helm) :

helm install postgresql oci://registry-1.docker.io/bitnamicharts/postgresql \
  --namespace=APP_NAMESPACE \
  --set fullnameOverride=APP_NAME

La ressource HighAvailabilityApplication modifie automatiquement la StorageClass du StatefulSet en standard-rwo-regional, qui utilise un disque persistant régional.

Inspecter la ressource HighAvailabilityApplication

Exécutez la commande suivante pour vérifier que le basculement automatique est activé dans l'exemple d'application :

kubectl describe highavailabilityapplication APP_NAME

Le résultat doit se présenter comme suit :

Status:
Conditions:
  Last Transition Time:  2023-08-09T23:59:52Z
  Message:               Application is protected
  Observed Generation:   1
  Reason:                ApplicationProtected
  Status:                True
  Type:                  Protected

Utiliser des disques persistants existants

Si vous utilisez un disque persistant existant et un PersistentVolume défini de manière statique, configurez le PersistentVolume avec force-attach: true dans .spec.csi.volumeAttributes. Exemple :

apiVersion: v1
kind: PersistentVolume
metadata:
  name: PV_NAME
spec:
  storageClassName: "STORAGE_CLASS_NAME"
  capacity:
    storage: DISK_SIZE
  accessModes:
    - ReadWriteOnce
  claimRef:
    name: PV_CLAIM_NAME
    namespace: default
  csi:
    driver: pd.csi.storage.gke.io
    volumeHandle: DISK_ID
    fsType: FS_TYPE
    volumeAttributes:
      force-attach: true