Surveiller les états des instances répliquées et l'état de la réplication du disque pour le disque persistant régional


Compute Engine conserve des copies de chaque volume de disque persistant régional dans deux zones Google Cloud. Chaque copie est appelée instance répliquée zonale. Lorsque vous écrivez des données sur votre disque, Compute Engine les réplique de manière synchrone sur les deux instances répliquées afin de garantir une haute disponibilité. L'état de réplication du disque du volume du disque persistant régional vous indique à tout moment la capacité d'un disque à écrire de manière synchrone sur les deux instances répliquées. L'état de la réplication du disque est déterminé par les états de réplication des instances répliquées zonales du disque. L'état d'une instance répliquée d'une zone vous indique l'état d'une instance répliquée zonale individuelle par rapport aux données les plus récentes sur le disque. Si une instance répliquée zonale contient les dernières données de disque, cette instance est considérée comme synchronisée avec les données de disque les plus récentes. Si les deux instances répliquées zonales sont synchronisées, le volume de votre disque persistant régional est considéré comme entièrement répliqué.

Ce document explique comment surveiller les états de vos instances répliquées de disques persistants régionaux et l'état de réplication de disque sur une période donnée. Vous pouvez utiliser cette fonctionnalité pour effectuer les opérations suivantes:

  1. Vérifiez l'historique et les états actuels de réplication de vos instances répliquées zonales de disques persistants régionaux.
  2. Utilisez les informations d'état de l'instance répliquée à un moment spécifique pour déterminer si votre disque a été entièrement répliqué.

Pour en savoir plus sur l'état de l'instance répliquée et l'état de la réplication du disque, consultez la page Réplication de disque zonale pour le disque persistant régional.

Surveiller les états à l'aide de la console Google Cloud

Cette section explique comment surveiller les états des instances dupliquées et l'état de la réplication d'un disque persistant régional à l'aide de la console Google Cloud.

Vérifier si les instances répliquées zonales sont synchronisées pour un seul disque

Vous pouvez utiliser la console Google Cloud pour vérifier si les instances répliquées zonales d'un volume de disque persistant régional spécifique sont synchronisées avec les données de disque les plus récentes.

Pour afficher des informations détaillées sur l'état exact des instances répliquées zonales de tous les volumes de disques persistants régionaux dans un projet, vérifiez les états des instances répliquées zonales à l'aide du tableau de bord Cloud Monitoring.

Console

Pour surveiller les états des instances répliquées zonales pour votre volume de disque persistant régional, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Disques.

    Accéder à la page Disques

  2. Sur la page Disques, dans la colonne Nom, sélectionnez le disque pour lequel vous souhaitez vérifier l'état des instances répliquées.

    La page Gérer le disque s'ouvre pour le disque sélectionné et affiche l'onglet Détails du disque sélectionné.

  3. Sur la page Gérer le disque, cliquez sur l'onglet Surveillance.

    La page Gérer le disque affiche les informations de surveillance du disque.

  4. Pour afficher l'historique des informations sur l'état de l'instance répliquée de votre disque, accédez à l'onglet Surveillance, puis accédez au graphique État de la réplication de disque persistant régional.

    Le graphique affiche les valeurs d'état de vos instances répliquées zonales au cours de l'heure précédente sous la forme de deux lignes de graphique distinctes.

    La valeur de l'état de l'instance répliquée peut être l'une des suivantes:

    • 0: l'instance répliquée n'est pas synchronisée avec les données de disque les plus récentes.
    • 1 L'instance répliquée est synchronisée avec les données de disque les plus récentes.
  5. Pour vérifier la valeur d'état de réplication pour vos instances répliquées zonales à un moment spécifique, procédez comme suit:

    • Maintenez le pointeur sur le graphique au niveau de la valeur temporelle à laquelle vous souhaitez vérifier l'état de l'instance répliquée.
    • Pour afficher les valeurs d'état des instances répliquées, accédez au bas du graphique.
    • Facultatif. Pour afficher le nom et la valeur de l'état de l'instance répliquée indiquée par une ligne de graphique, maintenez le pointeur de la souris sur la ligne de graphique au niveau d'une valeur temporelle spécifique. Le graphique met en évidence le nom et l'état à un moment précis de cette instance répliquée dans une info-bulle.
  6. Facultatif. Pour modifier la période sur laquelle vous souhaitez afficher les données d'état de l'instance répliquée, sélectionnez une période en haut de l'onglet Surveillance. Les options suivantes sont disponibles :

    • 1 heure: l'heure précédente. Il s'agit de la valeur par défaut.
    • 6 heures: les 6 heures précédentes.
    • 1 jour: le jour précédent.
    • 1 semaine: la semaine précédente.
    • 1 mois: le mois précédent.
    • 6 semaines: les six semaines précédentes.
    • Personnalisé: période spécifique de votre choix. Pour spécifier une période de surveillance personnalisée, cliquez sur Personnalisée, puis procédez comme suit:

      • Dans le champ Date et heure de début, spécifiez le début de la période de surveillance. Vous devez indiquer une heure dans le passé.
      • Dans le champ Date et heure de fin, spécifiez la fin de la période de surveillance. Vous devez indiquer une heure dans le passé.
      • Pour enregistrer votre période de surveillance personnalisée, cliquez sur Appliquer.

Déterminer si le disque est entièrement répliqué

Après avoir déterminé si vos instances répliquées zonales sont synchronisées avec les données de disque les plus récentes, vous pouvez utiliser ces informations pour déterminer si votre disque est entièrement répliqué.

À un moment donné, le disque a été entièrement répliqué si la valeur de l'état de réplication pour les deux instances répliquées zonales est 1. Si ce n'est pas le cas, vérifiez les états exacts de l'instance répliquée à ce stade pour savoir si votre disque a été dégradé ou récupéré. Pour en savoir plus, consultez la page Surveiller les états des instances répliquées zonales à l'aide de métriques Cloud Monitoring.

Surveiller les états à l'aide des métriques Cloud Monitoring

Vous pouvez vérifier des informations détaillées sur les états exacts des instances répliquées zonales de tous vos volumes de disques persistants régionaux à l'aide de la métrique Regional disk replica state de Cloud Monitoring.

À propos de la métrique Regional disk replica state

Vous pouvez consulter l'historique et l'état actuel de réplication des instances répliquées zonales de vos disques persistants régionaux dans le tableau de bord Cloud Monitoring. Compute Engine capture les états de réplication de vos disques chaque minute et les signale à l'aide de la métrique Regional disk replica state. Toutefois, chaque fois qu'une panne zonale affecte la VM à laquelle votre volume de disque persistant régional est associé, aucune donnée de métrique Regional disk replica state ne s'affiche pour les deux instances répliquées zonales.

Voici les valeurs possibles de la métrique Regional disk replica state. Les instances dupliquées zonales des disques persistants régionaux se trouvent toujours dans l'un de ces états d'instance dupliquée.

  • Synced: l'instance dupliquée est disponible, reçoit de manière synchrone toutes les écritures effectuées sur le disque et est à jour avec toutes les données du disque.
  • CatchingUp: l'instance dupliquée est disponible, mais récupère les données sur le disque de l'autre instance dupliquée.
  • OutOfSync: l'instance dupliquée est temporairement indisponible et désynchronisée des données du disque.

Pour en savoir plus sur la définition des métriques, consultez la section Métriques de surveillance Compute Engine.

Vous pouvez utiliser les données de métriques Regional disk replica state pour effectuer les opérations suivantes:

  • Déterminer l'état de réplication de votre disque persistant régional.
  • Examiner l'historique des états de l'instance dupliquée de votre volume de disque persistant régional pour déterminer si votre architecture de basculement fonctionne comme prévu et prendre les mesures nécessaires en cas de modification de l'état de votre volume de disque persistant régional.
  • Créer des alertes basées sur les données de métriques Regional disk replica state, détecter les modifications dans vos états d'instances dupliquées de disques persistants régionaux et prendre les mesures nécessaires. Pour plus d'informations sur la création d'alertes basées sur des métriques, consultez la section Comment ajouter une règle d'alerte.

Vérifier les données de la métrique Regional disk replica state

Pour afficher l'état des instances répliquées zonales d'un volume de disque persistant régional associé, créez une requête et créez un graphique temporaire pour la métrique Regional disk replica state. Vous pouvez effectuer cette opération sur l'explorateur de métriques à l'aide de l'interface pilotée par un menu, du langage MQL (Monitoring Query Language) ou de PromQL.

  1. Dans le panneau de navigation de la console Google Cloud, sélectionnez Monitoring, puis  Explorateur de métriques :

    Accédez à l'explorateur de métriques

    La page Explorateur de métriques s'ouvre et affiche l'onglet Requêtes.

  2. Pour afficher les données d'état de réplication de chaque instance répliquée zonale d'un projet, sélectionnez les données de séries temporelles de la métrique Regional disk replica state, puis supprimez le filtre d'agrégation en procédant comme suit dans la barre d'outils de Volet des requêtes:

    1. Dans le menu Métriques, cliquez surSélectionner une métrique puis sélectionnez Disque> Disque> État de réplication du disque régional.

    2. Cliquez sur Appliquer.

    3. Dans le menu Agrégation, sélectionnez Non agrégé.

    Un graphique s'affiche et affiche les données de métriques de l'heure précédente pour chaque instance répliquée sous la forme d'une série temporelle. Les données de métriques ne s'affichent que pour les instances répliquées des volumes de disques persistants régionaux associés.

    Pour plus d'informations sur la sélection de séries temporelles pour une métrique, consultez la section Sélectionner des métriques lors de l'utilisation de l'explorateur de métriques.

  3. Pour afficher simultanément les graphiques et les tables, cliquez sur Les deux en haut du graphique.

  4. Pour afficher les données de toutes les propriétés de disques persistants régionaux disponibles, en haut de la vue Tableau, cliquez sur Options d'affichage des colonnes..., sélectionnez toutes les Colonnes, puis cliquez sur OK.

    Le tableau de bord affiche les champs suivants pour chaque ligne du tableau, ainsi que leurs valeurs actuelles:

    • disk_id: ID du disque
    • zone: pour les volumes de disques persistants régionaux, région du disque.
    • replica_zone : Zone de l'instance répliquée
    • state: état de l'instance répliquée
    • storage_type: type de stockage du disque
    • value: valeur de l'état de l'instance répliquée

    Pour afficher ces données sur la série temporelle correspondante dans la vue graphique, maintenez le pointeur de la souris sur le graphique à l'heure actuelle. Le graphique affiche ces valeurs dans une info-bulle.

  5. Pour vérifier l'historique de l'état de réplication d'un disque persistant régional à un moment spécifique, procédez comme suit:

    1. Gardez le pointeur de la souris sur le graphique à une valeur temporelle spécifique de votre choix. Le tableau de bord affiche les données de métriques pour tous les états de réplication de toutes les instances répliquées zonales de votre projet à ce moment précis.

      Dans cette vue, ces informations apparaissent dans une info-bulle.

      Dans la vue Tableau, ces informations apparaissent sous forme de lignes individuelles.

    2. Notez les états des instances répliquées et leurs valeurs correspondantes. À tout moment, si un état particulier a la valeur 1, l'instance répliquée se trouvait dans cet état.

      Dans la vue du graphique, recherchez les ID de disques et les zones des instances répliquées souhaités dans l'info-bulle de l'info-bulle.

      Dans la vue Tableau, vérifiez les colonnes état et valeur pour obtenir les ID de disque et les zones d'instances répliquées spécifiques de votre choix.

    Pour en savoir plus sur la signification des états de réplication et leurs valeurs, consultez la section Comprendre les données de métriques Regional disk replica state.

  6. Facultatif: Pour afficher les informations sur l'état de l'instance répliquée pour un libellé spécifique, dans le menu Filtre, sélectionnez le libellé dont vous souhaitez afficher les données, puis renseignez la boîte de dialogue. Vous pouvez ajouter plusieurs filtres.

    Le tableau de bord n'affiche que les données de métriques des libellés filtrés. Pour en savoir plus sur les filtres, consultez la page Filtrer les données représentées graphiquement.

    Par exemple, pour afficher les données d'état de réplication pour un volume de disque persistant régional spécifique, procédez comme suit:

    1. Dans le menu Filtre, sélectionnez l'étiquette nom.
    2. Dans le menu Comparator (Comparateur), sélectionnez = (est égal à).
    3. Dans le menu Valeur, sélectionnez le nom du disque souhaité.
  7. Facultatif: pour déterminer le pourcentage de temps où les instances répliquées d'un disque spécifique ont été synchronisées, filtrez les données du disque et de l'état spécifiques, puis utilisez le menu d'agrégation:

    1. Dans le menu Filtre, sélectionnez le libellé nom.
    2. Dans le menu Comparator (Comparateur), sélectionnez = (est égal à).
    3. Dans le menu Valeur, sélectionnez le nom du disque.
    4. Dans le menu Filtre, sélectionnez le libellé état.
    5. Dans le menu Comparator (Comparateur), sélectionnez = (est égal à).
    6. Dans le menu Valeur, sélectionnez Synchronisé.
    7. Dans le menu Agrégation, sélectionnez Moyenne par zone d'instance répliquée.
    8. Sélectionnez la période pour laquelle vous souhaitez afficher les données.

    Le tableau de bord affiche les données concernant l'état moyen synced des instances répliquées de votre disque au cours de la période spécifiée. Multipliez ces données par 100 pour déterminer le pourcentage de temps pendant lequel les instances répliquées ont été synchronisées. Si la valeur de la valeur moyenne indique 1 pour cette période, cela signifie que l'instance répliquée a toujours été à jour avec les dernières données. Une valeur moyenne inférieure à 1 indique que l'instance répliquée n'a pas été synchronisée à un moment donné au cours de la période spécifiée.

    Pour en savoir plus sur le regroupement et l'alignement, consultez la section Choisir le mode d'affichage des données représentées graphiquement.

  8. Facultatif: Pour modifier la période sur laquelle vous souhaitez surveiller les données de métriques, cliquez sur Dernière heure en haut du tableau de bord et sélectionnez l'heure souhaitée.

    Vous pouvez sélectionner l'heure actuelle ou spécifier les heures de début et de fin de votre choix. Par défaut, les données de métrique de l'heure précédente s'affichent.

MQL

  1. Dans le panneau de navigation de la console Google Cloud, sélectionnez Monitoring, puis  Explorateur de métriques :

    Accédez à l'explorateur de métriques

    La page Explorateur de métriques s'ouvre et affiche l'onglet Requêtes.

  2. Dans la barre d'outils du volet de requête, cliquez sur le bouton dont le nom commence par < >.

  3. Dans le champ Language (Langage), sélectionnez MQL comme langage de requête. Ce champ se trouve dans la même barre d'outils qui vous permet de mettre en forme votre requête.

  4. Facultatif : Désactivez l'option Exécution automatique.

  5. Saisissez votre requête, puis cliquez sur Run query (Exécuter la requête).

    Lorsque l'option Exécution automatique est activée, le bouton Exécuter la requête ne s'affiche pas.

    Par exemple, pour afficher les données d'état de réplication pour un disque appelé disk-1, exécutez la requête suivante:

    fetch gce_disk
    | metric 'compute.googleapis.com/disk/regional/replica_state'
    | filter (metadata.system_labels.name == 'disk-=1')
    | group_by 1m, [value_replica_state_mean: mean(value.replica_state)]
    | every 1m
    

    Autre exemple, pour déterminer le pourcentage de temps où les instances répliquées ont été synchronisées pour un disque appelé disk-1, exécutez la requête suivante:

    fetch gce_disk
    | metric 'compute.googleapis.com/disk/regional/replica_state'
    | filter (metadata.system_labels.name == 'disk-1') && (metric.state == 'Synced')
    | group_by 1m, [value_replica_state_mean: mean(value.replica_state)]
    | every 1m
    | group_by [metric.replica_zone],
        [value_replica_state_mean_mean: mean(value_replica_state_mean)]
    
  6. Pour modifier la période sur laquelle vous souhaitez surveiller les données de métriques, en haut du tableau de bord, cliquez sur Dernière heure et sélectionnez la période et le fuseau horaire souhaités.

    Vous pouvez sélectionner l'heure actuelle ou spécifier les heures de début et de fin de votre choix. Par défaut, les données de métrique de l'heure précédente s'affichent.

PromQL

  1. Dans le panneau de navigation de la console Google Cloud, sélectionnez Monitoring, puis  Explorateur de métriques :

    Accédez à l'explorateur de métriques

    La page Explorateur de métriques s'ouvre et affiche l'onglet Requêtes.

  2. Dans la barre d'outils du volet de requête, cliquez sur le bouton dont le nom commence par < >.

  3. Dans le champ Langage, sélectionnez PromQL comme langage de requête. Ce champ se trouve dans la même barre d'outils qui vous permet de mettre en forme votre requête.

  4. Facultatif : Désactivez l'option Exécution automatique.

  5. Saisissez votre requête, puis cliquez sur Run query (Exécuter la requête).

    Lorsque l'option Exécution automatique est activée, le bouton Exécuter la requête ne s'affiche pas.

    Par exemple, pour afficher les données d'état de réplication pour un disque appelé disk-1, exécutez la requête suivante:

    avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",metadata_system_name="disk-1"}[${__interval}])
    

    Autre exemple, pour déterminer le pourcentage de temps où les instances répliquées ont été synchronisées pour un disque appelé disk-1, exécutez la requête suivante:

    avg by (replica_zone)(avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",state="Synced",metadata_system_name="disk-1"}[${__interval}]))
    
  6. Pour modifier la période sur laquelle vous souhaitez surveiller les données de métriques, en haut du tableau de bord, cliquez sur Dernière heure et sélectionnez la période et le fuseau horaire souhaités.

    Vous pouvez sélectionner l'heure actuelle ou spécifier les heures de début et de fin de votre choix. Par défaut, les données de métrique de l'heure précédente s'affichent.

Déterminer les états exacts des instances répliquées zonales à l'aide de données de métriques

Pour comprendre les données de métrique Regional disk replica state de votre volume de disque persistant régional, vous devez vérifier les colonnes État et Valeur des instances dupliquées zonales dans le graphique généré. Si vous n'ajoutez aucun filtre à votre requête, voici ce qui se produit:

  • La colonne État affiche tous les états d'instance dupliquée possibles pour une instance dupliquée zonale, soit Synced, CatchingUp et OutOfSync. Le graphique affiche chacun de ces états sous la forme d'une série temporelle pour toutes les instances dupliquées zonales de tous les disques persistants régionaux de votre projet.
  • La colonne valeur indique si l'instance dupliquée zonale est à l'état d'instance dupliquée du disque spécifique ou non. Cette colonne affiche une valeur binaire correspondante (0 ou 1) pour chaque valeur de l'état pour toutes les instances dupliquées zonales de tous les disques persistants régionaux dans Votre projet.

Pour toute instance dupliquée zonale d'un disque persistant régional, si la colonne valeur indique 1 pour un état d'instance dupliquée de disque spécifique, cette instance dupliquée zonale se trouve dans cet état spécifique. Si la colonne valeur indique 0 pour un état spécifique, cette instance répliquée ne se trouve pas dans cet état spécifique. À tout moment, une instance répliquée zonale possède exactement l'un des états de réplication du disque avec 1 dans la colonne valeur. Les deux autres états de réplication de disque affichent 0 dans leurs colonnes de valeur respectives.

Pour chaque instance répliquée zonale, le graphique et la table affichent une entrée distincte pour chaque état d'instance répliquée du disque: Synced, CatchingUp et OutOfSync. La colonne valeur de chaque entrée est une valeur binaire (0 ou 1) qui indique si l'instance répliquée est dans cet état ou non. Une instance répliquée zonale possède à tout moment exactement un état de réplication dont la valeur est 1.

Déterminer l'état exact de la réplication du disque

Vous pouvez utiliser les états de réplication de vos instances répliquées zonales pour déterminer l'état de la réplication de votre volume de disque persistant régional de la manière suivante:

  • Si les deux instances répliquées zonales ont la valeur 1 pour l'état Synced, le volume de votre disque persistant régional est entièrement répliqué.
  • Si l'une des instances dupliquées zonales a 1 comme valeur pour l'état Synced et que l'autre instance zonale a 1 comme valeur pour l'état CatchingUp, le volume de votre disque persistant régional est en cours de récupération.
  • Si l'une des instances dupliquées zonales a 1 comme valeur pour l'état Synced et que l'autre instance zonale a 1 comme valeur pour l'état OutOfSync, le volume de votre disque persistant régional est dégradé.

Prenons l'exemple d'un disque persistant régional my-disk1 qui possède des instances dupliquées dans us-central1-a et us-central1-b. Les scénarios suivants montrent les valeurs des colonnes état et valeur pour les instances dupliquées zonales pour chaque état de réplication possible de my-disk1:

Entièrement répliqué

Dans ce scénario, l'instance dupliquée dans us-central1-a et l'instance dupliquée dans us-central1-b sont toutes deux mises à jour avec les données les plus récentes du disque. Le graphique affiche les valeurs suivantes pour chaque état d'instance dupliquée du disque pour les instances dupliquées zonales de my-disk1:

replica_zone state value
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 1
us-central1-b CatchingUp 0
us-central1-b OutOfSync 0

Récupération

Dans ce scénario, l'instance dupliquée de us-central1-a est mise à jour avec les données sur le disque et l'instance dupliquée de us-central1-b récupère les données sur le disque. Le graphique affiche les valeurs suivantes pour chaque état d'instance dupliquée du disque, pour les instances dupliquées zonales de my-disk1:

replica_zone state value
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 0
us-central1-b CatchingUp 1
us-central1-b OutOfSync 0

Dégradé

Dans ce scénario, l'instance dupliquée de us-central1-a est mise à jour avec les données du disque et l'instance dupliquée de us-central1-b n'est pas synchronisée. Le graphique affiche les valeurs suivantes pour chaque état d'instance dupliquée du disque pour les instances dupliquées zonales de my-disk1:

replica_zone state value
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 0
us-central1-b CatchingUp 0
us-central1-b OutOfSync 1

Étapes suivantes