Configurer des alertes sur l'état du risque RPO des plans de sauvegarde


Cette page explique comment configurer des alertes sur le niveau de risque et le motif du risque de RPO des plans de sauvegarde basés sur les événements de journaux émis par Sauvegarde pour GKE depuis l'explorateur de journaux.

Dans le contexte de la planification de la reprise après sinistre ou de la continuité de l'activité, l'objectif de point de récupération (RPO) désigne le point dans le temps le plus récent à partir duquel les données doivent être restaurées. Il spécifie la perte de données maximale due à une défaillance de l'infrastructure, exprimée en temps avant la défaillance, pendant laquelle l'activité d'écriture est perdue.

La colonne Niveau de risque RPO indique le niveau de risque RPO actuel du plan de sauvegarde. Le champ "Motif du risque" fournit des détails sur la raison pour laquelle le plan de sauvegarde présente un niveau de risque spécifique.

Le niveau de risque RPO et la raison du risque sont associés à un mappage plusieurs-à-un. Autrement dit, un niveau de risque RPO de 4 peut avoir plusieurs raisons. Pour obtenir la liste complète des niveaux de risque RPO et des raisons correspondantes, consultez le tableau suivant.

Mappage entre les niveaux de risque liés au RPO et les raisons du risque

Niveau de risque RPO Raison du risque lié au RPO
1 Aucun risque détecté pour ce plan de sauvegarde.
2 Des échecs de sauvegarde récents ont été enregistrés pour ce BackupPlan.
2 Il est en phase d'entraînement. Le niveau de risque sera disponible après la création réussie d'au moins quatre sauvegardes.
2 Aucune configuration de RPO n'est définie. Passez à un calendrier RPO pour une meilleure protection.
2 Aucune programmation n'est définie. Activez un calendrier RPO pour une meilleure protection.
3 Les sauvegardes récentes prennent plus de temps. Si cette tendance persiste, il est possible que le RPO ne soit plus atteint.
3 La dernière sauvegarde n'a pas pu être créée.
3 La dernière exécution de sauvegarde a échoué.
3 La planification est suspendue.
3 Ce BackupPlan a récemment échoué et la programmation est suspendue.
3 En phase d'entraînement, mais ce BackupPlan a récemment échoué à effectuer des sauvegardes.
3 En phase d'entraînement, mais la création de la sauvegarde la plus récente a échoué.
3 En phase d'entraînement, mais la dernière exécution de sauvegarde a échoué.
3 Aucune configuration de RPO n'est définie et ce BackupPlan présente des échecs de sauvegarde récents. Passez à un calendrier RPO une fois l'échec résolu.
3 Aucune planification n'est définie et les sauvegardes récentes ont échoué. Activez un calendrier RPO pour une meilleure protection.
4 Les sauvegardes récentes prennent plus de temps et la programmation est suspendue. Si cette tendance persiste après la réactivation de la programmation, il est possible que le RPO ne soit plus atteint.
4 La création de la sauvegarde la plus récente a échoué et le programme est suspendu.
4 La dernière exécution de la sauvegarde a échoué et la planification est suspendue.
4 En phase d'entraînement, mais la planification est suspendue. Réactivez la programmation pour permettre à l'entraînement de se terminer.
4 En phase d'entraînement, mais ce BackupPlan a récemment échoué à effectuer des sauvegardes et la programmation est suspendue.
4 En phase d'entraînement, mais la création de la sauvegarde la plus récente a échoué et la planification est suspendue.
4 En phase d'entraînement, mais la dernière exécution de la sauvegarde a échoué et la planification est suspendue.
4 Aucune configuration de RPO n'est définie et la création de la sauvegarde la plus récente a échoué. Passez à un calendrier RPO une fois l'échec résolu.
4 Aucune configuration de RPO n'est définie et la dernière exécution de la sauvegarde a échoué. Passez à un calendrier RPO une fois l'échec résolu.
4 Aucune configuration de RPO n'est définie et la planification Cron est suspendue. Passez à un calendrier RPO pour une meilleure protection.
4 Aucune configuration de RPO n'est définie et la programmation cron est suspendue en raison d'échecs de sauvegarde récents. Passez à un calendrier RPO une fois l'échec résolu.
4 Aucune configuration de RPO n'est définie et la planification cron est suspendue, car la création de la sauvegarde la plus récente a échoué. Passez à un calendrier RPO une fois l'échec résolu.
4 Aucune configuration de RPO n'est définie et la planification cron est suspendue, car la dernière exécution de la sauvegarde a échoué. Passez à un calendrier RPO une fois l'échec résolu.
4 Aucun calendrier n'est défini et la dernière exécution de la sauvegarde a échoué. Activez un calendrier RPO pour une meilleure protection.
5 Ce BackupPlan ne respecte pas le RPO. Résolvez les échecs de sauvegarde, mettez à jour le RPO cible et les périodes d'exclusion, ou réduisez le champ d'application de la sauvegarde si nécessaire pour ce BackupPlan.
5 Ce BackupPlan n'a pas respecté le RPO et la programmation est suspendue. Résolvez les échecs de sauvegarde, mettez à jour le RPO cible et la période d'exclusion, ou réduisez le champ d'application de la sauvegarde si nécessaire pour ce BackupPlan.

Avant de commencer

Avant de configurer une règle d'alerte, assurez-vous de disposer d'un canal de notification approprié.

Créer une alerte

Pour en savoir plus sur la création de règles d'alerte générales basées sur les journaux, consultez Configurer des règles d'alerte basées sur les journaux. Vous pouvez également créer une règle d'alerte spécifique pour les modifications du niveau de risque RPO ou des raisons du risque RPO dans les plans de sauvegarde :

  1. Accédez à la page "Explorateur de journaux". Accéder à l'explorateur de journaux

  2. Dans le volet Requête, saisissez les critères de filtrage suivants :

    logName="projects/PROJECT_ID/logs/gkebackup.googleapis.com%2Fbackup_plan_change"
    resource.type="gkebackup.googleapis.com/BackupPlan"
    resource.labels.backup_plan_id="BACKUP_PLAN"
    resource.labels.location="LOCATION"
    jsonPayload.backupPlanMetadata.rpoRiskLevel>="VALUE"
    jsonPayload.backupPlanMetadata.rpoRiskReason="REASON"
    

    Remplacez les éléments suivants :

    • PROJECT_ID : ID de votre projet Google Cloud .
    • BACKUP_PLAN : nom du plan de sauvegarde pour lequel vous souhaitez générer des alertes.
    • LOCATION : région de calcul du plan de sauvegarde pour lequel vous souhaitez générer des alertes. Par exemple, us-central1..
    • VALUE : valeur du niveau de risque RPO pour le plan de sauvegarde pour lequel vous souhaitez recevoir des alertes. Les valeurs valides sont comprises dans la plage [1,5]. Nous vous recommandons de configurer des alertes pour les niveaux de risque supérieurs ou égaux à 4.
    • REASON : (facultatif) Sélectionnez un motif de risque approprié dans le tableau.
  3. Pour valider la requête, cliquez sur Exécuter la requête.

  4. Dans la barre d'outils Résultats de la requête, développez le menu Actions et sélectionnez Créer une alerte de journal.

  5. Dans le volet Détails de l'alerte, saisissez un nom pour votre règle d'alerte dans le champ Nom de la règle d'alerte. Par exemple, Alert for RPO risk level of backup plan.

  6. Sélectionnez une option dans le menu Niveau de gravité de la règle. Les incidents et les notifications affichent le niveau de gravité. Nous vous recommandons de définir le niveau de gravité sur Critique.

  7. Saisissez une description pour votre règle d'alerte. Vous pouvez également inclure des informations susceptibles d'aider le destinataire d'une notification à diagnostiquer le problème. Pour savoir comment mettre en forme et affiner le contenu de ce champ, consultez Utiliser Markdown et les variables dans les modèles de documentation.

  8. Cliquez sur Suivant.

  9. Définissez le délai entre les notifications et la durée de fermeture automatique de l'incident. Nous vous recommandons de définir le délai entre les notifications sur un jour et la durée de fermeture automatique sur sept jours.

  10. Cliquez sur Suivant.

  11. Sélectionnez un ou plusieurs canaux de notification pour votre règle d'alerte.

  12. Cliquez sur Enregistrer.

    Une fois la règle enregistrée, vous recevez des alertes sur vos canaux de notification lorsqu'un forfait de sauvegarde correspond à votre filtre.