Les modèles de règles et les profils de ressources sont définis dans la section "Plans de sauvegarde" de la console de gestion. Ils sont appliqués aux applications et aux VM dans App Manager. Un non-respect du plan de sauvegarde se produit lorsqu'une tâche (ou une action) ne répond pas aux exigences définies par une stratégie dans un modèle de stratégie.
Cette section détaille les causes potentielles d'un cas de non-respect d'un plan de sauvegarde, la façon dont la console de gestion identifie un cas de non-respect d'un plan de sauvegarde et les méthodes que vous pouvez utiliser pour surveiller les cas de non-respect d'un plan de sauvegarde lorsqu'ils se produisent. Il comprend les éléments suivants:
- Causes potentielles de non-respect des règles concernant les plans de sauvegarde
- Comment un appareil de sauvegarde/récupération surveille-t-il les cas de non-respect d'un plan de sauvegarde ?
- Surveiller les cas de non-respect des plans de sauvegarde
Causes potentielles de non-respect des règles concernant les plans de sauvegarde
La console de gestion applique des plans de sauvegarde aux applications et aux ensembles de données, où la gestion des données de copie de votre application dans le service Gestionnaire d'applications est basée sur les règles que vous définissez dans un modèle de sauvegarde et les règles associées. Un modèle de sauvegarde inclut une ou plusieurs règles qui définissent la source des données (instantané ou réplication) et la planification (fréquence, durée de conservation, heure de début, heure de fin) pour chaque source de données. Un cas de non-respect d'un plan de sauvegarde se produit lorsque la tâche (ou l'action) définie par une stratégie de plan de sauvegarde ne commence pas selon le calendrier de la stratégie.
Chaque appareil de sauvegarde/restauration exécute automatiquement une analyse du plan de sauvegarde toutes les heures pour identifier les cas de non-respect du plan de sauvegarde au cours de la journée pour les tâches planifiées. Cette opération en arrière-plan vous avertit des éventuelles violations du plan de sauvegarde le plus près possible de la fin de la période de la règle du plan de sauvegarde. Pour en savoir plus, consultez la section Comment un appareil de sauvegarde/restauration surveille les cas de non-respect du plan de sauvegarde.
La console de gestion permet aux administrateurs de créer une bibliothèque de modèles de règles. L'une des principales caractéristiques de chaque stratégie de plan de sauvegarde est la planification qui détermine quand cette stratégie sera exécutée.
Les cas de non-respect des plans de sauvegarde sont souvent attribués à des problèmes liés aux paramètres de nombre d'emplacements de tâche, qui déterminent le nombre de tâches pouvant être exécutées simultanément. Toutefois, l'augmentation du nombre d'emplacements de tâche ne garantit pas que les cas de non-respect du plan de sauvegarde cesseront. En réalité, un cas de non-respect d'un plan de sauvegarde peut être lié à l'une des conditions décrites dans les sections suivantes.
Jobs ayant échoué
Les tâches qui échouent sont une cause courante de non-respect des règles du plan de sauvegarde. Par exemple, si un hôte Oracle n'est pas accessible, l'appliance de sauvegarde/restauration ne peut pas capturer les données d'Oracle RMAN, ce qui entraîne l'échec de la tâche d'instantané. Lorsqu'une tâche échoue, vérifiez votre environnement pour vous assurer que toutes les applications et tous les hôtes sont accessibles.
Plusieurs applications par hôte
Si un hôte dispose de plusieurs applications et que chacune d'elles est gérée par un modèle de stratégie distinct (plutôt que d'être regroupées en tant que groupe de cohérence), une seule application peut exécuter une tâche d'instantané à la fois, même si des emplacements libres sont disponibles.
Si une VM est gérée en tant que VM et que des applications sont également gérées via l'agent de sauvegarde et de reprise après sinistre, une seule des applications peut exécuter une tâche de capture de données à la fois.
Si un hôte dispose de disques D:\, E:\ et F:\, et que les disques individuels sont gérés par des modèles de sauvegarde distincts, chaque disque sera géré en série. Par exemple, si la période d'exécution autorisée pour la stratégie s'étend de 01h00 (UTC) à 03h00 (UTC), et que le premier disque met trois heures à effectuer sa tâche d'instantané, les deux autres disques ne recevront pas de tâche d'instantané ce jour-là.
Une solution possible consiste à prolonger la période de validité de la règle du plan de sauvegarde afin de prolonger la durée d'exécution totale. Une autre solution consiste à inclure plusieurs applications dans un groupe de cohérence.
Les cas de non-respect d'un plan de sauvegarde peuvent être des faux positifs
Dans certains cas, un cas de non-respect d'un plan de sauvegarde est en réalité un faux positif (un résultat qui indique de manière incorrecte qu'une condition particulière est présente). Gardez à l'esprit que toutes les violations de plan de sauvegarde ne sont pas vraiment des violations, et qu'il est possible de recevoir des faux positifs, comme indiqué dans ces deux exemples:
- Vous gérez les données de copie d'une VM qui dispose d'un volume en cluster. Si la règle du plan de sauvegarde s'exécute, mais que la VM ne contrôle pas le volume, cet échec est considéré comme un cas de non-respect du plan de sauvegarde.
- Si une tâche (par exemple, Si l'ordonnanceur basé sur le plan de sauvegarde d'un élément (VM, application, etc.) est désactivé, un cas de non-respect du plan de sauvegarde peut se produire chaque fois que la stratégie du plan de sauvegarde doit être appliquée.
Ressources limitées dans l'appareil de sauvegarde/restauration
Les ressources limitées dans un appareil de sauvegarde/restauration peuvent être liées à des problèmes tels que le débit du port réseau, le nombre maximal d'initiateurs iSCSI, la capacité de débit du stockage backend ou du stockage frontend. Dans ce cas, augmenter le nombre d'emplacements ne vous aidera pas.
Taille de la fenêtre de stratégie ou durée d'exécution de la tâche
Les jobs qui s'exécutent pendant de nombreuses heures occupent des emplacements de travail qui pourraient être utilisés par d'autres applications. Si chaque application effectue sa tâche en une minute en moyenne et que vous disposez de cinq emplacements, vous pouvez exécuter 300 tâches par heure. Si chaque application prend une heure en moyenne et que vous disposez de cinq emplacements, vous pouvez exécuter cinq tâches par heure. Toutefois, si la période totale de la stratégie est de trois heures, le nombre d'applications essayant d'utiliser cette stratégie de plan de sauvegarde aura un impact énorme sur la gestion totale des données de copie d'application possible sur une période de 24 heures.
Par exemple, si vous avez 100 applications, dans le premier exemple (300 tâches par heure), l'appliance terminera toutes les applications en environ 20 minutes. Toutefois, si nous avons 100 applications dans le deuxième exemple (cinq tâches par heure), l'appliance ne gérera que 15 applications par jour. Cela entraînera 85 non-respects du plan de sauvegarde.
Bien que vous ne puissiez pas contrôler la durée d'exécution des tâches, vous pouvez examiner la durée de planification des applications en cours d'exécution. Des temps de traitement longs peuvent également se produire lors du premier travail d'instantané pour une nouvelle application. Les paramètres d'entrée peuvent être utilisés pour empêcher les tâches d'ingestion de verrouiller des emplacements et de bloquer les applications déjà ingérées.
Comment un appareil de sauvegarde/restauration surveille les cas de non-respect d'un plan de sauvegarde
Chaque appareil de sauvegarde/restauration exécute automatiquement une analyse du plan de sauvegarde toutes les heures pour identifier les cas de non-respect du plan de sauvegarde au cours de la journée pour les tâches planifiées. Cette opération en arrière-plan vous avertit des éventuelles infractions au plan de sauvegarde le plus près possible de la fin de la période de validité d'une règle de plan de sauvegarde.
Lors de l'analyse, l'appli vérifie toutes les règles de plan de sauvegarde dont les heures de travail se sont terminées au cours de la dernière heure. Chaque règle est examinée pour détecter les cas de non-respect du plan de sauvegarde. Si un plan de sauvegarde ne respecte pas une règle dans les 60 minutes suivant la fin de la période de validité de la règle, une entrée est ajoutée dans la base de données des événements pour ces cas de non-respect. Si une règle ne comporte pas de non-respect du plan de sauvegarde, aucune alerte ni aucun événement ne sera généré.
Lorsqu'une violation de plan de sauvegarde se produit dans la période de 60 minutes pendant laquelle la règle du plan de sauvegarde doit être appliquée, une alerte est déclenchée et une notification d'événement est générée. Vous pouvez recevoir des alertes de non-respect du plan de sauvegarde sous la forme d'événements du moniteur système (voir Surveiller) ou de notifications d'événements par e-mail. Chaque alerte inclut des informations sur chaque règle de plan de sauvegarde non respectée pour une application spécifique, y compris des informations telles que le message d'événement, le nom et le type de règle, l'heure et le type de non-respect, ainsi que des informations sur la tâche (tâches attendues, tolérance, réussite, échec). Les alertes de non-respect du plan de sauvegarde contiennent le même niveau de détail que les rapports de non-respect du plan de sauvegarde inclus dans les rapports de conformité du plan de sauvegarde dans le Gestionnaire de rapports.
Un journal du serveur de plate-forme (fichier journal udppm) est également créé pour indiquer quand l'analyse a été exécutée, quelles règles ont été analysées et quel a été le résultat de l'analyse.
L'analyse du plan de sauvegarde tient compte des écarts pouvant être le résultat de tâches en cours. Dans certains cas, une tâche commence dans le délai de début de la stratégie alloué, mais peut s'exécuter plus longtemps que prévu et ne pas se terminer dans la période spécifiée par la stratégie (par exemple, une tâche commence à 22h00, mais se termine à 23h30). Au départ, la tâche est considérée comme réussie et n'entraîne pas d'alerte de non-respect du plan de sauvegarde. Toutefois, une fois la tâche terminée, elle est réévaluée lors du prochain cycle d'analyse du plan de sauvegarde et peut être signalée comme non conforme au plan de sauvegarde. La réussite ou l'échec d'une règle de plan de sauvegarde dépend du moment où une tâche se termine.
Si, lors de l'analyse, l'appliance détermine qu'une ou plusieurs tâches n'ont pas été exécutées par une règle de plan de sauvegarde, une violation du plan de sauvegarde se produit et l'alerte ou l'événement généré contient les informations supplémentaires suivantes sur la tâche ayant échoué:
- Durée d'exécution de la tâche prévue
- Motif de l'échec de l'exécution de la tâche
L'appareil examine également la chronologie pour déterminer si aucune tâche n'a été exécutée, car il n'y avait pas d'emplacements disponibles pour ce type de tâche. Si tel est le cas, l'alerte ou l'événement inclut ces informations.
Si l'application comporte plusieurs règles de plan de sauvegarde dont les périodes se chevauchent et qu'une tâche est manquée pour les deux règles pendant cette période, l'appli ne génère qu'une seule alerte. Il n'enclenchera pas d'alertes en double pour les règles qui se chevauchent afin d'éviter les doublons. Les alertes de missions manquées sont agrégées par application, type de règle et période.
Surveiller les cas de non-respect des plans de sauvegarde
Vous pouvez surveiller et afficher les cas de non-respect des plans de sauvegarde dans l'onglet Surveiller ou à partir d'un appareil géré via des notifications par e-mail ou à l'aide du Gestionnaire de rapports.
Surveiller
Vous pouvez afficher les détails d'un cas de non-respect d'un plan de sauvegarde sous forme d'événement dans l'onglet Surveillance (Surveillance > Événements). Pour en savoir plus sur l'utilisation de l'onglet Surveillance, consultez Surveillance.
Gestionnaire de rapports
Une bibliothèque complète de rapports sur les cas de non-respect des plans de sauvegarde est disponible dans le gestionnaire de rapports de votre console de gestion. Ces rapports peuvent vous aider à confirmer le taux de réussite actuel et à différencier plus facilement plusieurs applications portant le même nom.
Étape suivante
- Présentation du plan de sauvegarde
- Créer un modèle de sauvegarde
- Créer une règle de sauvegarde
- Créer un profil de ressource
- Configurer les paramètres de règles avancés d'une application sauvegardée par la règle
- Appliquer un plan de sauvegarde à une application