Identifica incumplimientos del plan de copia de seguridad

Las plantillas de políticas y los perfiles de recursos se definen en la sección de planes de copia de seguridad de la consola de administración. Se aplican a las aplicaciones y las VMs en el Administrador de apps. Un incumplimiento del plan de copia de seguridad se produce cuando una tarea (o acción) no cumple con los requisitos definidos por una política en una plantilla de política.

En esta sección, se detallan las posibles causas de un incumplimiento del plan de copia de seguridad, cómo la consola de administración identifica cuándo se produce un incumplimiento del plan de copia de seguridad y los métodos que puedes usar para supervisar los incumplimientos del plan de copia de seguridad a medida que ocurren. Incluye lo siguiente:

Posibles causas de incumplimientos de la política de planes de copia de seguridad

La consola de administración aplica planes de copia de seguridad a las aplicaciones y los conjuntos de datos, en los que la administración de los datos de copia de tu aplicación en el servicio App Manager se basa en las reglas que defines en una plantilla de copia de seguridad y sus políticas asociadas. Una plantilla de copia de seguridad incluye una o más políticas que definen la fuente de los datos (instantánea o replicación) y la programación (frecuencia, retención, hora de inicio y hora de finalización) para cada fuente de datos. Un incumplimiento del plan de copias de seguridad se produce cuando la tarea (o acción) que define una política del plan de copias de seguridad no comienza según la programación de la política.

Cada dispositivo de copia de seguridad o recuperación ejecuta automáticamente un análisis del plan de copia de seguridad cada hora para ayudar a identificar los incumplimientos del plan de copia de seguridad a medida que ocurren durante el día para las tareas programadas. Esta operación en segundo plano te alerta sobre posibles incumplimientos del plan de copia de seguridad lo más cerca posible del final de la ventana de una política del plan de copia de seguridad. Consulta Cómo un dispositivo de copia de seguridad o recuperación supervisa los incumplimientos del plan de copia de seguridad.

La consola de administración permite a sus administradores crear una biblioteca de plantillas de políticas. Una de las características principales de cada política de plan de copia de seguridad es la programación que determina cuándo se ejecutará esta política.

Los incumplimientos del plan de copia de seguridad suelen deberse a problemas con la configuración del recuento de ranuras de trabajo, en la que los recuentos de ranuras determinan cuántas tareas se pueden ejecutar de forma simultánea. Sin embargo, aumentar la cantidad de ranuras de trabajo no garantiza que se detengan las violaciones del plan de copia de seguridad. En realidad, un incumplimiento del plan de copia de seguridad puede estar relacionado con cualquiera de las condiciones que se describen en las siguientes secciones.

Trabajos con errores

Los trabajos con errores son una causa común de incumplimientos del plan de copias de seguridad. Por ejemplo, si no se puede acceder a un host de Oracle, el dispositivo de copia de seguridad o recuperación no puede capturar los datos de Oracle RMAN, lo que genera un trabajo de instantánea fallido. Cuando una tarea falla, verifica tu entorno para confirmar que se pueda acceder a todas las aplicaciones y hosts.

Varias aplicaciones por host

Si un host tiene varias aplicaciones y cada una está administrada por una plantilla de política independiente (en lugar de agruparse como un grupo de coherencia), solo una aplicación puede tener una tarea de instantánea en ejecución a la vez, incluso si hay espacios libres disponibles.

Si una VM se administra como una VM y también tiene aplicaciones administradas a través del agente de copia de seguridad y DR, solo una de las aplicaciones puede tener un trabajo de captura de datos en ejecución a la vez.

Si un host tiene las unidades D:\, E:\ y F:\, y las unidades individuales se administran con plantillas de copia de seguridad independientes, cada unidad se administrará en serie. Por ejemplo, si el período de ejecución permitido para la política es de 01:00 (UTC) a 03:00 (UTC) y la primera unidad tarda tres horas en completar su trabajo de instantánea, las otras dos unidades no recibirán un trabajo de instantánea durante ese día.

Una posible solución es extender el período de la política del plan de copia de seguridad como una forma de prolongar el tiempo de ejecución total. Otra solución es incluir varias aplicaciones en un grupo de coherencia.

Los incumplimientos del plan de copia de seguridad pueden ser un falso positivo

En algunos casos, un incumplimiento del plan de copia de seguridad es, en realidad, un falso positivo (un resultado que indica de forma incorrecta que existe una condición en particular). Ten en cuenta que no todos los incumplimientos del plan de copia de seguridad son realmente incumplimientos y es posible recibir falsos positivos, como se describe en estos dos ejemplos:

  • Administras los datos de copia de una VM que tiene un volumen agrupado. Si la política del plan de copia de seguridad se está ejecutando, pero la VM no tiene control del volumen, esta falla se considera un incumplimiento del plan de copia de seguridad.
  • Si un trabajo (p.ej., VM, aplicación, etcétera) tiene desactivado el programador basado en el plan de copia de seguridad, lo que puede provocar que se produzca un incumplimiento del plan de copia de seguridad cada vez que se deba aplicar la política del plan de copia de seguridad.

Recursos limitados en el dispositivo de copia de seguridad o recuperación

Los recursos limitados en un dispositivo de copia de seguridad o recuperación pueden estar relacionados con problemas como la capacidad de procesamiento de los puertos de red, la cantidad máxima de iniciadores de iSCSI y la capacidad de procesamiento del almacenamiento de backend o frontend. Aumentar la cantidad de espacios no ayudará en este caso.

Tamaño de la ventana de la política o duración del tiempo de ejecución del trabajo

Los trabajos que se ejecutan durante muchas horas contienen ranuras de trabajo que podrían usar otras aplicaciones. Si cada aplicación completa su trabajo en un minuto promedio y tienes cinco espacios, puedes realizar 300 trabajos por hora. Si cada aplicación tarda una hora en promedio y tienes cinco espacios, puedes realizar cinco trabajos por hora. Sin embargo, si el período total de la política es de tres horas, la cantidad de aplicaciones que intenten usar esta política de plan de copia de seguridad tendrá un gran impacto en la administración total de datos de copia de aplicaciones posible en un período de 24 horas.

Por ejemplo, si hay 100 aplicaciones, en el primer ejemplo (300 trabajos por hora), el dispositivo finalizará todas las aplicaciones en aproximadamente 20 minutos. Sin embargo, si tenemos 100 aplicaciones en el segundo ejemplo (cinco trabajos por hora), el dispositivo solo administrará 15 aplicaciones por día. Esto generará 85 incumplimientos del plan de copias de seguridad.

Si bien no puedes controlar el tiempo de ejecución de los trabajos, puedes ver la duración de la programación de las aplicaciones en ejecución. Los tiempos de trabajo prolongados también pueden ocurrir durante el primer trabajo de instantánea de una aplicación nueva. La configuración de la integración se puede usar para evitar que los trabajos de transferencia bloqueen las ranuras y las aplicaciones que ya se transfirieron.

Cómo un dispositivo de copia de seguridad y recuperación supervisa los incumplimientos del plan de copia de seguridad

Cada dispositivo de copia de seguridad o recuperación ejecuta automáticamente un análisis del plan de copia de seguridad cada hora para ayudar a identificar los incumplimientos del plan de copia de seguridad a medida que ocurren durante el día para las tareas programadas. Esta operación en segundo plano te alerta sobre posibles incumplimientos del plan de copia de seguridad lo más cerca posible del final de la ventana de una política del plan de copia de seguridad.

Durante el análisis, el dispositivo busca todas las políticas del plan de copia de seguridad cuyos horario de trabajo finalizó en la última hora. Cada política se examina en busca de incumplimientos del plan de copia de seguridad y, si una política de plan de copia de seguridad tiene un incumplimiento dentro de los 60 minutos posteriores al final de la ventana de la política, se realiza una entrada en la base de datos de eventos para esos incumplimientos. Si una política no tiene un incumplimiento del plan de copia de seguridad, no se generará ninguna alerta ni evento.

Cuando se produce una infracción del plan de copias de seguridad dentro del período de finalización de la política de 60 minutos, se inicia una alerta y se genera una notificación de evento. Puedes recibir alertas de incumplimiento del plan de copia de seguridad en forma de eventos del Monitor del sistema (consulta Monitor) o notificaciones de eventos por correo electrónico. Cada alerta incluye detalles sobre cada política del plan de copia de seguridad que incumple una aplicación específica, como el mensaje del evento, el nombre y el tipo de la política, el tiempo y el tipo de incumplimiento, y la información de la tarea (tareas esperadas, tolerancia, correctas o fallidas). Las alertas de incumplimiento del plan de copia de seguridad contienen el mismo nivel de detalle que se puede ver en los informes de incumplimiento del plan de copia de seguridad incluidos como parte de los informes de cumplimiento del plan de copia de seguridad en el Administrador de informes.

También se crea un registro del servidor de la plataforma (el archivo de registro de udppm) para describir cuándo se ejecutó el análisis, qué políticas se analizaron y cuál fue el resultado del análisis.

El análisis del plan de copia de seguridad tiene en cuenta las discrepancias que podrían ser el resultado de trabajos en curso. En ciertas circunstancias, un trabajo comienza dentro de la hora de inicio de la política asignada, pero puede ejecutarse más tiempo del previsto y no completarse dentro del período especificado por la política (por ejemplo, un trabajo comienza a las 10:00 p.m., pero finaliza a las 11:30 p.m.). En principio, la tarea se considera exitosa y no genera una alerta de incumplimiento del plan de copia de seguridad. Sin embargo, una vez que se completa la tarea, se vuelve a evaluar como parte del siguiente ciclo de análisis del plan de copia de seguridad y, posiblemente, se marque como una infracción del plan de copia de seguridad. El éxito o el error de una política de plan de copia de seguridad depende de cuándo se completa una tarea.

Si, durante el análisis, el dispositivo determina que una política de plan de copia de seguridad no pudo ejecutar una o más tareas, se produce una infracción del plan de copia de seguridad y la alerta o el evento generado contiene la siguiente información adicional sobre la tarea que falló:

  • El tiempo de ejecución del trabajo esperado
  • El motivo por el que no se pudo ejecutar el trabajo

El dispositivo también examina el cronograma para determinar si no se ejecutaron trabajos porque no había espacios disponibles para ese tipo de trabajo. Si este fue el motivo, la alerta o el evento incluirán esta información.

Si la aplicación tiene varias políticas de planes de copia de seguridad que tienen períodos superpuestos y se pierde un trabajo para ambas políticas durante este período superpuesto, el dispositivo solo generará una sola alerta. No iniciará alertas duplicadas para las políticas superpuestas para eliminar la duplicación. Las alertas de trabajos perdidos se agregan por aplicación, tipo de política y período.

Supervisa los incumplimientos del plan de copia de seguridad

Puedes supervisar y ver los incumplimientos del plan de copia de seguridad desde la pestaña Supervisar o desde un dispositivo administrado a través de notificaciones por correo electrónico o con el Administrador de informes.

Supervisar

Puedes ver los detalles de un incumplimiento del plan de copia de seguridad como un evento en la pestaña Supervisar (Supervisar > Eventos). Para obtener detalles sobre el uso de la pestaña Supervisar, consulta Supervisa.

Administrador de informes

Hay una biblioteca completa de informes de incumplimientos del plan de copia de seguridad disponible en el Administrador de informes de tu consola de administración. Estos informes pueden ayudarte a simplificar la forma en que confirmas el porcentaje de éxito actual y a diferenciar entre varias aplicaciones con el mismo nombre.

¿Qué sigue?