Identificare le violazioni del piano di backup

I modelli di criteri e i profili delle risorse sono definiti nella sezione dei piani di backup della console di gestione. Vengono applicati ad applicazioni e VM in App Manager. Una violazione del piano di backup si verifica quando un job (o un'azione) nonsoddisfa i requisiti definiti da un criterio in un modello di criteri.

Questa sezione descrive in dettaglio le potenziali cause di una violazione del piano di backup, come la console di gestione identifica quando si verifica una violazione del piano di backup e i metodi che puoi utilizzare per monitorare le violazioni del piano di backup man mano che si verificano. tra cui:

Possibili cause di violazioni delle norme relative ai piani di backup

La console di gestione applica i piani di backup ad applicazioni e set di dati, dove la gestione della copia dei dati dell'applicazione nel servizio App Manager si basa sulle regole che definisci in un modello di backup e nei relativi criteri associati. Un modello di backup include uno o più criteri che definiscono l'origine dei dati (snapshot o replica) e la pianificazione (frequenza, conservazione, ora di inizio, ora di fine) per ogni origine dati. Una violazione del piano di backup si verifica quando il job (o l'azione) definito da un criterio del piano di backup non inizia in base alla pianificazione del criterio.

Ogni appliance di backup/recupero esegue automaticamente un'analisi del piano di backup ogni ora per contribuire a identificare le violazioni del piano di backup man mano che si verificano durante la giornata per i job pianificati. Questa operazione in background ti avvisa di possibili violazioni del piano di backup il più vicino possibile alla fine del periodo di validità di un criterio del piano di backup. Consulta In che modo un'appliance di backup/recupero monitora le violazioni del piano di backup.

La console di gestione consente agli amministratori di creare una raccolta di modelli di criteri. Una delle caratteristiche principali di ogni criterio del piano di backup è la pianificazione che determina quando verrà eseguito.

Le violazioni del piano di backup sono spesso considerate originate da problemi con le impostazioni del numero di slot dei job, in cui il numero di slot determina il numero di job che possono essere eseguiti contemporaneamente. Tuttavia, l'aumento del numero di slot dei job non garantisce che le violazioni del piano di backup vengano interrotte. In realtà, una violazione del piano di backup può essere correlata a una delle condizioni descritte nelle sezioni seguenti.

Job non riusciti

I job non riusciti sono una causa comune delle violazioni del piano di backup. Ad esempio, se un host Oracle non è accessibile, l'appliance di backup/recupero non può acquisire i dati da Oracle RMAN, il che comporta un job di snapshot non riuscito. Quando un job non va a buon fine, controlla l'ambiente per verificare che tutte le applicazioni e gli host siano accessibili.

Più applicazioni per host

Se un host ha più applicazioni e ogni applicazione è gestita da un modello di criteri separato (anziché raggruppata come gruppo di coerenza), solo un'applicazione può avere un job di snapshot in esecuzione alla volta, anche se sono disponibili slot liberi.

Se una VM è gestita come VM e ha anche applicazioni gestite tramite l'agente di backup e RE, solo una delle applicazioni può avere un job di acquisizione dei dati in esecuzione alla volta.

Se un host ha le unità D:\, E:\ e F:\ e le singole unità sono gestite da modelli di backup separati, ogni unità verrà gestita in serie. Ad esempio, se il periodo di esecuzione consentito per il criterio è dalle 01:00 (UTC) alle 03:00 (UTC) e il primo disco impiega tre ore per completare il job di snapshot, gli altri due dischi non riceveranno un job di snapshot durante la giornata.

Una possibile soluzione è estendere la finestra del criterio del piano di backup per prolungare il tempo di esecuzione totale. Un'altra soluzione è includere più applicazioni in un gruppo con coerenza.

Le violazioni del piano di backup possono essere un falso positivo

In alcuni casi, una violazione del piano di backup è in realtà un falso positivo (un risultato che indica erroneamente la presenza di una determinata condizione). Tieni presente che non tutte le violazioni del piano di backup sono effettivamente violazioni ed è possibile ricevere falsi positivi, come illustrato in questi due esempi:

  • Stai gestendo i dati di copia di una VM con un volume clusterizzato. Se il criterio del piano di backup è in esecuzione, ma la VM non ha il controllo del volume, questo errore è considerato una violazione del piano di backup.
  • Se un job (ad es. VM, applicazione e così via) è disattivato, ogni volta che viene applicato il criterio del piano di backup può verificarsi una violazione del piano di backup.

Risorse vincolate nell'appliance di backup/ripristino

Le risorse limitate in un'appliance di backup/recupero possono essere correlate a problemi come la velocità effettiva della porta di rete, il numero massimo di iniziatori iSCSI, la capacità di throughput dello spazio di archiviazione di backend o di frontend. In questo caso, aumentare il numero di slot non risolverà il problema.

Dimensioni della finestra del criterio o durata del tempo di esecuzione del job

I job che vengono eseguiti per molte ore occupano slot che potrebbero essere utilizzati da altre applicazioni. Se ogni applicazione completa il proprio job in un minuto mediamente e hai cinque slot, puoi eseguire 300 job all'ora. Se ogni applicazione richiede in media un'ora e hai cinque slot, puoi eseguire cinque job all'ora. Tuttavia, se la finestra totale per il criterio è di tre ore, il numero di applicazioni che tentano di utilizzare questo criterio del piano di backup avrà un impatto enorme sulla gestione totale dei dati delle copie delle applicazioni possibili in un periodo di 24 ore.

Ad esempio, se ci sono 100 applicazioni, nel primo esempio (300 job all'ora) l'appliance completerà tutte le applicazioni in circa 20 minuti. Tuttavia, se abbiamo 100 applicazioni nel secondo esempio (cinque job all'ora), l'appliance gestirà solo 15 applicazioni al giorno. Ciò comporterà 85 violazioni del piano di backup.

Anche se non puoi controllare il tempo di esecuzione del job, puoi esaminare la durata della programmazione delle applicazioni in esecuzione. Tempi di esecuzione lunghi possono verificarsi anche durante il primo job di snapshot per una nuova applicazione. Le impostazioni di integrazione possono essere utilizzate per impedire ai job di importazione di bloccare gli slot e di bloccare le applicazioni già importate.

In che modo un'appliance di backup/ripristino monitora le violazioni del piano di backup

Ogni appliance di backup/recupero esegue automaticamente un'analisi del piano di backup ogni ora per contribuire a identificare le violazioni del piano di backup man mano che si verificano durante la giornata per i job pianificati. Questa operazione in background ti avvisa di possibili violazioni del piano di backup il più vicino possibile alla fine della finestra di un criterio del piano di backup.

Durante l'analisi, l'appliance controlla tutti i criteri del piano di backup whose working hours have ended within the past hour. Per ogni criterio viene esaminata la presenza di violazioni del piano di backup e, se un criterio del piano di backup presenta una violazione entro 60 minuti dalla fine della finestra del criterio, viene inserita una voce nel database degli eventi per queste violazioni. Se un criterio non presenta violazioni del piano di backup, non verrà generato alcun avviso o evento.

Quando si verifica una violazione del piano di backup entro il periodo di completamento del criterio del piano di backup di 60 minuti, viene attivato un avviso e viene generata una notifica di evento. Puoi ricevere avvisi di violazione del piano di backup sotto forma di eventi di System Monitor (vedi Monitor) o notifiche via email degli eventi. Ogni avviso include dettagli su ogni criterio del piano di backup in violazione per un'applicazione specifica, tra cui informazioni quali il messaggio dell'evento, il nome e il tipo di criterio, l'ora e il tipo di violazione e le informazioni sui job (job previsti, tolleranza, riuscito, non riuscito). Gli avvisi di violazione del piano di backup contengono lo stesso livello di dettaglio visibile nei report sulle violazioni del piano di backup inclusi nei report sulla conformità del piano di backup in Report Manager.

Viene anche creato un log del server della piattaforma (il file di log udppm) per indicare quando è stata eseguita l'analisi, quali criteri sono stati analizzati e qual è stato il risultato dell'analisi.

L'analisi del piano di backup prende in considerazione le discrepanze che potrebbero essere il risultato di job in esecuzione. In determinate circostanze, un job inizia entro l'ora di inizio prevista dalle norme, ma potrebbe durare più del previsto e non riuscire a completarsi entro la finestra temporale specificata dalle norme (ad esempio, un job inizia alle 22:00, ma termina alle 23:30). Inizialmente, il job viene considerato riuscito e non genera un avviso di violazione del piano di backup. Tuttavia, al termine del job, viene rivalutato nell'ambito del successivo ciclo di analisi del piano di backup ed eventualmente segnalato come violazione del piano di backup. Il successo o l'errore di un criterio del piano di backup dipende dal momento in cui un job viene completato.

Se durante l'analisi l'appliance determina che non è stato possibile eseguire uno o più job per una policy del piano di backup, si verifica una violazione del piano di backup e l'avviso o l'evento generato contiene le seguenti informazioni aggiuntive relative al job non riuscito:

  • La durata prevista dell'esecuzione del job
  • Il motivo per cui l'esecuzione del job non è riuscita

L'appliance esamina anche la sequenza temporale per determinare se non sono stati eseguiti job perché non erano disponibili slot per quel tipo di job. Se questo è stato il motivo, l'avviso o l'evento include queste informazioni.

Se l'applicazione ha più criteri del piano di backup con finestre dei criteri sovrapposte e un job è stato perso per entrambi i criteri durante questo periodo di sovrapposizione, l'appliance genererà un solo avviso. Non avvia avvisi duplicati per criteri in sovrapposizione per eliminare le duplicazioni. Gli avvisi relativi ai job mancanti vengono aggregati per applicazione, tipo di criterio e finestra temporale.

Monitorare le violazioni del piano di backup

Puoi monitorare e visualizzare le violazioni del piano di backup dalla scheda Monitora o da un'appliance gestita tramite notifiche via email o utilizzando Report Manager.

Monitoraggio

Puoi visualizzare i dettagli di una violazione del piano di backup come evento dalla scheda Monitor (Monitor > Eventi). Per informazioni dettagliate sull'utilizzo della scheda Monitor, consulta Monitor.

Report Manager

In Report Manager per la console di gestione è disponibile una libreria completa di report sulle violazioni del piano di backup. Questi report possono aiutarti a semplificare la conferma del tasso di successo corrente e a distinguere più facilmente più applicazioni con lo stesso nome.

Passaggi successivi