Verstöße gegen Sicherungspläne erkennen

Richtlinienvorlagen und Ressourcenprofile werden im Bereich „Sicherungspläne“ der Verwaltungskonsole definiert. Sie werden im App Manager auf Anwendungen und VMs angewendet. Ein Verstoß gegen einen Sicherungsplan tritt auf, wenn ein Job (oder eine Aktion) die Anforderungen einer Richtlinie in einer Richtlinienvorlage nicht erfüllt.

In diesem Abschnitt werden die möglichen Ursachen für einen Verstoß gegen einen Sicherungsplan beschrieben. Außerdem erfahren Sie, wie in der Verwaltungskonsole erkannt wird, dass ein Verstoß gegen einen Sicherungsplan vorliegt, und welche Methoden Sie verwenden können, um Verstöße gegen Sicherungspläne zu überwachen. Dazu gehören:

Mögliche Ursachen für Verstöße gegen die Richtlinien für Sicherungspläne

In der Verwaltungskonsole werden Sicherungspläne auf Anwendungen und Datensätze angewendet. Dabei erfolgt die Verwaltung der Datenkopien Ihrer Anwendung im App-Manager gemäß den Regeln, die Sie in einer Sicherungsvorlage und den zugehörigen Richtlinien definieren. Eine Sicherungsvorlage enthält eine oder mehrere Richtlinien, mit denen die Datenquelle (Snapshot oder Replikation) und der Zeitplan (Häufigkeit, Aufbewahrung, Startzeit, Endzeit) für jede Datenquelle definiert werden. Ein Verstoß gegen einen Sicherungsplan tritt auf, wenn der Job (oder die Aktion), der bzw. die in einer Sicherungsrichtlinie definiert ist, nicht gemäß dem Zeitplan der Richtlinie beginnt.

Auf jeder Sicherungs-/Wiederherstellungs-Appliance wird jede Stunde automatisch eine Sicherungsplananalyse ausgeführt, um Verstöße gegen den Sicherungsplan zu erkennen, die im Laufe des Tages bei geplanten Jobs auftreten. Bei diesem Hintergrundvorgang werden Sie so nah wie möglich am Ende des Zeitfensters einer Sicherungsplanrichtlinie über mögliche Verstöße informiert. Weitere Informationen finden Sie unter So überwacht eine Sicherungs-/Wiederherstellungs-Appliance Verstöße gegen Sicherungspläne.

Über die Verwaltungskonsole können Administratoren eine Bibliothek mit Richtlinienvorlagen erstellen. Eine der wichtigsten Eigenschaften jeder Sicherungsrichtlinie ist der Zeitplan, der festlegt, wann diese Richtlinie ausgeführt wird.

Verstöße gegen Sicherungspläne werden häufig auf Probleme mit den Einstellungen für die Anzahl der Job-Slots zurückgeführt. Die Slotanzahl bestimmt, wie viele Jobs gleichzeitig ausgeführt werden können. Das Erhöhen der Anzahl der Job-Slots ist jedoch keine Garantie dafür, dass Verstöße gegen den Sicherungsplan nicht mehr auftreten. Ein Verstoß gegen den Sicherungsplan kann sich auf eine der in den folgenden Abschnitten beschriebenen Bedingungen beziehen.

Fehlerhafte Jobs

Fehlgeschlagene Jobs sind eine häufige Ursache für Verstöße gegen Sicherungspläne. Wenn beispielsweise kein Zugriff auf einen Oracle-Host möglich ist, kann die Sicherungs-/Wiederherstellungs-Appliance die Daten nicht aus Oracle RMAN erfassen. Dies führt zu einem fehlgeschlagenen Snapshot-Job. Wenn ein Job fehlschlägt, prüfen Sie Ihre Umgebung, um sicherzustellen, dass alle Anwendungen und Hosts erreichbar sind.

Mehrere Anwendungen pro Host

Wenn ein Host mehrere Anwendungen hat und jede Anwendung über eine separate Richtlinienvorlage verwaltet wird (anstatt als Consistency-Gruppe zusammengefasst zu werden), kann für jede Anwendung jeweils nur ein Snapshot-Job ausgeführt werden, auch wenn freie Slots verfügbar sind.

Wenn eine VM als VM verwaltet wird und auch Anwendungen über den Sicherungs- und Notfallwiederherstellungs-Agenten verwaltet werden, kann nur für eine der Anwendungen jeweils ein Datenerfassungsauftrag ausgeführt werden.

Wenn ein Host die Laufwerke D:\, E:\ und F:\ hat und die einzelnen Laufwerke über separate Sicherungsvorlagen verwaltet werden, werden die einzelnen Laufwerke nacheinander verwaltet. Wenn das zulässige Ausführungsfenster für die Richtlinie beispielsweise von 01:00 Uhr (UTC) bis 03:00 Uhr (UTC) liegt und der erste Laufwerk-Snapshot drei Stunden dauert, erhalten die anderen beiden Laufwerke an diesem Tag keinen Snapshot-Job.

Eine mögliche Lösung besteht darin, das Richtlinienfenster für den Sicherungsplan zu verlängern, um die Gesamtlaufzeit zu verlängern. Eine weitere Lösung besteht darin, mehrere Anwendungen in einer Konsistenzgruppe zu verwenden.

Verstöße gegen Sicherungspläne können ein falsch positives Ergebnis sein

In einigen Fällen ist ein Verstoß gegen den Sicherungsplan in Wirklichkeit ein falsch-positives Ergebnis, d. h. ein Ergebnis, das fälschlicherweise angibt, dass eine bestimmte Bedingung erfüllt ist. Beachten Sie, dass nicht jeder Verstoß gegen den Sicherungsplan tatsächlich ein Verstoß ist. Es kann auch zu falsch positiven Ergebnissen kommen, wie in diesen beiden Beispielen beschrieben:

  • Sie verwalten die Kopien von Daten einer VM mit einem clusterbasierten Volume. Wenn die Richtlinie für den Sicherungsplan ausgeführt wird, die VM aber keine Kontrolle über das Volume hat, wird dieser Fehler als Verstoß gegen den Sicherungsplan betrachtet.
  • Wenn in einer Stellenausschreibung (z.B. VM, Anwendung usw.) der sicherungsplangesteuerte Scheduler deaktiviert ist, kann dies zu einem Sicherungsplanverstoß führen, sobald die Sicherungsplanrichtlinie angewendet werden soll.

Eingeschränkten Ressourcen auf der Sicherungs-/Wiederherstellungs-Appliance

Eingeschränkte Ressourcen in einer Sicherungs-/Wiederherstellungs-Appliance können mit Problemen wie dem Netzwerkportdurchsatz, der maximalen Anzahl von iSCSI-Initiatoren oder der Durchsatzkapazität des Back-End-Speichers oder des Front-End-Speichers zusammenhängen. Eine Erhöhung der Slotanzahl hilft in diesem Fall nicht weiter.

Größe des Richtlinienfensters oder Dauer der Jobausführung

Jobs, die viele Stunden laufen, belegen Job-Slots, die von anderen Anwendungen verwendet werden könnten. Wenn jede Anwendung ihren Job durchschnittlich in einer Minute abschließt und Sie fünf Slots haben, sind 300 Jobs pro Stunde möglich. Wenn jede Anwendung durchschnittlich eine Stunde dauert und Sie fünf Slots haben, sind fünf Jobs pro Stunde möglich. Wenn das Zeitfenster für die Richtlinie jedoch drei Stunden beträgt, hat die Anzahl der Anwendungen, die diese Richtlinie für den Sicherungsplan verwenden möchten, einen großen Einfluss auf die Gesamtverwaltung der Datenkopien der Anwendung innerhalb eines Zeitraums von 24 Stunden.

Wenn es beispielsweise 100 Anwendungen gibt, werden im ersten Beispiel (300 Jobs pro Stunde) alle Anwendungen in etwa 20 Minuten abgeschlossen. Wenn wir im zweiten Beispiel jedoch 100 Anwendungen haben (fünf Jobs pro Stunde), verwaltet das Gerät nur 15 Anwendungen pro Tag. Dies führt zu 85 Verstößen gegen den Sicherungsplan.

Sie können die Ausführungszeit von Jobs zwar nicht steuern, aber die Dauer, für die die laufenden Anwendungen geplant sind. Lange Jobzeiten können auch beim ersten Snapshot-Job für eine neue Anwendung auftreten. Mit On-Ramp-Einstellungen können Sie verhindern, dass Aufnahmejobs Slots sperren und bereits aufgenommene Anwendungen ausschließen.

So überwacht eine Sicherungs-/Wiederherstellungs-Appliance Verstöße gegen Sicherungspläne

Auf jeder Sicherungs-/Wiederherstellungs-Appliance wird jede Stunde automatisch eine Sicherungsplananalyse ausgeführt, um Verstöße gegen den Sicherungsplan zu erkennen, die im Laufe des Tages bei geplanten Jobs auftreten. Bei diesem Hintergrundvorgang werden Sie so nah wie möglich am Ende des Zeitfensters für die Richtlinien für Sicherungspläne über mögliche Verstöße informiert.

Bei der Analyse sucht die Appliance nach allen Sicherungsplanrichtlinien, deren Arbeitszeit innerhalb der letzten Stunde abgelaufen ist. Jede Richtlinie wird auf Verstöße gegen Sicherungspläne geprüft. Wenn innerhalb von 60 Minuten nach Ablauf des Richtlinienzeitraums ein Verstoß gegen eine Sicherungsrichtlinie vorliegt, wird in der Ereignisdatenbank ein Eintrag für diese Verstöße erstellt. Wenn für eine Richtlinie kein Verstoß gegen den Sicherungsplan vorliegt, wird keine Benachrichtigung oder kein Ereignis generiert.

Wenn innerhalb des 60-minütigen Zeitfensters für die Einhaltung der Sicherungsrichtlinie ein Verstoß gegen die Sicherungsrichtlinie auftritt, wird eine Benachrichtigung ausgelöst und eine Ereignisbenachrichtigung generiert. Sie können Benachrichtigungen zu Verstößen gegen den Sicherungsplan in Form von Systemmonitor-Ereignissen (siehe Monitor) oder E-Mail-Ereignisbenachrichtigungen erhalten. Jede Benachrichtigung enthält Details zu den einzelnen Backup-Planrichtlinien, die für eine bestimmte Anwendung verstoßen haben. Dazu gehören Informationen wie die Ereignismeldung, der Richtlinienname und -typ, die Uhrzeit und der Typ des Verstoßes sowie Jobinformationen (erwartete Jobs, Toleranz, erfolgreich, fehlgeschlagen). Benachrichtigungen zu Verstößen gegen Sicherungspläne enthalten dieselben Details wie Berichte zu Verstößen gegen Sicherungspläne, die im Berichtsmanager als Teil der Berichte zur Einhaltung von Sicherungsplänen enthalten sind.

Außerdem wird ein Plattformserverprotokoll (die udppm-Protokolldatei) erstellt, aus dem hervorgeht, wann die Analyse ausgeführt wurde, welche Richtlinien analysiert wurden und welches Ergebnis sie hatte.

Bei der Analyse des Sicherungsplans werden Abweichungen berücksichtigt, die auf laufende Jobs zurückzuführen sein können. Unter bestimmten Umständen beginnt ein Job innerhalb der festgelegten Startzeit der Richtlinie, dauert aber länger als erwartet und kann nicht innerhalb des angegebenen Zeitfensters der Richtlinie abgeschlossen werden. Ein Beispiel: Ein Job beginnt um 22:00 Uhr, endet aber erst um 23:30 Uhr. Der Job wird anfänglich als erfolgreich betrachtet und führt nicht zu einer Benachrichtigung über einen Verstoß gegen den Sicherungsplan. Nach Abschluss des Jobs wird er jedoch im Rahmen des nächsten Analysezyklus für Sicherungspläne noch einmal bewertet und möglicherweise als Verstoß gegen den Sicherungsplan gekennzeichnet. Ob eine Richtlinie für einen Sicherungsplan erfolgreich ist oder nicht, hängt davon ab, wann ein Job tatsächlich abgeschlossen wird.

Wenn die Appliance während der Analyse feststellt, dass bei einer Sicherungsrichtlinie mindestens ein Job nicht ausgeführt wurde, liegt ein Verstoß gegen die Sicherungsrichtlinie vor. Die generierte Benachrichtigung oder das generierte Ereignis enthält die folgenden zusätzlichen Informationen zum fehlgeschlagenen Job:

  • Die voraussichtliche Laufzeit des Jobs
  • Der Grund, warum der Job nicht ausgeführt werden konnte

Außerdem wird anhand des Zeitplans ermittelt, ob keine Jobs ausgeführt wurden, weil keine Slots für diesen Jobtyp verfügbar waren. Wenn dies der Grund war, enthält die Benachrichtigung oder das Ereignis diese Informationen.

Wenn die Anwendung mehrere Sicherungsrichtlinien mit sich überschneidenden Richtlinienfenstern hat und während dieser Zeit ein Job für beide Richtlinien verpasst wurde, generiert die Appliance nur eine einzige Benachrichtigung. Es werden keine doppelten Benachrichtigungen für sich überschneidende Richtlinien erstellt, um Duplikate zu vermeiden. Verpasste Benachrichtigungen zu Jobs werden nach Anwendung, Richtlinientyp und Zeitfenster zusammengefasst.

Verstöße gegen Sicherungspläne überwachen

Sie können Verstöße gegen den Sicherungsplan auf dem Tab Überwachen oder über eine verwaltete Appliance per E-Mail-Benachrichtigung oder über den Berichtsmanager überwachen und ansehen.

Überwachen

Sie können die Details eines Verstoßes gegen einen Sicherungsplan als Ereignis auf dem Tab Überwachen (Überwachen > Ereignisse) aufrufen. Weitere Informationen zur Verwendung des Tabs Monitoring finden Sie unter Monitoring.

Berichtsmanager

Im Berichtsmanager Ihrer Verwaltungskonsole finden Sie eine vollständige Bibliothek mit Berichten zu Verstößen gegen Sicherungspläne. Mit diesen Berichten können Sie die aktuelle Erfolgsquote einfacher bestätigen und zwischen mehreren Anwendungen mit demselben Namen unterscheiden.

Nächste Schritte