识别备份方案违规情况

政策模板和资源配置文件在管理控制台的“备份方案”部分中定义。这些规则会应用于 App Manager 中的应用和虚拟机。如果作业(或操作)不满足政策模板中政策定义的要求,就会发生备份计划违规。

本部分详细介绍了备份方案违规的潜在原因、管理控制台如何识别备份方案违规情况,以及您可以使用哪些方法在出现备份方案违规情况时进行监控。其中包括:

导致备份方案政策违规的可能原因

管理控制台会将备份计划应用于应用和数据集,其中 App Manager 服务中应用副本数据的管理会根据您在备份模板中定义的规则及其关联的政策进行。备份模板包含一个或多个政策,用于定义数据源(快照或复制)以及每个数据源的时间表(频率、保留时间、开始时间、结束时间)。如果备份方案政策定义的作业(或操作)未按政策的时间表开始,则会发生备份方案违规问题。

每个备份/恢复设备每小时自动运行一次备份方案分析,以帮助在一天内排定作业发生备份方案违规行为时进行识别。此后台操作会在备份方案政策期限结束前尽可能提前提醒您可能存在备份方案违规行为,详情请参阅备份/恢复设备如何监控备份方案违规行为

管理控制台允许其管理员创建政策模板库。每个备份方案政策的主要特征之一是时间表,它决定了此政策的运行时间。

备份方案违规问题通常被视为源自作业槽数设置问题;槽数决定了可以同时运行的作业数量。不过,增加作业槽数量并不能保证备份方案违规问题会停止。实际上,备份方案违规可能与以下各部分中所述的任一情况有关。

失败的作业数

作业失败是导致备份方案违规的常见原因。例如,如果无法访问 Oracle 主机,则备份/恢复设备无法从 Oracle RMAN 捕获数据,这会导致快照作业失败。作业失败时,请检查您的环境,确认所有应用和主机均可访问。

每个主机多个应用

如果主机有多个应用,并且每个应用由单独的政策模板管理(而不是作为一致性组进行分组),则一次只能有一个应用运行快照作业,即使有空闲的槽位也是如此。

如果虚拟机作为虚拟机进行管理,并且还有通过备份和灾难恢复代理管理的应用,则一次只能有一个应用运行数据捕获作业。

如果主机有 D:\、E:\ 和 F:\ 驱动器,并且各个驱动器由单独的备份模板管理,则系统会按顺序管理每个驱动器。例如,如果该政策的允许运行时间范围为 01:00(世界协调时间 [UTC])到 03:00(世界协调时间 [UTC]),并且第一个驱动器需要 3 小时才能完成其快照作业,那么当天其他两个驱动器将不会收到快照作业。

一种可能的解决方案是延长备份计划政策期限,以延长总运行时间。另一种解决方案是在一个一致性组中包含多个应用。

备份方案违规情况可能是误报

在某些情况下,备份方案违规实际上是假正例(结果错误地指明存在特定情况)。请注意,并非所有备份方案违规问题都是真正的违规问题,您可能会收到假正例,如以下两个示例所述:

  • 您正在管理具有集群卷的虚拟机的副本数据。如果备份计划政策正在运行,但虚拟机无法控制卷,则此失败会被视为违反备份计划。
  • 如果某个作业(例如虚拟机、应用等)的备份方案驱动型调度程序处于关闭状态,这可能会导致每次应应用备份方案政策时都发生备份方案违规问题。

备份/恢复设备中的受限资源

备份/恢复设备中的资源受限可能与网络端口吞吐量、iSCSI 发起程序的数量上限、后端存储空间或前端存储空间的吞吐量等问题相关。在这种情况下,增加槽数没有帮助。

政策窗口的大小或作业运行时间

运行数小时的作业会占用其他应用可以使用的作业槽。如果每个应用平均需要 1 分钟来完成作业,并且您有 5 个槽位,那么每小时可以处理 300 个作业;如果每个应用平均需要 1 小时来完成作业,并且您有 5 个槽位,那么每小时可以处理 5 个作业。但是,如果该政策的总时长为 3 小时,那么尝试使用此备份方案政策的应用数量将对 24 小时内可管理的总应用副本数据量产生巨大影响。

例如,如果有 100 个应用,那么在第一个示例(每小时 300 个作业)中,该设备将在大约 20 分钟内完成所有应用。不过,如果第二个示例中有 100 个应用(每小时 5 个作业),则该设备每天只会管理 15 个应用。这会导致 85 项备份方案违规。

虽然您无法控制作业运行时间,但可以查看正在运行的应用的预定运行时长。新应用的首次快照作业期间也可能会出现作业时间过长的情况。引导设置可用于防止注入作业锁定插槽并锁定已注入的应用。

备份/恢复设备如何监控备份方案违规情况

每个备份/恢复设备每小时自动运行一次备份方案分析,以帮助在一天内排定作业发生备份方案违规行为时进行识别。此后台操作会在备份方案政策期限结束前尽可能提前提醒您可能违反了备份方案政策。

在分析期间,设备会检查过去一小时内工作时间已结束的所有备份方案政策。系统会检查每个政策是否存在备份方案违规行为,如果备份方案政策在政策期限结束后的 60 分钟内存在备份方案违规行为,系统会在事件数据库中为这些违规行为创建条目。如果政策没有违反备份方案,系统将不会生成任何提醒或事件。

如果在 60 分钟的备份方案政策完成期限内发生备份方案违规问题,系统会发起提醒并生成事件通知。您可以通过系统监视器事件(请参阅监视器)或电子邮件事件通知的形式接收备份计划违规提醒。每条提醒都包含与特定应用违反的每个备份方案政策相关的详细信息,包括事件消息、政策名称和类型、违规时间和类型,以及作业信息(预期作业数、容差、成功、失败)。备份方案违规提醒包含的详细信息与报告管理器中备份方案合规性报告中包含的备份方案违规报告的详细信息相同。

系统还会创建一个平台服务器日志(udppm 日志文件),以概述分析的运行时间、分析了哪些政策以及分析结果。

备份方案分析会考虑可能由正在执行的作业导致的差异。在某些情况下,作业可能会在分配的政策开始时间内开始,但运行时间可能会超出预期,并未在指定的政策时间范围内完成(例如,作业在晚上 10:00 开始,但在晚上 11:30 结束)。最初,作业会被视为成功,并且不会导致备份方案违规提醒。不过,在作业完成后,系统会在下一个备份方案分析周期内对其进行重新评估,并可能将其标记为违反备份方案。备份计划政策的成功或失败取决于作业的实际完成时间。

如果在分析期间,设备确定备份方案政策未能运行一个或多个作业,则会发生备份方案违规问题,并且生成的提醒或事件会包含有关失败作业的以下其他信息:

  • 预期的作业运行时间
  • 作业运行失败的原因

该设备还会检查时间轴,以确定是否因没有适用于该作业类型的可用槽而未运行任何作业。如果是这种原因,提醒或事件中会包含此信息。

如果应用有多个备份方案政策,且这些政策的时段有重叠,并且在这段时间内这两个政策都错过了作业,则设备只会生成一条提醒。它不会针对重叠的政策发出重复提醒,以免出现重复。系统会按应用、政策类型和时间范围汇总错过的作业提醒。

监控备份方案违规情况

您可以通过 Monitor(监控)标签页监控和查看备份方案违规情况,也可以通过电子邮件通知或使用 Report Manager(报告管理器)从托管设备监控和查看备份方案违规情况。

监控

您可以通过监控标签页(监控 > 事件)查看违反备份计划的详细信息。如需详细了解如何使用监控标签页,请参阅监控

报告管理器

您可以在管理控制台的报告管理器中找到完整的备份方案违规报告库。这些报告有助于简化您确认当前成功率的方式,并让您更轻松地区分多个同名应用。

后续步骤