在管理控制台中监控作业

监控标签页中,您可以查看和管理由管理控制台管理的备份/恢复设备中的作业(取消正在运行的作业或更改队列作业的作业优先级)。您还可以查看事件,即设备发出的信息、警告或错误通知。

您可以按名称、状态、开始时间或结束时间、类型、主机和应用过滤作业。

作业状态面板

管理控制台的作业面板会提供有关过去 24 小时内运行的作业的信息(默认)。

  • 当前或过往工作。快速查看正在运行、已成功、已失败、已重试或已取消的作业数量。
  • 作业类型或设备。指向过滤后的监视器的链接,用于按作业类型或受管理的备份/恢复设备显示过去 24 小时内作业的状态。

如有需要,您还可以在“过往作业”部分查看上周或上个月的状态。此面板每两分钟提取一次新数据。

监控作业

请按照以下说明监控作业:

  1. 点击监控标签页,然后从下拉菜单中选择作业以打开作业页面,您可以在其中查看所有正在运行的作业的列表。选择正在运行过滤条件,以显示正在监控的所有作业。
  2. 如需修改表格中字段的显示方式,您可以执行以下操作:

    • 按关键字搜索。现在,系统会自动提交按 Jobs 视图中的作业名称、主机和应用过滤或按 Events 视图中的事件消息过滤的报告。当您输入查询时,系统会更新结果集。按关键字搜索不区分大小写。
    • 已开始、已结束和已加入队列。这些过滤条件采用单选按钮,可用于选择跨越一天、一周或一个月的日期范围。
    • 调整字段。您可以使用工具栏右上角的选项将列设为可见或隐藏,以及设置要显示的行数。
    • 调整列宽。如需调整表格列的宽度以在表格中显示更多内容,请向左或向右拖动列标题中的列分隔线,以调整列宽度。列分隔符由一对细灰线标记。
    • 自动刷新。监控网格视图中每 15 秒更新一次。
    • 监控页面会显示上次刷新的时间和下次刷新的时间。您可以随时手动刷新。
  3. 如需将作业列表导出为 PDF 文件,请点击导出图标。

  4. 如需修改表格页中显示的行数,您可以从表格底部的下拉列表中进行选择。选项包括:每张表格页面显示 10、25、50、100 或 500 行。

  5. 如需过滤作业列表以仅查看部分作业,请点击打开过滤条件以打开过滤条件面板。选择过滤条件,然后点击更新过滤条件

  6. 如需查看特定作业的详细信息,请在作业列表中选择相应项,然后执行以下操作之一:

    • 状态列中,点击关联作业的状态链接。
    • 点击页面右下角的查看详情
  7. 作业详情页面随即打开。在此页面上,您可以查看以下内容:

    • 作业的详细信息
    • 卷信息
    • 作业重试次数
    • 作业统计信息

    如需详细了解这些方面,请参阅查看作业详细信息

  8. 查看完作业详情后,点击返回“作业”以返回作业页面。

作业状态

作业随时都可能处于下列列表中所述的某种状态:

  • 已取消。作业已被用户取消,或因目标群体超出安全上限而被系统自动取消。
  • 失败。作业未能在备份方案期限内运行完毕。如果作业失败,系统会创建一个包含作业失败相关信息的事件。如果备份方案期限内还有时间,系统会重试原始作业,并将一个完全相同的新作业加入队列。
  • 未运行。作业因某些限制(例如调度程序已停用、目标池已满、源映像缺失或不适用、连接问题或没有可用的作业槽)而无法在其备份方案期限内运行。
  • 已加入队列。当政策要求运行作业时,系统会创建一个状态为queued的作业。如果没有限制,则进入运行状态。如果限制条件阻止其运行,则它会保持在队列中。如果限制一直存在,直到运行同一政策的下一个实例时,系统会为作业分配 notrun 状态,并在队列状态下添加一个具有相同作业 ID 且附加字母的新作业实例。
  • Queued_Readiness。作业状态仅适用于 Onvault 作业和直接上传到 Onvault 作业。在执行检查以查看 OnVault 池是否已准备好处理队列作业时,系统会显示此错误。如果没有可用的 OnVault 池,系统会显示 Queued_Readiness 状态。
  • 已重试。作业未完成。作业进入重试状态。 如果备份方案期限内还有时间,系统会重试原始作业,并将具有相同作业 ID 且附加字母的新作业实例加入队列。系统会在每个作业失败后 4、16 和 64 分钟重试 3 次。当备份方案时间耗尽或作业的另一个实例开始时,原始作业会失败,系统会启动一个处于重试状态的重试作业。重试作业会在作业 ID 后附加字母。
  • 正在运行。作业正在处理中。作业的完成百分比会显示在状态中。
  • 成功,但有警告。作业已根据调用它的备份计划成功完成,但系统还输出了一条警告,您可以在监控 > 事件中查看该警告。一个典型示例是,Compute Engine 实例快照成功,但元数据上传到 OnVault 失败。
  • 已成功。作业已根据调用它的备份计划成功完成。

查看作业详情

作业详情窗口中,您可以查看以下内容:

  • 作业的详细信息
  • 卷信息
  • 作业重试次数
  • 作业统计信息

查看作业详情后,点击返回作业可返回作业页面。

以下列表介绍了作业详情。

  • 应用名称。应用名称,不一定是唯一的。
  • 应用类型。应用类型,例如 SQL Server、Oracle、文件系统或整个虚拟机。
  • 容量。每个卷的容量。
  • 一致性模式。崩溃一致或应用一致,表示应用在作业期间是否处于休眠状态。
  • 时长。开始日期和结束日期之间的时间。
  • 结束日期。作业完成的日期和时间。
  • 错误代码。零表示无错误,非零值表示运行作业时遇到的错误。
  • 事件 ID。与作业关联的任何事件 ID。如果没有事件 ID,则值为零。
  • 消息。一条消息,说明运行作业时遇到的错误。
  • 到期日期。此图片的失效日期和时间。
  • 主机名。应用运行的主机的名称。
  • 图片类型。快照、云,作业创建的图片类型。
  • isbootvmdk。对于映像中作为启动卷的卷(如果有),将其设置为 true。
  • Islvm。对于每个卷,是否为逻辑卷管理器卷。
  • 作业 ID。用于标识作业的唯一编号。
  • 上次限制日期。作业最近一次运行的日期。
  • 日志截断。设置为 true 表示应用的日志已被截断。
  • logicalname。主机系统标识的每个卷的名称。
  • 已挂载的主机。对于挂载故障切换作业,是映像挂载的主机。
  • 政策名称。与作业关联的政策的名称。
  • 优先级。在政策中设置的“低”“中”或“高”。
  • 受保护数据。受保护的数据量。
  • 来源名称。图片的哪个具体副本是作业的来源。
  • Sourcemountpoint。原始主机上每个卷的挂载点的名称。
  • 开始日期。作业实际开始运行的日期和时间。
  • 模板名称。服务等级模板的名称。
  • 传输介质。作业期间数据的传输方式:通过 SAN 或 LAN。
  • 唯一 ID。用于唯一标识图片中的每个卷的标识符。
  • Volumekey。一个字符串,用于在内部标识图片中的多个卷。
  • VolumeUID。映像中每个卷的唯一标识符。

卷信息

以下列表显示了提供的音量信息。

  • 容量。备份的卷的大小。
  • 数据存储区。对于虚拟机,是存储卷所在的数据存储区。
  • 文件名。VMware:VMDK 文件的路径。
  • HUID。主机唯一标识符,一个字符串,用于唯一标识音量。
  • 标签。卷的卷标签。
  • 逻辑名称。卷的易于理解的唯一名称。对于 VMware 虚拟机,这是文件名。
  • 来源挂载点。卷的装载点。
  • 目标。卷副本的 Backup and DR VDisk 名称。

重试

您可以参阅以下列表,了解重试元数据的说明。

  • 结束日期。作业完成(无论是成功还是失败)的日期和时间。
  • 错误代码。零,或作业返回的错误代码。
  • 错误消息。与错误代码对应的文本消息。
  • 作业名称。原始作业或重试尝试的作业名称。
  • 开始日期。作业开始运行的日期和时间。

统计信息

以下列表介绍了这些统计信息。

  • 应用冻结时间。应用在备份期间处于冻结状态的总时间。在备份(快照)期间,应用会被置于冻结状态,以便在一致状态下捕获所有数据。
  • 应用大小 (GB)。暂存磁盘上的应用数据的大小。
  • 卷数。作业所涉及的应用中的卷数量。
  • 已复制的数据量(GB)。显示此作业找到的新应用数据量。

作业类型

Backup and DR 通过以下类型的作业保护和访问数据:

作业类型 监控器标签 说明
清理镜像 cleanupmirroring 当从应用中移除备份方案或将其更改为不包含相同类型的复制时,从远程设备中移除 StreamSnap 映像。
克隆 clone 将源映像的副本创建到目标位置(例如服务器、数据库或磁盘池)。
克隆(迁移) 克隆(迁移) 将数据从已装载的磁盘迁移到服务器磁盘。
克隆(挂载) 克隆(挂载) 将映像挂载到服务器,为执行克隆(迁移)作业做准备。
删除 删除 删除已从主机上卸载的映像。
删除测试 deletetest 执行对故障切换测试作业创建的映像的卸载和删除操作。
直接转到 OnVault DirectOnVault 将 VMware 虚拟机的某个时间点映像创建到 OnVault 池中,而无需先使用快照池。
失效日期 到期 在图片达到保留期限或按需请求时,使其过期/删除。
故障恢复 故障切换 执行对由故障切换作业创建的映像的卸载和删除操作,移除应用的所有同步回传映像,并在远程设备上触发故障切换删除作业。
故障切换 故障切换 从复制的 StreamSnap 映像挂载应用,停止在源端创建新的快照作业,并跟踪反向复制 (Syncback) 的更改。
故障切换 - 删除 deletefailover 在本地设备执行故障切换作业时,自动触发在远程设备上运行。
故障切换 - 测试 failovertest 从复制的 StreamSnap 映像挂载应用,但会让正向复制保持活跃状态,并且不会启用同步回传。
完成 完成 执行 SQL Server 挂载和迁移流程中的最后一步,其中包括与卸载删除结合的迁移作业。
忘记 Active Mount ForgetActiveMount 移除对 Compute Engine 实例挂载的跟踪,而不会在 Compute Engine 中删除实例。
忘记导入的 OnVault 映像 忘记 OnVault 图片 撤消从一台设备中将 OnVault 元数据导入 OnVault 池的操作。
LiveClone liveclone 通过快照映像创建 LiveClone 映像(完整副本)。
LogBackup LogBackup 创建映像以捕获应用的日志。
Log Replicate logreplicate 使用 StreamSnap 技术在本地设备和远程设备之间执行复制,这意味着日志复制会直接从本地设备上的快照池复制到远程设备上的快照池。
迁移 迁移 将数据从挂载点复制到服务器的存储空间。 对于某些应用类型,它将执行在线转换,并移除已挂载的备份和灾难恢复磁盘。对于其他类型的应用,迁移作业会重复运行,直到用户发起最终处理作业。
迁移(取消) 迁移(取消) 取消正在进行的迁移,为已挂载的映像停用未来的迁移作业,并清理所有已部分迁移/复制的数据。
挂载 mount 将映像挂载到所选主机。
OnVault vault 将快照映像复制到 OnVault 池。
OnVault(Log) 将数据库日志复制到一个或多个 OnVault 存储分区。
OnVault 复制 OnVaultReplicate 将一个 OnVault 池中的映像复制到另一个 OnVault 池。
Oracle ASM 重新平衡 恢复(ASM 切换) 恢复(ASM 重新平衡) ASM 切换器会装载 Oracle 数据库,取代其原始源数据库。ASM 重新平衡会启动将数据库从已挂载的磁盘迁移到服务器磁盘的流程,然后在完成后移除已挂载的磁盘。
准备挂载 prep-mount 以允许直接修改 LiveClone 的方式挂载 LiveClone 映像。
准备取消挂载 prep-unmount 卸载使用 prep-mount 挂载的 LiveClone,并可选择性地允许将对挂载进行的更改直接保存到 LiveClone。
刷新 LiveClone refreshliveclone 使用来自其他源快照映像的数据增量刷新 LiveClone 映像。
Remote-Mount remote-mount 将远程映像(来自其他设备)挂载到本地主机。 系统会执行反向增量复制(如果需要)来执行此任务。
重新配置 重新配置 获取数据库应用的现有挂载,并通过执行挂载删除操作和随后对新映像的挂载操作,将其刷新到其他时间点,默认使用上次挂载时使用的所有选项。
恢复 恢复 将生产数据替换为所选的备份映像。
恢复(取消) 恢复(取消) 取消正在进行的“装载并迁移”恢复。所有已迁移的数据都将被删除,挂载数据也将被移除。
恢复(迁移) 恢复(迁移) 将数据从恢复(挂载)位置复制到服务器的存储空间。对于某些应用类型,它将执行在线转换,并移除已挂载的备份和灾难恢复磁盘。对于其他应用类型,迁移作业会重复运行,直到用户发起最终处理作业。
恢复(挂载) 恢复(挂载) 将数据库的映像挂载为其原始源数据库,以准备进行后续恢复(迁移)。
快照 快照 将应用或虚拟机的某个时间点映像创建到快照池中。
StreamSnap streamsnap 在远程设备上创建或刷新可进行故障切换的 StreamSnap 映像。
注意:StreamSnap 复制作业也与特定的快照政策相关联。在执行复制时,它会使用快照政策的时间表和频率设置。
Syncback syncback 在故障切换后执行增量反向复制,在本地或源设备上创建一个同步回映像,以便日后用于恢复。
取消挂载 卸载 卸载之前挂载到主机上的映像,但保留该映像以供日后挂载。
取消挂载 卸载删除 卸载之前挂载到主机上的映像,并舍弃在该挂载中进行的所有更改。

运行按需作业

如果您需要立即启动作业,请运行按需作业。按需作业包括所有类型的恢复、克隆、挂载作业,以及按需应用政策时创建的作业。

每台备份/恢复设备都会为所有不同类别的作业预留一个槽池:数据访问、到期、日志复制、日志 OnVault、按需、OnVault、快照、streamsnap。此外,还有一个未预留的槽位池。

在启动作业之前,每个备份/恢复设备都会检查是否有与作业类别对应的槽可用于运行作业。如果预留的槽位因该类别的所有槽位都在运行作业而不可用,备份/恢复设备会检查是否有未预留的槽位可用。如果有未预订的空档可用,系统会启动作业。不过,您可以预留特定类别的作业可以从未预留的池中使用的最大槽数。此措施限制了某一类作业可以从未预留的槽池中使用的槽数。

通过管理控制台运行按需备份作业

如需从管理备份方案页面按需捕获托管应用,请执行以下操作:

  1. 点击 App Manager(应用管理器)标签页,然后从下拉列表中选择 Applications(应用)。应用页面随即打开。
  2. 选择相应应用或虚拟机,然后点击下拉列表中的管理备份方案。 系统随即会打开管理备份方案页面。
  3. 从右侧的政策列表中展开模板政策。

    如果数据库是使用启用了日志保护的备份模板进行管理,并且有备份可用,则您可以针对要提交的作业类型使用其他日志选项。在本例中,您可以选择是捕获数据库 (DB) 还是仅捕获日志 (Log)。

  4. 点击立即运行,系统随即会打开一条确认消息。

  5. 点击 Yes(是)进行确认。系统会根据备份政策创建时间点映像。

运行按需数据库日志复制

在某些情况下,您可能需要手动向远程备份/恢复设备发起数据库映像的日志复制。例如,如果数据库映像的日志未正确复制到备份/恢复设备,或者备份/恢复设备上没有数据库映像的日志,您可能需要手动执行日志复制。然后,您可以使用远程设备上的事务日志将数据库恢复到指定的时间点。

如需手动向远程备份/恢复设备启动数据库日志复制,请执行以下操作:

  1. 点击 App Manager(应用管理器)标签页,然后从下拉列表中选择 Applications(应用)。应用页面随即打开。
  2. 选择受管应用或虚拟机,然后点击页面右下角下拉列表中的复制日志
  3. 在随即打开的确认对话框中,点击确认。数据库事务日志会复制到模板中的复制政策定义的远程设备。

监控挂载到容器的作业

如需监控挂载到容器的作业,请执行以下操作:

  1. 点击监控标签页,然后从下拉菜单中选择作业以打开作业页面,您可以在该页面中查看所有正在运行的作业的列表。
  2. 挂载作业过滤。
  3. 根据标签或其他详细信息找到要监控的作业。
  4. 如果作业正在运行,您可以监控其进度。完成后,选择相应作业,然后点击查看详情进行查看:

    • 作业的详细信息
    • 卷信息
    • 作业重试次数
    • 作业统计信息

    如需详细了解这些各个方面,请参阅查看作业详情

访问容器 YAML 代码

容器 YAML 部分列出了添加到容器或 pod 的 YAML 配置文件中的 YAML 代码段。您可以根据需要回顾此代码,并在稍后使用它。

  1. 查看作业详情后,点击返回“作业”以返回“作业”页面。

取消正在运行的作业

您可以取消正在运行或排队等待运行的作业。

如需取消正在运行的作业,请执行以下操作:

  1. 点击监控标签页,然后从下拉菜单中选择作业。 系统随即打开作业页面,其中列出了所有正在运行的作业。您可以清除此默认过滤条件,以显示正在监控的所有作业。
  2. 选择要取消的作业,然后点击窗口右下角的取消作业

  3. Cancel Job 对话框中点击 Confirm

更改作业优先级

您可以根据希望备份/恢复设备如何分配必要资源,更改正在处理的作业的优先级。

如需更改队列作业的优先级,请执行以下操作:

  1. 点击监控标签页,然后从下拉菜单中选择作业。 系统随即打开作业页面,其中列出了所有正在运行的作业。您可以清除此默认过滤条件,以显示正在监控的所有作业。
  2. 作业页面中选择要更改优先级的作业,然后依次点击查看详情和窗口右下角的更改优先级

  3. Set Job Priority(设置作业优先级)对话框中,选择作业优先级。

  4. 点击确认更改优先级选择。

未完成的作业在失败前会重试多少次

当预定作业失败时,调度程序最多会自动重试该作业三次。作业首次失败时,第一次尝试的状态将被标记为“已重试”,并且调度程序将等待 4 分钟,然后再次将作业加入队列。如果再次失败,系统会在 16 分钟后将下一次重试加入队列。如果第三次失败,系统会在等待 64 分钟后将最后一次重试加入队列。重试三次失败(总共四次尝试)后,最后一次重试作业将被标记为“失败”(而非“已重试”),并且在该时间段内系统不会再尝试针对该应用执行任何其他作业。

调度程序会像对待任何其他可用作业一样对待作业重试。如果队列中作业的数量多于可容纳它们的槽数,则队列中的重试作业将需要等待槽。如果政策期限在重试作业启动之前结束,则队列中的所有重试作业都不会运行,系统也不会尝试进一步重试。

作业重试次数会显示在监控 > 作业中。为便于识别作业重试,所有四个作业都将采用以下格式的相同作业编号,且按以下顺序:

  • Job_xxxxx(状态:已重试)
  • Job_xxxxxa(状态:已重试;在等待 4 分钟后加入队列)
  • Job_xxxxxb(状态:已重试;在等待 16 分钟后加入队列)
  • Job_xxxxxc(状态:失败;在等待 64 分钟后加入队列)

下次尝试为此应用执行备份作业的时间取决于相应政策的时间表。因此,如果时间表要求每天在凌晨 1:00 开始的窗口期内创建一个快照,则下一次尝试将在次日凌晨 1:00 进行。

时区

默认情况下,在管理控制台中,作业和事件菜单中显示的所有时间戳均采用网页浏览器检测到的用户当地时区。如果您想确认所使用的时区,请在信息中心菜单栏中选择右上角的用户图标。它会显示自动检测到的时区,并在检测到的时区不适用时设置时区。

请按照以下说明更改时区。

  1. 在信息中心内,点击右上角的用户图标。
  2. 选择更改时区
  3. 时区下拉菜单中,选择显示作业和事件时要使用的时区。
  4. 点击保存

预定作业简介

作业会按照其备份模板政策中分配的时间表运行。如果您尝试同时运行多个需要大量资源的作业,则其中一些作业必须等待资源可用。如果等待时间过长,该窗口会关闭,并发生备份方案违规问题。

最好分阶段运行需要大量资源的作业(例如初始快照作业),而不是让它们同时争夺资源。例如,请考虑在工作日下午 6:00 时对一类应用进行快照,在 6:10 时对另一类应用进行快照,在 6:20 时对另一类应用进行快照,而不是在 6:00 时对所有虚拟机、文件系统和数据库进行快照。

应用或虚拟机的初始快照是体积最大且最耗时的快照,因为其中的每一份数据都是新的。添加新的大型应用或虚拟机时,请在非高峰时间执行第一个快照的按需快照,然后为所有未来的快照安排备份模板政策。

按需作业简介

大多数作业会根据其备份计划按计划运行,但对于即将到来的维护时间窗口、软件升级以及新应用的首次快照,您需要确保在开始执行定期维护任务之前,已成功复制所创建的数据。在这些情况下,需要使用点播作业。

作业槽简介

Backup and DR Service 通过分配作业槽来管理作业。该设备会为每类作业预留一个槽池,以及一个未预留的槽池。

在开始作业之前,备份和灾难恢复会检查是否有与作业类别对应的空闲槽可用于运行作业。如果某个预留槽不可用,因为该类别的所有槽都在运行作业,则设备会检查是否有未预留的槽可用。如果有未预订的空档可用,系统会启动作业。

按需备份作业队列

备份和灾难恢复服务支持按需作业队列,让您可以灵活地创建映像,而无需担心可用于启动作业的按需作业槽数量。加入队列的按需作业会一直处于队列状态,直到有按需作业槽可用。

当有按需时段空闲时,作业会进入运行状态。此序列会按照提交作业的顺序进行。如果按需作业失败,设备将尝试运行队列中的下一个作业。按需作业使用的作业槽与预定作业不同,因此预定作业可能会在加入队列的作业之前运行。

在点按式作业处于队列状态时,您可以更改作业优先级、取消作业或取消对应用的保护。您可以点击监控,然后点击作业,查看队列中的作业。

已取消的按需作业会在作业历史记录表中显示为已取消的作业。 作业的开始时间和结束时间将是确认取消请求或应用保护取消的时间。

在添加新应用时保持性能

如果您的系统一直以来的性能令人满意,那么在您添加新应用后,性能可能会在短时间内受到影响。这是因为变更块跟踪会识别新数据并对其进行保护,即使新数据只是大型应用的一小部分也是如此。这意味着,系统经过优化,可每天处理许多更改后的分块。

新应用在初始捕获时需要更多资源,因为它对系统来说是全新数据。

在添加新应用时,请使用以下信息以获得最佳结果:

  • 添加新应用时,请在负载较低时使用按需作业首次保护该应用。这样可以防止资源密集的初始注入作业干扰其他作业。

  • 添加多个新应用或虚拟机时,请尝试分阶段为每个新应用安排初始保护作业,以防止同时提取所有新数据。为此,您可以分配在不同时间运行的备份方案。您还可以使用新手入门作业槽功能来最大限度地减少中断。

  • 将初始保护作业与镜像作业在时间上分开。创建应用快照后,镜像作业可能会在几小时后(系统负载较低时)运行。

  • 一致性组是一种高效的方式,可保护具有类似需求的多个应用;请参阅在备份和灾难恢复一致性组中捕获应用数据

  • 请注意您现有的备份计划,并尽量不要将大型或动态应用的快照作业与快照作业同时安排。

    您可以从管理标签页中的保留的快照图片列表中进行选择,然后执行以下操作:

    • 从保留的图片列表中进行选择,然后在 App Manager 中前往该图片。

    • 使一张或多张所选快照图片失效。