导致数据库备份启动画面时间过短的原因

什么是低启动画面备份?

在正常情况下,Backup and DR Service 会对数据库进行耗时的初始完整注入备份,然后所有后续备份都是速度更快的增量备份。增量备份会比较当前快照和上一个快照的位图,并仅应用增量更改。

低启动画面备份是一种特殊类型的备份作业,当上一个备份作业中的某些系统错误导致位图图片不可靠或无法读取位图时,就会发生这种备份作业。读取位图的服务是 Linux 环境中的 cbt_server,Windows 环境中的 AAMService。

与在正常情况下进行的备份相比,低闪烁备份需要更多时间,因为它们必须重新执行完整注入,才能重新创建可靠的位图。然后,它可以应用增量更改,而无需替换整个图片。

不会导致启动画面缩短的因素

  • 连接器升级
  • 系统优雅重启
  • 优雅地重启 cbt_server 或 AAMService(假设服务在备份时仍在运行)
  • 未出现导致位图不可靠的错误的故障转移。

导致位图不可靠的原因

如果有任何事项干扰了备份作业,就会出现不可靠的位图,包括以下情况:

  • 主机未正常关闭
    • 由于位图不可靠,非正常关闭会导致启动画面质量较差。这包括拔下实体机器的电源线,或通过任何其他方法关闭 Windows 而未正常关闭或出现蓝屏错误。即使集群中的一台机器发生了触发故障切换的蓝屏错误,也存在这种情况,因为来自故障机器的位图不可靠。
    • 如果集群中自上次备份以来托管数据库的所有 Windows 服务器均不可用且未运行 Actifio 服务。我们会从上次备份以来托管数据库的每个集群主机中提取位图,以查找更改;如果没有所有位图,我们就必须运行低闪烁模式以保持数据完整性。请注意,如果托管数据库的集群主机发生 BSOD,位图在备份时可能可用,但仍然不可靠,因此会显示较少的启动画面。
  • 内核模块更新失败
  • 用户模式守护程序发生崩溃或重启
  • 运行备份时出现指纹错误。(Backup and DR Service 会对每个备份作业执行“指纹检查”,以检查是否有错误。)
  • 如果在操作系统关闭期间存储磁盘已满,并且系统无法将所有数据写入保险柜,则会在归档期间出错。
  • SAP HANA 节点故障切换,导致备份被重定向到其他节点。
  • 由于无法加载内核模块,备份功能在降级模式下运行。通常,当操作系统是不可用的版本时,就会出现这种情况。
  • 如果 cbt_server 或 AAMService 在备份期间停止,则无法提取位图,并且备份作业会在低启动画面模式下运行。如果 AAMService 未长时间处于停机状态,则启动 AAMService 将会使位图可用于正常备份。
    • 如果 cbt_server 或 AAMService 停止的时间足够长,以致于驱动程序将几 GB 的事件加入队列,则无法重新创建位图,并且备份将处于低启动画面模式。所需的时间取决于数据库发生的磁盘 I/O 次数。这通常需要 AAMService 停机数天。
  • 非正常关闭 cbt_server 或 AAMService 可能会导致任何当前加载的位图变得不稳定。如果在过去 15 分钟内已写入到跟踪的文件,则会加载位图,因此对于繁忙的数据库,这通常会导致启动延迟时间较短。
  • 如果在主机上卸载包含被跟踪文件(例如 SQL Server .mdf 文件)的卷,然后重新挂载该卷,则位图不可靠,因为无法知道在卸载该卷时写入了什么内容。