此核对清单可帮助您改进 Google Cloud 上 SAP HANA 和 SAP NetWeaver 环境的高可用性设计、迁移、实现和维护。
在完成该核对清单的过程中,请考虑您自己的业务需求。如果您的选择与我们建议的不同,请在执行该核对清单中的后续任务时注意这些区别。
- 如需了解如何在 Google Cloud 上实现或维护高可用性 SAP HANA 系统,请参阅 SAP HANA 高可用性规划指南。
- 为了防止发生计划内中断(例如硬件故障),我们强烈建议您使用基于操作系统的软件集群。
如需允许在进程失败或不需要虚拟机重启的软件维护期间快速重启 SAP HANA 2.0 SP04 或更高版本,请启用 SAP HANA“快速重启”选项。我们强烈建议您为 Compute Engine 内存优化机器类型(例如 M1、M2 或 M3 机器类型)启用“快速重启”选项。如需详细了解 SAP 提供的关于 SAP HANA“快速重启”的信息,请参阅 SAP HANA 快速重启选项。
如需详细了解如何启用“快速重启”,请参阅 Linux 发行版的配置指南:
如需允许 SAP HANA 发出特定事件的通知并改进故障检测,请启用 SAP HANA 高可用性/灾难恢复提供商钩子。
如需详细了解如何启用 SAP HANA 高可用性/灾难恢复提供商钩子,请参阅 Linux 发行版的配置指南:
如果您不使用集群自动化解决方案(例如 Pacemaker),请定义和测试恢复流程和手册。
使用 Pacemaker 时:
在
corosync.conf
配置文件的totem
部分中,使用 Google Cloud 推荐的参数值。如果您要配置新的高可用性集群,则需要更改一些默认值。如需详细了解 Corosync 配置参数的推荐值,请参阅 Corosync 配置参数值。如需详细了解如何修改
corosync.conf
配置文件中的默认值,请参阅 Linux 发行版的配置指南:为防护设备配置集群资源时,请务必按照 Google Cloud 的建议设置 Corosync 的超时和监控时间间隔以及重启延迟。如需详细了解如何设置防护,请参阅 Linux 发行版的配置指南:
定义使用内部直通式网络负载均衡器的虚拟 IP 地址 (VIP)。如果您未使用 Google Cloud 提供的自动化功能来设置此配置,请确保预留此 VIP 地址,以避免意外重复使用。
出于测试目的,请创建一个与您的生产环境等效的非生产高可用性系统。
- 如需查看受支持的 SAP 配置以实现高可用性,请参阅 SAP 说明 2456432 -《Google Cloud 上的 SAP 应用:支持的产品和 Google Cloud 机器类型》。
在 SUSE Linux Enterprise Server (SLES) 或 Red Hat Enterprise Linux (RHEL) 上,Pareemaker 集群应用为您提供了通过高可用性配置来配置 SAP 应用的资源。使用 Pacemaker 时:
在
corosync.conf
配置文件的totem
部分中,使用 Google Cloud 推荐的参数值。如果您要配置新的高可用性集群,则需要更改一些默认值。如需详细了解如何修改
corosync.conf
配置文件中的默认值,请参阅 Linux 发行版的配置指南:为防护设备配置集群资源时,请务必按照 Google Cloud 的建议设置 Corosync 的超时和监控时间间隔以及重启延迟。如需详细了解如何设置防护,请参阅 Linux 发行版的配置指南:
对于 RHEL 和 SLES 操作系统,请使用内部直通式网络负载均衡器来管理虚拟 IP (VIP) 地址。负载平衡器提供高可用性服务,并创建浮动 VIP,可在集群中的虚拟机之间引导流量。
对于基于 Windows 的环境,Windows 原生故障切换集群功能具有高可用性。如需了解详情,请参阅以下 Windows 操作系统资源:
如果您的环境具有托管多个具有不同系统 ID 的 SAP 系统的虚拟机实例,请遵循以下高可用性 (HA) 建议:
如需为 SAP 中央服务和数据库系统提供高可用性,请使用 Google Cloud 支持的某种高可用性方法配置高可用性模式。请参阅 SAP NetWeaver 的高可用性规划指南或 SAP HANA 高可用性规划指南。
如需在 SAP NetWeaver 系统中为 IBM Db2 高可用性集群提供高可用性,请参阅适用于 SAP 的 IBM Db2 高可用性集群指南。
为了避免相关的复杂性,请不要在同一个高可用性集群中运行多个软件解决方案。正确的做法是,在高可用性集群所在的虚拟机(例如 SAP 中央服务)上部署软件。
- 请勿使用不同类型的集群软件管理同一虚拟机上的资源。这两个集群解决方案可能会相互冲突,并可能导致意外行为。
- 如果您在同一高可用性虚拟机集群上设置来自不同 SAP 系统 ID 的多项服务:
- 复杂性增加的问题排查和恢复显著增加。
- 如果发生故障,多个系统会受到影响。分配资源可减少这种影响。
如果您为 SAP 中央服务选择第三方故障切换解决方案,请记录设置并全面测试。
出于测试和发布目的,我们建议您创建一个与您的生产环境等效的非生产高可用性系统。
- 虽然企业可能不需要此项测试,但您可以使用此测试 HA 系统来验证故障切换和维护过程,执行广泛的测试并记录系统以用于操作参考。
如果您实现了独立高可用性的 SAP 中央服务实例,请务必记录恢复流程的手动过程并全面测试。
- 注意:缺少高可用性的 SAP NetWeaver 系统通常会导致服务恢复时间和不可预知的中断。
- 实时迁移和高可用性集群:
- 在虚拟机实例上启用 Compute Engine 实时迁移实例政策。
- 模拟实时迁移维护事件,以评估实时迁移对活跃工作负载的影响和高可用性配置的影响。
- 如需详细了解实时迁移,请参阅实时迁移。
- 在虚拟机实例上启用 Compute Engine 自动重启实例政策。
- 要确保已配置足够的集群故障切换阈值,请参阅测试可用性政策。