管理运行 SAP HANA 的 X4 实例的主机维护事件

本文档介绍了如何为运行 SAP HANA 工作负载的 Compute Engine X4 实例管理和监控计划的主机维护事件

X4 是一系列专门的 Compute Engine 裸金属机器类型,专为运行数 TB 的 SAP HANA 工作负载而设计。如需定期更新软件和固件,必须进行 X4 维护。此维护可确保 X4 实例的性能达到最佳水平,并确保其安全可靠。

与其他 Compute Engine 机器类型不同,X4 不支持维护事件期间的实时迁移过程。这意味着,对于计划的主机维护事件,Google 必须停止并更新 X4 实例,因此这些事件对 SAP HANA 工作负载至关重要。

维护生命周期

计划性主机维护事件会在开始前 60 天向您发出通知。在此时间范围内,您可以触发主机维护事件。如果您未在计划的开始日期和时间之前触发主机维护事件,Google 会在计划的开始日期、计划的开始时间或该时间之后的几分钟内自动触发该事件。

预定的主机维护事件通常最长可持续 4 小时,在此期间,主机上运行的实例会停止并重启。

X4 实例的计划性主机维护事件大概每 90 天进行一次。这意味着,完成一次计划维护后,下一次计划维护事件至少会在 90 天后发生。不过,根据潜在问题的严重程度,系统可能仍会进行非预定的维护。

以下部分介绍了触发计划主机维护活动的两种方式:由您手动触发或由 Google 自动触发。

您手动触发的维护事件

以下步骤展示了在您触发预定的主机维护事件的情况下发生的操作序列示例:

  1. 在第 0 天,您部署 X4 实例。
  2. 在第 36 天,您会收到 Google 发送的有关计划主机维护事件的通知。

    如果您使用 gcloud compute instances describe 命令查询 X4 实例的说明,则会在响应中看到 "maintenanceStatus": "PENDING"

    在第 36 天到第 96 天(提前 60 天的通知期)之间,您可以选择触发主机维护事件。

  3. 在第 80 天,您为 X4 实例触发主机维护事件。例如,您运行 gcloud compute instances perform-maintenance 命令

    Google 会关闭您的 X4 实例以进行维护。维护通常需要 4 小时。

    您可以使用 gcloud compute instances describe 命令查看实例的 maintenanceStatus 字段是否已设置为 ONGOING

  4. 维护活动完成后,Google 会重启您的 X4 实例。

您最早会在本次维护事件完成后至少 30 天收到有关下一次计划主机维护事件的通知。在此示例中,Google 会在第 120 天向您发送有关下一次计划主机维护活动的通知。

下图展示了上述步骤:

显示客户触发的计划内主机维护事件中操作顺序的示意图

Google 自动触发的维护事件

以下步骤展示了在 Google 触发计划主机维护事件的情况下发生的操作序列示例。只有在您未在收到活动通知之日到活动的预计开始日期之间的 60 天预通知期内触发活动的情况下,Google 才会在活动的预计开始日期触发主机维护活动。

  1. 在第 0 天,您部署 X4 实例。
  2. 在第 45 天,您会收到 Google 发送的有关计划主机维护活动的通知。

    如果您使用 gcloud compute instances describe 命令查询 X4 实例的说明,则会在响应中看到 "maintenanceStatus": "PENDING"

  3. 在第 105 天(即主机维护事件的计划开始日期)时,Google 会触发主机维护事件。维护通常会在计划的开始时间或开始时间后的几分钟内开始。

    如果您使用 gcloud compute instances describe 命令查询 X4 实例的说明,则会在响应中看到 "maintenanceStatus": "ONGOING"

  4. Google 会关闭您的 X4 实例以进行维护。维护时间通常为 4 小时。

  5. 维护活动成功完成后,Google 会重启您的 X4 实例。

您最早会在本次维护事件完成后至少 30 天收到有关下一次计划主机维护事件的通知。在此示例中,Google 会在第 150 天向您发送有关下一次计划主机维护活动的通知。

下图展示了上述步骤:

显示 Google 触发的计划内主机维护事件中操作顺序的示意图

查看维护事件的相关信息

对于每项计划的主机维护活动,Google 都会提前 60 天向您发送通知。X4 的所有计划内主机维护事件都被归类为“定期维护”。

如需查看有关计划性主机维护事件的信息,您可以执行以下操作:

  • 使用 Google Cloud CLI 查询 X4 实例
  • 使用 REST API 查询 X4 实例
  • 查询 X4 实例的元数据服务器
  • 在 Cloud Logging 中查看日志

如需了解如何执行这些操作(包括所需的 IAM 角色和权限),请参阅监控和规划主机维护事件

模拟维护事件

如需观察计划性主机维护事件的端到端流程,或测试您可能已实现的任何集成或自动化操作,您可以使用 gcloud CLI 或 REST API 为 X4 实例模拟主机维护事件。

如需了解如何模拟计划维护事件,请参阅为终止的计算实例模拟主机维护

触发维护事件

您可以在 60 天的提前通知期结束之前随时触发计划主机维护事件。您可以使用 gcloud CLI 或 REST API 执行此操作。

如需触发主机维护事件,请勿使用用于停止和启动 Compute Engine 实例的 gcloud CLI 或 REST API 资源。

如需了解如何触发计划的主机维护事件或如何查看其状态,请参阅手动启动主机维护事件

验证维护事件是否已完成

如需验证 Compute Engine X4 实例的预定主机维护事件是否已成功完成,您可以执行以下操作:

  • 使用 gcloud CLI 或 REST API 查询实例。响应不包含 upcomingMaintenance 字段。

    如需了解如何查询实例,请参阅检查实例是否存在维护事件通知

  • 在 Cloud Logging 中,检查实例的日志。您会看到类似如下内容的日志消息:

    Maintenance window is completed for this instance. All maintenance notifications on the instance has been removed.

    如需了解如何搜索实例的日志,请参阅检查 Cloud Logging 是否存在维护事件通知

监控维护事件

为 Compute Engine X4 实例的计划主机维护事件设置监控功能有助于您的团队及时了解正在进行的事件的状态以及即将进行的事件。

由于每个维护事件都会向 Cloud Logging 发送多个消息,因此您可以设置基于日志的提醒政策,以搜索特定的维护事件通知,并使用通知渠道发送提醒。

如需了解如何为计划的主机维护事件配置提醒,请参阅为主机维护通知配置提醒