管理运行 SAP HANA 的 X4 实例的主机维护事件

本文档介绍如何管理和监控运行 SAP HANA 工作负载的 Compute Engine X4 实例的计划主机维护事件

X4 是一组专门的 Compute Engine 裸金属机器类型,旨在运行数 TB 的 SAP HANA 工作负载。需要进行 X4 维护才能进行常规软件和固件更新。此维护可确保您的 X4 实例的性能达到最佳、安全且可靠。

与其他 Compute Engine 机器类型不同,X4 不支持维护事件期间的实时迁移过程。这意味着对于计划的主机维护事件,Google 必须停止并更新 X4 实例,这使得这些事件对 SAP HANA 工作负载至关重要。

维护生命周期

计划的主机维护事件开始前 60 天,我们会向您发出通知。 在此时段内,您可以触发主机维护事件。如果您未在主机维护事件的计划开始日期和时间之前触发该事件,则 Google 会在计划开始日期、计划开始时间或该时间前几分钟自动触发该事件。

计划的主机维护事件通常持续长达 4 小时,在此期间,主机上运行的实例会停止并重启。

X4 实例的计划主机维护事件的大概频率至少为 90 天。这意味着,一旦计划维护完成,就可以确保下一个计划维护事件至少在 90 天后发生。不过,系统可能会根据潜在问题的严重程度进行计划外维护。

以下各部分介绍了触发计划主机维护事件的两种方式:由您手动触发或由 Google 自动触发。

由您手动触发的维护事件

以下步骤显示了在您触发计划托管维护事件的场景中发生的操作顺序示例:

  1. 在第 0 天,您部署 X4 实例。
  2. 在第 36 天,您会从 Google 收到有关计划内主机维护事件的通知。

    如果您使用 gcloud compute instances describe 命令查询 X4 实例的说明,则会在响应中看到 "maintenanceStatus": "PENDING"

    在第 36 天到第 96 天之间(60 天提前通知期),您可以选择触发主机维护事件。

  3. 在第 80 天,您为 X4 实例触发主机维护事件。例如,您可以运行 gcloud compute instances perform-maintenance 命令

    Google 会关闭 X4 实例以进行维护。维护时长通常为 4 小时。

    您可以使用 gcloud compute instances describe 命令查看实例的 maintenanceStatus 字段是否设置为 ONGOING

  4. 维护活动完成后,Google 会重启 X4 实例。

您最早可以在此维护事件完成后至少 30 天内,收到有关下一个计划主机维护事件的通知。在此示例中,Google 会在第 120 天向您发送有关下一个计划主机维护事件的通知。

下图展示了上述这组步骤:

显示客户触发的计划主机维护事件中操作顺序的图表

由 Google 自动触发的维护事件

以下步骤显示了在 Google 触发计划托管维护事件的场景中发生的操作顺序示例:只有当您在收到事件通知到事件计划开始日期之间的 60 天提前通知期内未触发事件时,Google 才会在事件的计划开始日期触发主机维护事件。

  1. 在第 0 天,您部署 X4 实例。
  2. 在第 45 天,您会从 Google 收到有关计划内主机维护事件的通知。

    如果您使用 gcloud compute instances describe 命令查询 X4 实例的说明,则会在响应中看到 "maintenanceStatus": "PENDING"

  3. 在第 105 天(即主机维护事件的计划开始日期),Google 触发主机维护事件。维护通常会在计划开始时间或计划开始时间后的几分钟内开始。

    如果您使用 gcloud compute instances describe 命令查询 X4 实例的说明,则会在响应中看到 "maintenanceStatus": "ONGOING"

  4. Google 会关闭 X4 实例以进行维护。维护时段通常为 4 小时。

  5. 维护活动成功完成后,Google 会重启 X4 实例。

您最早可以在此维护事件完成后至少 30 天内,收到有关下一个计划主机维护事件的通知。在此示例中,Google 会在第 150 天向您发送有关下一个计划主机维护事件的通知。

下图展示了上述这组步骤:

显示 Google 触发的计划主机维护事件中操作顺序的图表

查看有关维护事件的信息

对于每个计划的主机维护事件,Google 都会提前 60 天向您发送通知。X4 的所有计划主机维护事件都归类为预定维护。

如需查看有关计划内主机维护事件的信息,您可以执行以下操作:

  • 使用 Google Cloud CLI 查询 X4 实例
  • 使用 REST API 查询 X4 实例
  • 查询 X4 实例的元数据服务器
  • 在 Cloud Logging 中查看日志

如需了解如何执行这些操作(包括所需的 IAM 角色和权限),请参阅监控和规划主机维护事件

使用这些选项时,您可以使用 machineType 元数据字段(显示实例的机器类型)来过滤 X4 实例。以下示例展示了 X4 实例的相关信息在 Logs Explorer 中显示的样子:

metadata: {
  canReschedule: true
  latestWindowStartTime: "2025-07-21T00:00:01Z"
  machineType: "x4-megamem-1920-metal"
  maintenanceStatus: "PENDING"
  type: "SCHEDULED"
  windowEndTime: "2025-07-21T04:00:00Z"
  windowStartTime: "2025-07-21T00:00:00Z"
}
methodName: "compute.instances.upcomingMaintenance"

模拟维护事件

如需观察计划主机维护事件的端到端流程,或测试您可能已实现的任何集成或自动化,您可以使用 gcloud CLI 或 REST API 为 X4 实例模拟主机维护事件。

当您尝试在 X4 实例上模拟主机维护事件时,该实例会终止并重启,因为 X4 实例的 onHostMaintenance 属性已固定为值 TERMINATE。如需了解详情,请参阅可用的主机维护属性

如需了解如何模拟计划的维护事件,请参阅模拟终止的计算实例的主机维护

触发维护事件

在 60 天的提前通知期结束之前,您可以随时触发计划内主机维护事件。您可以使用 gcloud CLI 或 REST API 执行此操作。

如需触发主机维护事件,请勿使用用于停止和启动 Compute Engine 实例的 gcloud CLI 或 REST API 资源。

如需了解如何触发计划内主机维护事件,或如何检查其状态,请参阅手动启动主机维护事件

维护事件不再适用

在极少数情况下,如果计划外维护问题影响了 X4 实例,Google Cloud 会自动将该实例迁移到其他健康状况良好的主机。同样,如果您在 60 天提前通知期内手动停止和启动 X4 实例,则系统会在可用主机上预配该实例。

Google Cloud 旨在维护一组最新的 X4 机器。如果 X4 实例的新主机运行的是最新固件,则之前预定的主机维护事件不再适用于 X4 实例。在这种情况下,主机维护事件会自动解决,从而可能减少 SAP HANA 工作负载的停机时间。

验证维护事件的完成情况

如需验证 Compute Engine X4 实例的计划主机维护事件是否已成功完成,您可以执行以下操作:

  • 使用 gcloud CLI 或 REST API 查询实例。响应不包含 upcomingMaintenance 字段。

    如需了解如何查询实例,请参阅检查实例是否存在维护事件通知

  • 在 Cloud Logging 中,检查实例的日志。您会看到类似如下内容的日志消息:

    Maintenance window is completed for this instance. All maintenance notifications on the instance has been removed.

    如需了解如何搜索实例的日志,请参阅检查 Cloud Logging 是否存在维护事件通知

监控维护事件

为 Compute Engine X4 实例的计划内主机维护事件设置监控后,您的团队可以随时了解正在进行的事件的状态以及即将到来的事件。

您可以按如下所示监控主机维护事件:

  • 由于每个维护事件都会向 Cloud Logging 发送多个消息,因此您可以设置基于日志的提醒政策来搜索特定的维护事件通知,并使用通知渠道发送提醒。

    您可以使用 machineType 元数据字段过滤日志,该字段包含与 X4 实例对应的机器类型,例如 x4-megamem-960-metalx4-megamem-1440-metalx4-megamem-1920-metal

    如需了解如何为计划内主机维护事件配置提醒,请参阅为主机维护通知配置提醒

  • 通过导入 maintenance-system-events.json 模板,在 Google Cloud 项目中创建监控信息中心。此信息中心模板可在 GoogleCloudPlatform/sapagent GitHub 代码库中找到。

    如需了解如何通过上传 JSON 文件创建监控信息中心,请参阅安装信息中心模板