裸金属解决方案维护

本页面简要介绍了需要服务器停机时间的裸金属解决方案维护事件的过程。

为确保裸金属解决方案环境保持可靠、安全和最新,Google Cloud 会偶尔对底层裸金属解决方案硬件和基础架构执行计划维护。我们会在您的服务器运行时执行许多更新。但是,某些更新需要停机。无论是哪种情况,我们都会通知您安排的维护,并且提醒您是否需要执行任何操作以便为维护做准备。

出于以下原因,我们建议您允许按计划窗口执行维护:

  • 如果您收到服务器的维护通知,则意味着您的服务器正处于降级状态,必须尽快参与维护,以保持其良好运行并降低意外故障和停机的风险。
  • 定期维护有助于使您的服务器长时间保持正常运行。

裸金属解决方案执行以下两种维护:

  • 基础架构维护 - 包括数据中心的网络设备和存储组件的维护。

    我们会在进行基础架构维护时通知您。基础架构维护通知仅供参考,您无需做出响应。

  • 服务器维护 - 包括服务器维护活动,例如硬件替换、修补、升级和配置更改。

    对于不会影响您的服务器的维护活动(例如,更换热插拔电源和冗余电源),我们会向您发送您不需要响应的信息性通知。

    但是,要执行影响服务器的维护并需要停机(例如 DIMM 替换),我们需要您的许可。

    为了与您协作处理此类维护活动,我们创建了维护事件。借助维护事件,您可以查看维护活动的详细信息并采取适当的操作,例如批准或重新安排维护。

维护方式

维护需要大量的规划和协调工作。这是一项双方面操作,要求您和我们协同工作,使您的服务器正常运行。

为了以最低的延迟完成维护,我们建议您阅读并了解此过程。

以下流程图展示了裸金属解决方案维护过程涉及的步骤:

裸金属解决方案维护过程所涉及的步骤。

以下各部分详细介绍了每个步骤。

Google 创建维护事件

理想情况下,我们会在服务器应进行维护前两到三周创建一个维护事件。我们使用此事件来协调并与您确认,以防止或最大限度地减少裸金属解决方案环境的中断。该事件包含有关维护活动以及准备维护所需的所有详细信息。

您可以在 Google Cloud 控制台中查看维护事件

我们会提前 7 天、3 天以及提前 1 天向您发送关于即将进行维护事件的提醒,以及成功实施事件的准备工作。

用户审核维护事件

建议您仔细阅读事件的详细信息和影响。查看维护事件后,您可以执行以下操作:

收到您的回复后,我们将安排您的维护事件。

我们不建议您取消维护事件。但是,如果您由于业务关键型原因而仍需要取消维护事件,请参阅取消维护事件

用户为维护事件做好准备

在维护事件开始之前,您必须按照准备维护事件中的说明完成准备。

您还必须完成维护事件中说明的任何其他步骤。

发生维护事件

维护事件开始以及维护事件结束时,我们会通知您。这些通知仅供参考,您无需回复。

如果维护未按计划完成,我们会与您联系并提供问题和后续步骤,包括继续维护事件或将服务器还原为先前状态的选项。

如果我们无法联系到您或者您没有回复,则我们将回滚更改,并将服务器恢复到之前的状态。

后续步骤