考虑资源维护

在创建资源之前,您必须考虑所部署的每个资源的维护要求。此外,您还必须考虑对任何底层资源进行维护。

例如,某些服务会部署到底层的 Compute Engine 虚拟机。您为已部署服务设置的维护政策与底层虚拟机上的维护政策不同。

以下示例维护动态可帮助您了解为保持资源可用并高效运行而需进行的规划。

设置虚拟机 (VM) 维护政策

创建虚拟机时,您可以设置维护政策,以便在有待更新、虚拟机崩溃或发生其他主机事件时决定虚拟机的行为。例如,您可以创建政策,以将工作负载实时迁移到其他虚拟机,或者关闭受影响的虚拟机并重启。

详情请参阅以下内容:

区分虚拟机维护和服务维护

您为虚拟机设置的维护政策与您为在虚拟机上运行的服务设置的维护政策不同。

例如,GKE 会在 Compute Engine 虚拟机上部署集群。您可以设置维护政策来控制何时进行某些 GKE 集群维护,但这些政策不会阻止在底层 Compute Engine 虚拟机上触发自动维护。

如需详细了解在 Compute Engine 虚拟机上运行的服务的维护政策,请查看这些服务的相应文档。

在具有 GPU 或 TPU 的虚拟机上维护工作负载

您创建的某些 Compute Engine 资源可能已挂接 GPU 或 TPU。例如,您可以创建使用 GPU 或 TPU 来处理 AI 工作负载的虚拟机。如果这些虚拟机发生主机事件,则不支持从受影响的虚拟机实时迁移到新虚拟机。因此,主机维护事件会导致虚拟机停机,并可能中断您的工作负载。如需处理包含 GPU 或 TPU 的资源的维护事件,请参阅以下内容:

在网络基础架构维护期间保留连接

借助网络连接产品,您可以将对等网络连接到虚拟私有云网络。Google Cloud 会对此基础架构执行定期维护。为避免在维护事件期间发生停机,我们建议您遵循每个网络产品的维护建议,如下例所示:

  • Cloud Router 维护不会中断路由,但可能需要您在对等网络路由器上配置设置。如需了解详情,请参阅软件维护和任务自动重启

  • Cloud Interconnect 会定期进行自动维护,这可能需要您设置通知并创建冗余连接。如需了解详情,请参阅基础架构维护事件