Cloud Extensions 高可用性模型

Cloud Extensions 使用主动-被动模型实现高可用性。工作负载使用 Cloud Edge 主节点,但还使用 iSCSI 多路径连接到辅助节点。 如果主节点发生故障,工作负载会进行故障切换以使用辅助节点。主节点恢复后,Migrate for Compute Engine 会进行故障恢复。

受损的 Cloud Extensions 扩展

“受损”状态的 Cloud Extensions 扩展以不同方式运作,具体取决于是只有一个 Cloud Edge 节点出现故障,还是两个节点都出现故障

  • 如果只有一个 Cloud Edge 节点出现故障,大多数操作仍然可用,但写入吞吐量会降低。
  • 如果两个 Cloud Edge 节点均出现故障,依赖该 Cloud Extensions 扩展的虚拟机将无法再访问存储服务,并且会出现故障。此外,Cloud Extensions 扩展再也无法在云端运行新虚拟机。在这种情况下,您可以采取以下两种做法之一:
    1. 强制运行虚拟机以迁移回其来源环境。
    2. 如果虚拟机已完全缓存,请运行“准备分离”操作。
    3. 停止虚拟机。

如果 Migrate for Compute Engine 后端或 Migrate for Compute Engine Manager 出现故障,Cloud Extensions 扩展也可能受损。在这种情况下,您只能使用一组有限的操作。

Cloud Extensions 可能会由于以下原因受损:

  1. 部署不完整或初始健康检查失败。这很可能是由于网络权限配置不当所致。从根本上解决此问题后,修复 Cloud Extensions 扩展。修复 Cloud Extensions 扩展会尝试重新创建缺失的组件或/和运行相关的健康检查。如果修复成功,Cloud Extensions 扩展将处于活跃状态。
  2. 虚拟机运行状况问题。在运行正常的主机上重启受影响的虚拟机后,停止和启动 Cloud Extensions 扩展可能会解决此问题。

避免数据丢失

当一个 Cloud Edge 节点出现故障时,Cloud Extensions 扩展将进入故障安全模式。为避免数据丢失,所有数据都写入 Cloud Storage 上 Cloud Extensions 扩展的对象存储中,这样会降低 Cloud Extensions 扩展的性能。

后续步骤

如需了解详情,请参阅监控 Cloud Extensions