使用 Backup for GKE 保护集群


您可以使用 Google Kubernetes Engine (GKE) 集群来运行任务关键型工作负载,这些工作负载必须能够灵活应对多种类型的中断,包括基础设施故障、用户错误和网络攻击。

借助 Backup for GKE,您可以执行以下操作:

  • 备份配置和永久性卷数据,使工作负载能够应对中断。
  • 如果发生中断,请从备份恢复工作负载。
  • 实现关键业务恢复点目标 (RPO) 和恢复时间目标 (RTO)。
  • 针对沙盒测试等使用场景以及创建测试和开发环境,克隆生产配置和数据,从而简化日常操作。

GKE 会监控集群,并使用 Recommender 服务来提供有关如何优化平台使用的指导。通过启用 Backup for GKE,GKE 会检测提高工作负载对中断的恢复能力的机会。

如需详细了解如何管理分析洞见和 Recommender 建议,请参阅利用分析洞见和建议优化 GKE 使用

确定不受 Backup for GKE 保护的集群

GKE 会生成数据分析,以识别组织中不受备份保护的集群。如需获取这些数据分析,请按照说明使用 Google Cloud 控制台、Google Cloud CLI 或 Recommender API 和 CLUSTER_BACKUP_PLAN_NOT_CREATED 子类型查看数据分析和建议

GKE 如何识别没有备份方案的集群

GKE 根据以下条件确定您应该创建备份方案来保护集群:

  • 集群不是临时集群,这意味着 GKE 集群满足以下所有条件:

    • 集群已存在至少七天。
    • 集群位于以下可用区或区域之一:

      • 可用区us-central1-aus-central1-bus-central1-cus-central1-fus-east1-bus-east1-cus-east1-d
      • 区域us-east1
    • 集群正在运行。

    • 集群不是 Alpha 版集群

  • 集群没有关联的 Backup for GKE 备份方案。

评估集群是否需要使用 Backup for GKE 进行数据保护

请考虑以下标准来评估是否应使用 Backup for GKE 备份集群:

  • 运行有状态应用:有状态应用会保留容易丢失和损坏的状态。备份可以最有效地防范由于可用区级、区域级、工作负载或用户引发的故障而导致的中断。
  • 快速应用回滚非常重要:在发生故障、升级失败或损坏时,将有状态和无状态应用恢复到已知的健康状态。与重新部署应用相比,从备份恢复通常可以缩短恢复时间。 通过备份,您可以存储多个时间点,以提高灵活性。
  • 需要保护免受网络攻击:通过创建不可变的加密备份,并在最短时间内锁定这些备份以防止删除,为网络攻击威胁的影响做好准备。

有状态工作负载和无状态工作负载都可以从备份中受益。如果一个或多个条件适用于您的集群,请考虑配置备份。

如何处理建议

如果您确定应该启用 Backup for GKE 并为集群创建备份方案,请按照以下说明操作:

  1. 启用 Backup for GKE API
  2. 为集群启用 Backup for GKE
  3. 创建备份方案

后续步骤