您可以使用 Google Kubernetes Engine (GKE) 集群来运行任务关键型工作负载,这些工作负载必须能够灵活应对多种类型的中断,包括基础设施故障、用户错误和网络攻击。
借助 Backup for GKE,您可以执行以下操作:
- 备份配置和永久性卷数据,使工作负载能够应对中断。
- 如果发生中断,请从备份恢复工作负载。
- 实现关键业务恢复点目标 (RPO) 和恢复时间目标 (RTO)。
- 针对沙盒测试等使用场景以及创建测试和开发环境,克隆生产配置和数据,从而简化日常操作。
GKE 会监控集群,并使用 Recommender 服务来提供有关如何优化平台使用的指导。通过启用 Backup for GKE,GKE 会检测提高工作负载对中断的恢复能力的机会。
如需详细了解如何管理分析洞见和 Recommender 建议,请参阅利用分析洞见和建议优化 GKE 使用。
确定不受 Backup for GKE 保护的集群
GKE 会生成数据分析,以识别组织中不受备份保护的集群。如需获取这些数据分析,请按照说明使用 Google Cloud 控制台、Google Cloud CLI 或 Recommender API 和 CLUSTER_BACKUP_PLAN_NOT_CREATED
子类型查看数据分析和建议。
GKE 如何识别没有备份方案的集群
GKE 根据以下条件确定您应该创建备份方案来保护集群:
集群不是临时集群,这意味着 GKE 集群满足以下所有条件:
- 集群已存在至少七天。
集群位于以下可用区或区域之一:
- 可用区:
us-central1-a
、us-central1-b
、us-central1-c
、us-central1-f
、us-east1-b
、us-east1-c
或us-east1-d
- 区域:
us-east1
- 可用区:
集群正在运行。
集群不是 Alpha 版集群。
集群没有关联的 Backup for GKE 备份方案。
评估集群是否需要使用 Backup for GKE 进行数据保护
请考虑以下标准来评估是否应使用 Backup for GKE 备份集群:
- 运行有状态应用:有状态应用会保留容易丢失和损坏的状态。备份可以最有效地防范由于可用区级、区域级、工作负载或用户引发的故障而导致的中断。
- 快速应用回滚非常重要:在发生故障、升级失败或损坏时,将有状态和无状态应用恢复到已知的健康状态。与重新部署应用相比,从备份恢复通常可以缩短恢复时间。 通过备份,您可以存储多个时间点,以提高灵活性。
- 需要保护免受网络攻击:通过创建不可变的加密备份,并在最短时间内锁定这些备份以防止删除,为网络攻击威胁的影响做好准备。
有状态工作负载和无状态工作负载都可以从备份中受益。如果一个或多个条件适用于您的集群,请考虑配置备份。
如何处理建议
如果您确定应该启用 Backup for GKE 并为集群创建备份方案,请按照以下说明操作: