跳转到

GKE 的投产后运维

帮助客户简化 GKE 平台的运维方式,并制定有效的监控和管理策略。 如需安排实操研讨会,请联系您的 Google Cloud 客户支持团队。

优势

简化运维,以经济实惠的方式管理平台

全面的解决方案

Google Cloud 的投产后运维解决方案提供了一种端到端的方法来管理、监控 GKE 平台以及进行问题排查,以保证满足所需的服务等级协议 (SLA)。

最小化运营风险

简化和标准化平台升级,使 GKE 集群不会长时间处于过时的平台版本上并面临安全事故和相关漏洞的威胁。

降低运营成本

组织可以采用统一方法来监控和管理其各种 GKE 环境,从而降低运营费用。

主要特性

实操研讨会:GKE 的投产后运维

我们的解决方案使用实操研讨会,帮助客户了解 GKE 的投产后策略。下面介绍了研讨会的某些方面。

使用 Pub/Sub 的 GKE 集群通知

当发生与 GKE 集群相关的特定事件(例如重要的计划升级或可用的安全公告)时,GKE 可以将有关这些事件的集群通知作为消息发布到 Pub/Sub 主题。您可以在 Pub/Sub 订阅上接收这些通知,与第三方服务集成,并且可以过滤要接收的通知类型。

GKE 发布渠道和集群升级

默认情况下,系统会为 Google Kubernetes Engine (GKE) 集群和节点池启用自动升级节点。GKE 发布渠道让您能够平衡集群中所部署版本的稳定性和功能集。当您在发布渠道中注册新集群时,Google 会自动管理集群及其节点池的版本和升级频率。

GKE 维护窗口和排除项

维护窗口是允许进行自动维护的重复性时间段。维护排除项是禁止进行自动维护的非重复性时间段。两者可精细控制何时可以对 GKE 集群进行自动维护。

GKE 节点池更新

节点池代表集群中节点的子集;容器集群可包含一个或多个节点池。动态配置更改限于网络标记、节点标签和节点污点。UpdateNodePool API 中的任何其他字段更改都不会动态进行,并且将导致重新创建节点。

GKE 备份和恢复

Backup for GKE 是一项用于在 GKE 集群中备份和恢复工作负载的服务。工作负载的备份可用于灾难恢复、CI/CD 流水线、克隆工作负载或升级场景。保护工作负载可以帮助您实现业务关键型恢复点目标。


准备好开始使用了吗?与我们联系