Google 的主要支持目标是尽快解决生产突发事件。我们通过了解您的配置、分析日志和指标以及与合作伙伴协作来快速解决突发事件。
Google Cloud 提供各种支持套餐,以满足您的支持需求。所有 Google Cloud 支持套餐都支持 Anthos。如果您已拥有 Google Cloud 支持套餐,则表示您已获得对 Anthos 的支持。
如需了解详情,请参阅 Google Cloud 支持文档。
Anthos 支持要求
如需有效地对关键业务突发事件进行问题排查,您必须:
支持工具
为了对 Anthos 突发事件进行问题排查,Google Cloud 支持团队依赖于您的集群中的环境配置和日志。您可以使用 actl diagnose
命令捕获集群的状态,并将此信息打包到 tar 归档文件中,以便提供给支持团队。请参阅诊断集群问题。
我们如何对您的环境进行问题排查
以下是典型支持突发事件的一个示例:
- 有人(例如平台管理员)向在断开连接模式下运行的 Anthos 基础架构运维者发起了支持请求。
- 基础架构运维者提供 1 级支持,包括参考文档、方法指南和一般性产品问题。
- 平台管理员会捕获相关系统组件在相应时间范围内的诊断系统快照。平台管理员还会清理快照数据以消除其中的所有敏感信息,并与基础架构运维者共享快照。基础架构运维者还可以截取快照来检索其他调试信息。
- 如果问题未得到解决,基础架构运维者还提供第 2 级支持,这包括使用遥测功能和系统快照分析以及/或者使用策略方案来执行基本问题排查,从而解决常见问题。
- 对于更为复杂的问题,基础架构运维者会向 Google Cloud 支持团队发起工单,并与 Google 支持团队分享清理后的系统快照。
- 支持案例转交至专门负责在断开连接模式下运行的 Anthos 的技术支持工程师,该工程师了解产品实现和架构,并可确定新问题的根本原因。
- 技术支持工程师会检查诊断快照的内容,以获取环境的上下文。技术支持工程师还会检查日志和指标,并在工单中捕获分析和上下文数据。支持工程师可能会要求获取其他信息(例如相关
actl
命令的输出)并将它们附加到支持请求。 - 技术支持工程师还可以根据需要与 Google 工程团队合作,以寻找更为复杂的问题的解决方案,包括问题修复和实现更改。
- 支持工程师会以评估和建议的形式回应案例。支持工程师和在断开连接模式下运行的 Anthos 基础架构运维者会继续排查问题,直到找到解决方案。
Google 提供什么支持?
通常,Cloud 支持团队支持作为 Anthos Service Mesh 和 Anthos Config Management 的一部分提供的所有软件组件。下表对此进行了详细说明:
支持 Google Cloud | 不支持 |
---|---|
Kubernetes 和容器运行时环境 | 客户对负载平衡器的选择(手动负载平衡) |
Anthos on Bare Metal 集群 | 客户代码(请参阅下面的开发者支持) |
使用 Prometheus、Loki 和 Grafana 进行的监控和日志记录 | 客户选择的操作系统 |
捆绑式负载均衡器 (MetalLB) | 物理或虚拟服务器、存储和网络 |
Ingress 控制器 | 外部 DNS、DHCP 和身份系统 |
Anthos Identity Service | |
Anthos Service Mesh | |
Anthos Config Management |
版本支持政策
如需了解整体版本支持政策,请参阅 Anthos 支持页面
责任共担模型
在 Anthos 集群上运行关键业务生产应用需要多方承担不同的责任。以下部分列出了角色和相应的责任(未详尽列出)。
Google 的责任
- 维护和分发在断开连接模式下运行的 Anthos 软件包。
- 通知用户在断开连接模式下运行的 Anthos 有可用升级,并为之前的版本生成升级脚本;在断开连接模式下运行的 Anthos 仅支持依序升级(例如:1.2 → 1.3 → 1.4,不支持 1.2 → 1.4)。
- 针对与 Google 提供的组件相关的任何问题,进行问题排查、提供解决办法以及纠正根本原因
在断开连接模式下运行的 Anthos 基础架构运维者的责任
- 本地管理员集群的整体系统管理。
- 运行、维护和修补数据中心基础架构,包括网络、服务器、操作系统和存储空间。
- 定期升级在断开连接模式下运行的 Anthos 版本。
- 监控集群,响应任何突发事件,并为客户提供 L1 和 L2 级支持。
- 清理诊断系统快照、配置和日志,并确保不与 Google 共享任何敏感数据。
- 向 Google 提供环境详细信息,以便进行问题排查。
在断开连接模式下运行的 Anthos 平台管理员的责任
- 本地用户集群的整体系统管理。
- 运行、维护和修补应用工作负载。
- 根据需要监控应用工作负载和集群运行状况以及日志记录系统的活动,以符合合规性规定。
- 清理诊断系统快照、配置和日志,并确保不与 Google 共享任何敏感数据。
- 向 Google 提供环境详细信息,以便进行问题排查。
开发者支持
Google 不为在 Anthos 上运行的应用工作负载提供支持。但是,我们会尽最大努力为开发者提供支持,以确保开发者可在 Anthos 上轻松运行应用。我们认为,在开发过程中尽早采取行动有助于避免部署时发生重大突发事件。
此开发者支持可供使用付费支持套餐的客户使用,而且会被视为 P3 优先级(表示阻止发布的问题)或 P4 优先级(一般咨询)。