Google 的主要支持目标是尽快解决生产突发事件。我们通过了解您的配置、分析日志和指标以及与合作伙伴协作来快速解决突发事件。
Google Cloud 提供各种支持套餐,以满足您的支持需求。所有 Google Cloud 支持套餐都支持 Google Kubernetes Engine (GKE) Enterprise 版本和 Google Distributed Cloud。如果您已有 Google Cloud 支持套餐,则表示您已获得对 Google Kubernetes Engine (GKE) Enterprise 版本和 Google Distributed Cloud 的支持。
如需了解详情,请参阅 Google Cloud 支持文档。
Google Distributed Cloud 支持的要求
如需有效地排查关键业务突发事件,您必须:
- 使用已发布的支持结束时间范围检查环境是否为最新环境(请参阅下面的版本支持政策)。
- 为系统组件启用 Cloud Logging 和 Cloud Monitoring(如需了解详情,请参阅支持工具部分)。
- 创建支持案例时,请使用
gkectl diagnose snapshot
命令提供配置快照。
支持工具
Google Cloud 支持团队依据以下三项信息来有效地对关键业务突发事件进行问题排查:
- 您的环境的配置
- 来自您的管理员集群和用户集群的日志
- 来自您的管理员集群和用户集群的指标
配置
创建支持案例时,系统会要求您运行 gkectl diagnose snapshot --seed-config
命令并将生成的 tar 归档文件附加到支持案例。gkectl diagnose snapshot --seed-config
捕获有关 Kubernetes 和节点的信息。
该工具可灵活地进行配置,并包含若干预定义方案。您还可以传递 YAML 文件,其中包含要收集的自定义信息集。如需了解详情,请参阅诊断集群。
您可以在配置文件中添加 excludeWords
字段,以忽略敏感或机密信息。请务必仔细查看该工具捕获的信息。不要在支持案例中附加高度机密或敏感信息。
日志
创建新集群时,系统会默认启用 Cloud Logging 代理,并将其范围仅限定于系统级组件。这会将系统级日志复制到与集群关联的 Google Cloud 项目中。系统级日志来自在以下五个命名空间之一中运行的 Kubernetes pod:
- kube-system
- gke-system
- gke-connect
- istio-system
- config-management-system
- knative-serving
您可以通过 Cloud Logging 控制台查询日志。
如需了解详情,请参阅日志记录和监控。
指标
除了日志之外,Cloud Monitoring 代理还会捕获指标。这会将系统级指标复制到与集群关联的 Google Cloud 项目中。系统级指标来自在日志中列出的同一命名空间中运行的 Kubernetes pod。
如需了解详情,请参阅日志记录和监控。
Google Cloud CLI 和远程集群访问
如果您创建了支持请求,Cloud Customer Care 可能会要求您对集群进行远程只读访问,以帮助更有效地诊断和解决问题。为了使支持团队具有足够的访问权限来远程排查集群问题,请执行以下操作:
确保已安装并更新为 Google Cloud CLI 的最新版本。Google Cloud CLI 的版本必须为 401.0.0 或更高,才能为 Cloud Customer Care 提供所需的权限。我们建议您定期更新 Google Cloud CLI,以获取额外的权限和其他增强功能。 如需安装 gcloud CLI 的最新组件,请使用
gcloud components update
命令。确保目标集群已注册,并且您有项目 ID、成员资格名称和 kubeconfig 文件。
如需获取用户集群 kubeconfig,请参阅如何重新创建用户集群 kubeconfig。
您的成员资格名称与集群名称相同。如需获取管理员或用户集群名称,您可以使用以下命令:
gkectl list admin --kubeconfig ADMIN_CLUSTER_KUBECONFIG gkectl list clusters --kubeconfig ADMIN_CLUSTER_KUBECONFIG
如需授予集群的访问权限,请运行 gcloud CLI 命令以生成并显示一组 Kubernetes 基于角色的访问权限控制 (RBAC) 政策并将其应用于目标集群。请参阅提前查看 RBAC 政策。
如需详细了解如何向 Cloud Customer Care 授予集群的远程只读权限,请参阅针对已注册集群的 Google Cloud 支持。
我们如何对您的环境进行问题排查
以下是典型支持突发事件的一个示例:
有人(例如集群管理员)在 Google Cloud 控制台或 Google Cloud 支持中心创建了一个支持请求。
在控制台中,前往支持概览页面。
在支持信息部分,点击获取帮助。
在选择您的产品字段中,输入以下内容:
Google Distributed Cloud Virtual - vSphere (Anthos on VMWare)
点击匹配产品列表中的相应项目,然后点击选择。
输入所需信息,并将
gkectl diagnose snapshot
的输出附加到支持请求。
支持请求会转交至专门负责 Google Distributed Cloud for VMware(纯软件)的技术支持工程师。
支持工程师检查快照的内容,以获取环境的上下文。
支持工程师检查 Google Cloud 项目中的日志和指标,输入支持支持请求 ID 作为正当的业务理由,并在内部记录。
支持工程师会以评估和建议的形式回应案例。支持工程师和用户继续排查问题,直到找到解决方案。
协作支持合作伙伴
Google 与经过挑选的合作伙伴保持协作支持关系,以提供更顺畅的支持体验。通过这些合作关系,Google 能够代表共同客户与该合作伙伴密切合作。
如需获得协作支持的好处,您必须与 Google 和相关合作伙伴签署支持协议。
Google 与协作支持合作伙伴页面上指定的合作伙伴建立了协作支持关系。
如 Google 的技术支持服务准则所述,Google 可能会与协作支持合作伙伴共享支持问题的相关数据。
Google 提供什么支持?
一般情况下,Cloud 支持团队支持作为 Google Distributed Cloud for VMware(纯软件)的一部分提供的所有软件组件。下表对此进行了进一步详细说明:
Google Cloud 支持 | 协作支持 | 不支持 |
---|---|---|
Kubernetes 和容器运行时环境 |
VMware vSphere(vCenter Server 和 ESXi) |
vSphere 以外的 VMware 产品 |
用于访客/节点操作系统的 Canonical Ubuntu |
F5 BIG-IP 负载均衡器 |
客户代码(请参阅下面的开发者支持) |
vCenter 控制器 |
协作支持合作伙伴页面中列出的硬件和超融合基础架构解决方案 |
客户选择的主机操作系统 |
F5 控制器 |
物理服务器、存储和网络 |
|
Calico 及相关网络政策 |
外部 DNS、DHCP 和身份系统 |
|
Ingress 控制器 |
Calico Enterprise Edition |
|
Prometheus 和 Grafana |
||
Stackdriver Monitoring、Stackdriver Logging、Stackdriver 代理 |
||
与 OIDC 合规提供方联合的身份验证 |
||
Hub、Connect、Connect Agent |
||
Knative serving / Knative |
||
捆绑式 LoadBalancer (Seesaw) |
版本支持政策
针对 Google Distributed Cloud 的支持遵循 GKE Enterprise 支持政策。Google 为每个 Google Distributed Cloud 次要版本提供以下时间段内的支持(以较晚者为准):
- 次要版本首次发布后的 12 个月。
- 发布第三个后续次要版本。
支持的功能
本文档列出了受支持版本的 Google Distributed Cloud 功能。此表格并不是详尽的列表,而是重点介绍将集群升级到受支持的最新版本的一些优势。
功能按其产品发布阶段(预览版或正式版)列出。列为预览版的功能受《Google Cloud 服务条款》的正式发布前产品条款约束。预览版产品仅适用于测试环境,并且可能具有有限支持。对正式发布前产品和功能的变更可能与其他正式发布前版本不兼容。正式版功能面向所有客户开放,具有完全支持。如需了解详情,请参阅产品发布阶段。
如需了解受支持的 GKE Enterprise 组件及其兼容性,请参阅 GKE Enterprise 版本和升级支持。
责任共担模型
在 Google Distributed Cloud 上运行关键业务生产应用需要多方承担不同的责任。GKE Enterprise 共担责任中对这些责任进行了说明。
开发者支持
Google 不会专门针对您的应用工作负载提供支持。但是,我们会尽最大努力为开发者提供支持,以确保开发者可以在使用 Google Distributed Cloud 创建的集群上运行应用。我们认为,在开发过程中尽早采取行动有助于避免部署时发生重大突发事件。
这个尽最大努力的开发者支持可供使用付费支持套餐的客户使用,并且会被视为 P3 优先级(阻止发布的问题)或 P4 优先级(一般咨询)。在此分类中,优先级 0 是最高优先级。