获取支持

Google 的主要支持目标是尽快解决生产突发事件。我们通过了解您的配置、分析日志和指标以及与合作伙伴协作来快速解决突发事件。

Google Cloud 提供多种支持套餐来满足您的支持需求。所有 Google Cloud 支持套餐都支持 Anthos 和 Anthos GKE On-Prem(GKE On-Prem)。如果您已有 Google Cloud 支持套餐,则表示您已经支持 Anthos 和 GKE On-Prem。

如需了解详情,请参阅 Google Cloud 支持文档。

GKE On-Prem 支持的要求

要有效地排查关键业务突发事件,您必须:

  1. 使用已发布的支持结束时间范围检查环境是否为最新环境(请参阅下面的版本支持政策)。
  2. 为系统组件启用 Cloud Logging 和 Cloud Monitoring(如需了解详情,请参阅支持工具部分)。
  3. 创建支持案例时,请使用 gkectl diagnose snapshot 命令提供配置快照。

支持工具

要排查 GKE On-Prem 突发事件,Google Cloud 支持需要依据以下三项信息:

  • 您的环境的配置
  • 来自您的管理员集群和用户集群的日志
  • 来自您的管理员集群和用户集群的指标

配置

打开支持案例时,系统会要求您运行 gkectl diagnose snapshot --seed-config 命令并将生成的 tar 压缩文件附加到支持案例。gkectl diagnose snapshot --seed-config 捕获有关 Kubernetes 和节点的信息。

该工具可进行高度配置,并且包含多个预定义方案。您还可以传递带有要收集的自定义信息集的 YAML 文件。如需了解详情,请参阅诊断集群

您可以在配置文件中添加 excludeWords 字段,以忽略敏感或机密信息。请务必仔细查看该工具捕获的信息。高度机密或敏感信息不应附加到您的支持案例中。

日志

创建新的 GKE On-Prem 集群时,系统会默认启用 Cloud Logging 代理,并将其范围限定于系统级组件。这会将系统级日志复制到与集群关联的 Google Cloud 项目中。系统级日志来自在以下五个命名空间之一中运行的 Kubernetes pod:

  • kube-system
  • gke-system
  • gke-connect
  • istio-system
  • config-management-system
  • knative-serving

您可以通过 Cloud Logging 控制台查询日志。

如需了解详情,请参阅日志记录和监控

指标

除了日志之外,Cloud Monitoring 代理还会捕获指标。这会将系统级指标复制到与集群关联的 Google Cloud 项目中。系统级指标来自在日志中列出的相同命名空间中运行的 Kubernetes pod。

如需了解详情,请参阅日志记录和监控

我们如何对您的环境进行问题排查

以下是典型支持突发事件的示例:

  1. 有人(例如集群管理员)通过 Cloud Console 或 Google Cloud 支持中心打开支持案例,然后分别选择 AnthosGKE On-Prem 作为类别和组件。他们输入所需信息,并将 gkectl diagnose snapshot 的输出附加到案例。
  2. 支持案例将转交专门从事 GKE On-Prem 的技术支持工程师。
  3. 支持工程师会检查快照的内容,以获取环境的上下文。
  4. 支持工程师检查 Google Cloud 项目中的日志和指标,输入支持案例 ID 作为业务理由,并在内部记录。
  5. 支持工程师通过评估和建议来回应案例。支持工程师和用户会继续排查问题,直到找到解决方案。

协作支持合作伙伴

Google 与选定的合作伙伴保持协作支持关系,以便为 GKE On-Prem 提供更顺畅的支持体验。通过这些合作关系,Google 能够代表我们的共享客户与该合作伙伴密切合作。

要获得协作支持的好处,您必须与 Google 和相关合作伙伴保持支持协议。

Google 目前与协作支持合作伙伴页面上指定的合作伙伴建立了协作支持关系。

Google 的技术支持服务准则中所述,可能会与协作支持合作伙伴分享有关支持问题的数据。

Google 支持哪些内容?

一般情况下,Cloud 支持小组会支持作为 GKE On-Prem 以及开放源代码 Istio 的一部分提供的所有软件组件。下表对此进行了详细说明:

GCP 支持 协作支持 不支持
Kubernetes 和容器运行时环境
VMware vSphere(vCenter Server 和 ESXi)
vSphere 以外的 VMware 产品
规范化 Ubuntu,用于访客/节点操作系统
F5 BIG-IP 负载平衡器
客户代码(请参阅下面的开发者支持
vCenter 控制器
协作支持合作伙伴页面中列出的硬件和超融合基础架构解决方案
客户选择主机操作系统
F5 控制器

物理服务器,存储和网络
Calico 及相关网络政策

外部 DNS,DHCP 和身份系统
入站流量控制器

Calico 企业版
Prometheus 和 Grafana
Stackdriver Monitoring,Stackdriver Logging 和 Stackdriver 代理
与符合 OIDC 的提供商的身份联合
Hub,Connect 和 Connect Agent
开放源代码 Istio
Cloud Run / Knative

版本支持政策

要了解总体版本支持政策,请参阅 Anthos 支持页面

责任共担模型

在 GKE On-Prem 上运行关键业务生产应用需要多方承担不同的责任。虽然不是一个详尽的列表,但以下部分列出了角色和责任。

Google 的责任

  • 维护和分发 GKE On-Prem 软件包,包括 Kubernetes,vCenter 和 F5 控制器,入站流量控制器,Connect 和 Stackdriver 代理,以及 gkectl 命令行工具。
  • 维护和分发 Ubuntu 管理员工作站和节点机器映像,包括定期修补和安全修复。
  • 通知用户 GKE On-Prem 的可用升级,并为之前的版本生成升级脚本;GKE On-Prem 仅支持顺序升级(仅支持 1.2→1.3→1.4,而不支持 1.2→1.4)。
  • 运行 Connect 和 Stackdriver 服务。
  • 进行问题排查,提供解决办法以及纠正与 Google 提供的组件相关的任何问题的根本原因

用户责任

  • 本地集群的整体系统管理。
  • 维护部署在集群上的所有应用工作负载。
  • 运行,维护和修补数据中心基础架构,包括网络,服务器,存储以及与 Google Cloud 的连接。
  • 运行,维护和修补 vSphere 及网络负载平衡器。
  • 维护与 VMware 和 F5(如果已部署)的支持合同。
  • 定期升级 GKE On-Prem 版本。
  • 使用 Ubuntu 补丁程序测试和部署更新的节点机器映像。
  • 监控集群和应用,并响应任何突发事件。
  • 确保 Cloud Logging 和 Stackdriver 代理已部署到集群。
  • 向 Google 提供环境详细信息,以便进行问题排查。

开发者支持

Google 不为在 GKE On-Prem 上运行的应用工作负载提供支持。但是,我们会尽最大努力为开发者提供支持,以确保您的开发者可以轻松地在 GKE On-Prem 上运行应用。我们认为,在开发过程中尽早采取行动有助于避免部署后的重大突发事件。

此开发者支持为使用付费支持套餐的客户提供,它被视为阻止发布问题的 P3 或一般咨询的 P4。