Google 的主要支持目标是尽快解决生产突发事件。我们通过了解您的配置、分析日志和指标以及与合作伙伴协作来快速解决突发事件。
Google Cloud 提供各种支持套餐,以满足您的支持需求。所有 Google Cloud 支持套餐都包含对 Anthos 和 Anthos clusters on Bare Metal 的支持。如果您已有 Google Cloud 支持套餐,则表示您已获得对 Anthos 和 Anthos clusters on Bare Metal 的支持。
如需了解详情,请参阅 Google Cloud 支持文档。
针对 Anthos clusters on Bare Metal 支持的要求
如需有效地对关键业务突发事件进行问题排查,您必须:
- 检查您的环境是否最新,以及是否在发布的支持终止时限内。如需了解详情,请参阅版本支持政策部分。
- 为系统组件启用 Cloud Logging 和 Cloud Monitoring。如需了解详情,请参阅以下支持工具部分。
支持工具
Google Cloud 支持团队依据以下三项信息对 Anthos clusters on Bare Metal 突发事件进行问题排查:
您的环境配置
创建支持案例时,运行以下命令可提供有关集群设置的关键信息:
对于所有集群类型,运行
bmctl check cluster --snapshot
命令来捕获 Kubernetes 和节点的相关信息。将生成的 tar 压缩文件附加到支持案例。对于管理员集群、混合集群和独立集群,运行
bmctl check cluster
命令来检查集群和节点的运行状况。将生成的日志附加到支持案例。这些日志应位于bmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP]
目录下。对于用户集群,首先创建包含集群名称和命名空间的健康检查 YAML 文件,然后在适当的管理员集群中应用该文件:
使用以下
healthcheck
属性创建 YAML 文件。以下是cluster-user1
命名空间中名为user1
的集群的示例内容:apiVersion: baremetal.cluster.gke.io/v1 kind: HealthCheck metadata: generateName: healthcheck- namespace: cluster-user1 spec: clusterName: user1
创建 YAML 文件后,请使用
kubectl
命令在管理用户集群的管理员集群中应用自定义资源。下面是一个在上一步中创建的使用 YAML 文件的示例命令。在此示例中,ADMIN_KUBECONFIG
变量指定了管理员集群的 kubeconfig 文件的路径:kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml
该命令会返回以下响应:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
通过测试健康检查作业是否已完成调整,等待健康检查作业完成。在前面的示例案例中,健康检查作业名称为
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf
。下面是一个使用kubectl
命令的示例测试,该命令将等待 30 分钟,直到健康检查作业完成为止:kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \ -n cluster-user1 --for=condition=Reconciling=False --timeout=30m
完成后,此命令会返回以下内容:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
您可以使用以下命令查看健康检查作业结果:
kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \ -n cluster-user1
该命令会返回以下结果:
NAME PASS AGE healthcheck-7c4qf true 17m
使用
kubectl
命令将所有健康检查作业 pod 的日志收集到本地文件中。下面是一个使用上一个示例健康检查作业的示例:kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \ -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \ healthcheck-7c4qf.log
集群日志
当您创建新的 Anthos clusters on Bare Metal 集群时,系统会默认启用 Cloud Logging 代理,并将其范围限定于系统级组件。这会将系统级日志复制到与集群关联的 Google Cloud 项目中。系统级日志来自以下命名空间中的 Kubernetes pod:
kube-system
gke-system
gke-connect
istio-system
config-management-system
gatekeeper-system
cnrm-system
knative-serving
您可以通过 Cloud Logging 控制台查询日志。
如需了解详情,请参阅日志记录和监控。
集群指标
除了日志之外,Cloud Monitoring 代理还会捕获指标。这会将系统级指标复制到与集群关联的 Google Cloud 项目中。系统级指标来自在日志中列出的同一命名空间中运行的 Kubernetes pod。
如需了解详情,请参阅日志记录和监控。
我们如何对您的环境进行问题排查
以下是典型支持突发事件的一个示例:
- 有人(例如集群管理员)通过 Google Cloud 控制台或 Google Cloud 支持中心创建了一个支持请求,然后分别选择 Anthos 和 Anthos clusters on Bare Metal 作为类别和组件。他们输入所需信息,并将相关
bmctl
命令的输出附加到该案例。 - 支持案例转交至专门负责 Anthos clusters on Bare Metal 的技术支持工程师。
- 支持工程师检查快照的内容,以获取环境的上下文。
- 支持工程师检查 Google Cloud 项目中的日志和指标,输入支持支持请求 ID 作为正当的业务理由,并在内部记录。
- 支持工程师会以评估和建议的形式回应案例。支持工程师和用户继续排查问题,直到找到解决方案。
Google 提供什么支持?
一般情况下,Cloud 支持团队支持作为 Anthos clusters on Bare Metal 以及 Anthos Service Mesh 和 Anthos Config Management 一部分提供的所有软件组件。下表对此进行了详细说明:
支持 Google Cloud | 不支持 |
---|---|
Kubernetes 和容器运行时环境 | 客户对负载平衡器的选择(手动负载平衡) |
Connect 和 Connect Agent | 客户代码(请参阅下面的开发者支持) |
Google Cloud 操作、监控、日志记录和代理 | 客户选择的操作系统 |
捆绑的负载平衡器 | 物理或虚拟服务器、存储和网络 |
Ingress 控制器 | 外部 DNS、DHCP 和身份系统 |
Anthos Identity Service | |
Anthos Service Mesh | |
Anthos Config Management |
版本支持政策
对 Anthos clusters on Bare Metal 的支持遵循 Anthos 版本支持政策。Google 支持 Anthos clusters on Bare Metal 的当前版本和前两个 (n-2) 次要版本。
下表显示了此产品支持和不支持的版本。
次要版本 | 发布日期 | 最早服务终止日期 | 可用的补丁程序 | Kubernetes 版本 |
---|---|---|---|---|
1.15(最新) | 2023 年 4 月 27 日 | 2024 年 4 月 27 日 | 1.15.3 | v1.26.5-gke.2100 |
1.15.2 | v1.26.5-gke.1200 | |||
1.15.1 | v1.26.2-gke.1001 | |||
1.15.0 | v1.26.2-gke.1001 | |||
1.14 | 2022 年 12 月 8 日 | 2023 年 12 月 8 日 | 1.14.7 | v1.25.10-gke.2100 |
1.14.6 | v1.25.10-gke.1200 | |||
1.14.5 | v1.25.7-gke.1000 | |||
1.14.4 | v1.25.7-gke.1000 | |||
1.14.3 | v1.25.6-gke.1000 | |||
1.14.2 | v1.25.5-gke.1001 | |||
1.14.1 | v1.25.5-gke.1001 | |||
1.14.0 | v1.25.3-gke.1400 | |||
1.13 | 2022 年 9 月 29 日 | 2023 年 8 月 17 日 | 1.13.10 | v1.24.14-gke.2100 |
1.13.9 | v1.24.14-gke.1200 | |||
1.13.8 | v1.24.11-gke.1000 | |||
1.13.7 | v1.24.11-gke.1000 | |||
1.13.6 | v1.24.9-gke.2500 | |||
1.13.5 | v1.24.9-gke.2500 | |||
1.13.4 | v1.24.9-gke.2500 | |||
1.13.3 | v1.24.7-gke.1700 | |||
1.13.2 | v1.24.7-gke.300 | |||
1.13.1 | v1.24.5-gke.400 | |||
1.13.0 | v1.24.2-gke.1900 | |||
1.12(不支持) | 2022 年 6 月 29 日 | 2023 年 3 月 29 日 | 1.12.9 | v1.23.17-gke.300 |
1.12.8 | v1.23.16-gke.100 | |||
1.12.7 | v1.23.15-gke.2400 | |||
1.12.6 | v1.23.13-gke.1700 | |||
1.12.5 | v1.23.13-gke.1700 | |||
1.12.4 | v1.23.11-gke.500 | |||
1.12.3 | v1.23.10-gke.1000 | |||
1.12.2 | v1.23.5-gke.1505 | |||
1.12.1 | v1.23.5-gke.1505 | |||
1.12.0 | v1.23.5-gke.1504 | |||
1.11(不支持) | 2022 年 3 月 21 日 | 2022 年 12 月 21 日 | 1.11.8 | v1.22.15-gke.3300 |
1.11.7 | v1.22.14-gke.500 | |||
1.11.6 | v1.22.8-gke.204 | |||
1.11.5 | v1.22.8-gke.204 | |||
1.11.4 | v1.22.8-gke.204 | |||
1.11.3 | v1.22.8-gke.203 | |||
1.11.2 | v1.22.8-gke.200 | |||
1.11.1 | v1.22.8-gke.200 | |||
1.11.0 | v1.22.8-gke.200 | |||
1.10(不支持) | 2021 年 12 月 10 日 | 2022 年 9 月 10 日 | 1.10.8 | v1.21.13-gke.202 |
1.10.7 | v1.21.13-gke.202 | |||
1.10.6 | v1.21.13-gke.201 | |||
1.10.5 | v1.21.6-gke.1503 | |||
1.10.4 | v1.21.6-gke.1503 | |||
1.10.3 | v1.21.5-gke.1300 | |||
1.10.2 | v1.21.5-gke.1300 | |||
1.10.1 | v1.21.5-gke.1200 | |||
1.10.0 | v1.21.5-gke.1200 | |||
1.9(不受支持) | 2021 年 9 月 23 日 | 2022 年 6 月 23 日 | 1.9.8 | v1.21.13-gke.200 |
1.9.7 | v1.21.6-gke.1503 | |||
1.9.6 | v1.21.5-gke.1300 | |||
1.9.5 | v1.21.5-gke.1300 | |||
1.9.4 | v1.21.5-gke.1200 | |||
1.9.3 | v1.21.5-gke.1200 | |||
1.9.2 | v1.21.4-gke.201 | |||
1.9.1 | v1.21.4-gke.201 | |||
1.9.0 | v1.21.4-gke.200 | |||
1.8(不支持) | 2021 年 6 月 21 日 | 2022 年 3 月 21 日 | 1.8.9 | v1.20.9-gke.102 |
1.8.8 | v1.20.9-gke.102 | |||
1.8.7 | v1.20.9-gke.102 | |||
1.8.6 | v1.20.9-gke.102 | |||
1.8.5 | v1.20.9-gke.102 | |||
1.8.4 | v1.20.9-gke.101 | |||
1.8.3 | v1.20.9-gke.101 | |||
1.8.2 | v1.20.8-gke.1500 | |||
1.8.1 | v1.20.5-gke.1301 | |||
1.8.0 | v1.20.5-gke.1301 | |||
1.7(不支持) | 2021 年 3 月 25 日 | 2021 年 12 月 25 日 | 1.7.7 | v1.19.14-gke.2201 |
1.7.6 | v1.19.14-gke.2201 | |||
1.7.5 | v1.19.14-gke.2201 | |||
1.7.4 | v1.19.14-gke.400 | |||
1.7.3 | v1.19.13-gke.100 | |||
1.7.2 | v1.19.10-gke.1602 | |||
1.7.1 | v1.19.7-gke.1200 | |||
1.7.0 | v1.19.7-gke.1200 | |||
1.6(不支持) | 2020 年 11 月 30 日 | 2021 年 8 月 30 日 | 1.6.4 | v1.18.20-gke.3000 |
1.6.3 | v1.18.18-gke.100 | |||
1.6.2 | v1.18.6-gke.6600 | |||
1.6.1 | v1.18.6-gke.6600 | |||
1.6.0 | v1.18.6-gke.6600 |
如需获取新增功能和性能,请升级到 Anthos clusters on Bare Metal 1.9 版。如需了解如何升级,请参阅升级 Anthos on Bare Metal。
支持的功能
本文档列出了适用于支持的 Anthos clusters on Bare Metal 版本的特性和功能的可用性。此表并不是详尽的列表,而是重点介绍将集群升级到受支持的最新版本的一些优势。
列为预览版的功能受 Google Cloud 服务条款的正式发布前产品条款约束。对正式发布前产品和功能的支持可能有限,并且对正式发布前产品和功能的更改可能不兼容其他正式发布前版本。如需了解详情,请参阅发布阶段说明。预览版产品仅适用于测试环境。
列为正式版 (GA) 的功能完全受支持,面向所有客户开放,并已准备好在生产环境中使用。
功能/能力 | 1.12(不支持) | 1.13 | 1.14 | 1.15(最新) |
---|---|---|---|---|
提醒政策 | 预览 | 预览 | 预览 | 预览 |
Anthos 虚拟机运行时 | GA | GA | GA | GA |
Azure Active Directory (AD) 群组 | 不可用 | 不可用 | GA | GA |
Binary Authorization | 不可用 | 不可用 | 不可用 | 预览 |
使用 BGP 进行捆绑式负载均衡 | GA | GA | GA | GA |
Cloud Audit Logs | GA | GA | GA | GA |
集群备份和恢复 CLI 支持 | GA | GA | GA | GA |
集群证书授权机构 (CA) 轮替 | GA | GA | GA | GA |
集群节点重置 CLI 支持 | GA | GA | GA | GA |
containerd 容器运行时 | GA | GA | GA | GA |
对照组 v2 | 不可用 | 不可用 | 预览 | GA |
使用边界网关协议 (BGP) 的动态平面 IP | 预览 | GA | GA | GA |
出站流量 NAT 网关 | GA | GA | GA | GA |
平面 IPv4 模式(静态) | GA | GA | GA | GA |
平面 IPv6 支持(BGP 模式) | 预览 | GA | GA | GA |
基于 BGP 的负载均衡器对 IPv6 的支持 | 预览 | GA | GA | GA |
IPv4/IPv6 双栈 | GA | GA | GA | GA |
KSA 支持 | GA | GA | GA | GA |
Google Cloud Managed Service for Prometheus 的代管式收集器 | 预览 | GA | GA | GA |
多集群连接 | 预览 | 预览 | 预览 | 预览 |
Pod 的多 NIC | GA | GA | GA | GA |
Network Connectivity Gateway | 预览 | 预览 | 预览 | 预览 |
节点问题检测器 | GA | GA | GA | GA |
注册表镜像支持 | 预览 | GA | GA | GA |
安全计算模式 (seccomp) | 预览 | 预览 | GA | GA |
SR-IOV 网络 | GA | GA | GA | GA |
摘要 API 指标 | GA | GA | GA | GA |
Workload Identity | GA | GA | GA | GA |
VPC Service Controls | 不可用 | 不可用 | 不可用 | 预览 |
并行节点升级 | 不可用 | 不可用 | 预览 | GA |
责任共担模型
在 Anthos clusters on Bare Metal 上运行关键业务生产应用需要多方承担不同的责任。以下部分列出了角色和相应的责任(未详尽列出)。
Google 的责任
- 维护和分发 Anthos clusters on Bare Metal 软件包
- 通知用户 Anthos clusters on Bare Metal 的可用升级,并为之前的版本生成升级脚本;Anthos clusters on Bare Metal 仅支持依序升级(示例:1.2 → 1.3 → 1.4,不支持 1.2 → 1.4)。
- 运行 Connect 和 Cloud Operations 服务。
- 针对与 Google 提供的组件相关的任何问题,进行问题排查、提供解决办法以及纠正根本原因
用户的责任
- 本地集群的整体系统管理。
- 维护部署在集群上的所有应用工作负载。
- 运行、维护和修补数据中心基础架构,包括网络、服务器、操作系统、存储以及与 Google Cloud 的连接。
- 如果选择了手动负载均衡器选项,则需要运行、维护和修补网络负载均衡器。
- 定期升级 Anthos clusters on Bare Metal 版本。
- 监控集群和应用,并响应任何突发事件。
- 确保 Cloud Operations 代理已部署到集群。
- 向 Google 提供环境详细信息,以便进行问题排查。
开发者支持
Google 不为 Anthos clusters on Bare Metal 上运行的应用工作负载提供支持。但是,我们会尽最大努力为开发者提供支持,以确保开发者可以轻松地在 Anthos clusters on Bare Metal 上运行应用。我们认为,在开发过程中尽早采取行动有助于避免部署时发生重大突发事件。
此开发者支持可供使用付费支持套餐的客户使用,而且会被视为 P3 优先级(表示阻止发布的问题)或 P4 优先级(一般咨询)。