排查 GKE 问题
  
      
    
  
  
  
  
  
    
  
  
    
    
    
    
    
    
  
    
本页面列出了问题排查页面,其中介绍了您在使用 Google Kubernetes Engine (GKE) 时可能会遇到的常见问题。本页面适用于负责排查 GKE 配置问题的管理员和架构师、安全专家、网络专家或存储专家。如需详细了解 GKE 角色,请参阅常见的 GKE 用户角色和任务。
如果您刚开始接触 GKE 问题排查,或者想大致了解基本工具和技巧,请先阅读问题排查简介。
如需诊断和解决在使用 GKE 基础设施的各个阶段遇到的问题,请参阅以下部分:
您还可以通过本页面访问更通用的问题排查主题:
如需排查 GKE 网络问题,请参阅 GKE 网络文档中的排查 GKE 网络问题部分。
问题排查简介
集群设置
  
    
      | 主题 | 说明 | 
  
  
    
      | 创建集群 | 解决创建集群时的问题。 | 
    
      | Autopilot 集群 | 诊断和排查 GKE Autopilot 集群问题,包括集群创建、命名空间删除、扩缩和工作负载问题。 | 
    
      | Kubectl 命令行工具 | 排查 GKE 中 kubectl命令行工具的问题,包括身份验证、授权问题。本页面还包含有关如何排查 Konnectivity 代理问题的建议,以检查该代理是否导致kubectl logs、attach、exec或port-forward命令停止响应。 | 
    
      | Standard 节点池 | 排查 GKE Standard 节点池的问题,包括节点池创建、尽力而为的预配、损坏的实例元数据以及将工作负载迁移到新节点池的问题。 | 
    
      | 节点注册 | 排查将节点添加到 GKE Standard 集群时发生的问题,例如节点注册失败以及缺少成功注册节点的前提条件。 | 
    
      | 容器运行时 | 排查 GKE 中的容器运行时问题,包括 containerd和dockershim以及私有注册表的问题。 | 
  
自动扩缩
  
    
      | 主题 | 说明 | 
  
  
 
    | 集群自动扩缩器未缩容 | 诊断并解决集群未移除利用率不足的节点的常见原因。了解如何检查是否存在限制性 PodDisruptionBudgets、具有本地存储的 Pod 或阻止节点逐出的特定注释(例如"cluster-autoscaler.kubernetes.io/safe-to-evict": "false")等问题。 | 
  
    | 集群自动扩缩器未扩容 | 了解集群自动扩缩器为何未添加新节点来满足需求。
    检查是否存在无法调度的 Pod,验证是否已达到集群或节点池大小限制,并确定潜在的资源配额或区域虚拟机可用性问题。 | 
  
    | Pod 横向自动扩缩 | 排查 Pod 横向自动扩缩器无法扩缩应用 Pod 副本的问题。解决常见问题,例如 HorizontalPodAutoscaler 对象配置错误或指标流水线存在问题。 | 
  
存储
  
    
      | 主题 | 说明 | 
  
  
    
      | 存储 | 排查存储问题,包括区域级永久性磁盘、磁盘性能和卷扩展的问题。 | 
  
集群安全
集群的根证书授权机构即将过期
工作负载
集群管理
  
    
      | 主题 | 说明 | 
  
  
    
      | 集群升级 | 排查并解决 GKE 集群和节点升级问题,包括升级时间过长或不完整、意外的自动升级、升级失败以及升级后出现的问题。 | 
    
      | 网络钩子 | 了解如何在使用准入 webhook 时排查集群控制平面问题并确保其稳定性。 | 
    
      | 命名空间卡在 Terminating状态 | 通过识别并移除阻止删除的运行不正常的组件,排查命名空间卡在 Terminating状态的问题。 | 
    
      | 并发操作 | 通过了解如何识别这些错误排查并发操作问题,然后通过等待操作完成来解决这些问题。 | 
  
监控
  
    
      | 主题 | 说明 | 
  
  
    
      | 系统指标 | 排查系统指标未显示在 Cloud Monitoring 中的问题。 | 
    
      | 监控信息中心 | 排查监控信息中心的问题,包括启用监控功能、缺少 Kubernetes 资源和权限的问题。 | 
    
      | Logging | 排查日志记录问题,包括启用日志记录功能、缺少日志和配额的问题。 | 
  
4xx 错误
已知问题
  
    
      | 主题 | 说明 | 
  
  
    
      | 已知问题 | 发现并解决可能影响 GKE 使用的已知问题。 | 
  
后续步骤
  
  
  
  
    
  
  
 
  
    
    
      
       
         
  
       
    
    
  
  
  如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
  最后更新时间 (UTC):2025-10-20。
  
  
    
    
    
      
  
    
  
  
    
      [[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-10-20。"],[],[]]