En esta página se enumeran las páginas para solucionar problemas habituales que pueden surgir al usar Google Kubernetes Engine (GKE). Esta página está dirigida a administradores, arquitectos, especialistas en seguridad, especialistas en redes o especialistas en almacenamiento que solucionan problemas de configuraciones de GKE. Para obtener más información sobre los roles de GKE, consulta Roles y tareas comunes de los usuarios de GKE.
Si no tienes mucha experiencia en la solución de problemas en GKE o quieres obtener una visión general de las herramientas y técnicas básicas, empieza con la introducción a la solución de problemas.
Para diagnosticar y resolver los problemas que surjan en las distintas fases de trabajo con tu infraestructura de GKE, consulta las siguientes secciones:
Diagnostica y soluciona problemas de clústeres de Autopilot de GKE, como la creación de clústeres, la eliminación de espacios de nombres, el escalado y los problemas de cargas de trabajo.
Soluciona problemas de la herramienta de línea de comandos kubectl en GKE, incluidos los problemas de autenticación y autorización.
En esta página también se incluye información sobre cómo solucionar problemas del proxy de Konnectivity para comprobar si es la causa de que los comandos kubectl logs, attach, exec o port-forward dejen de responder.
Soluciona problemas de grupos de nodos estándar de GKE, como problemas con la creación de grupos de nodos, el aprovisionamiento con el mejor esfuerzo, los metadatos de instancias dañados y la migración de cargas de trabajo a grupos de nodos nuevos.
Soluciona los problemas que se producen al añadir nodos a tu clúster de GKE Standard, como los fallos de registro de nodos y los requisitos previos que faltan para que el registro de nodos se realice correctamente.
Solucionar problemas de los tiempos de ejecución de contenedores en GKE, incluidos los problemas con containerd y dockershim, así como los registros privados.
Soluciona problemas de almacenamiento, incluidos los relacionados con los discos persistentes regionales, el rendimiento de los discos y la expansión de volúmenes.
Soluciona problemas de autenticación en GKE, incluidos los problemas con RBAC, Workload Identity Federation para GKE y el servidor de metadatos de GKE.
Soluciona problemas relacionados con las cuentas de servicio, como restaurar la cuenta de servicio predeterminada y habilitar la cuenta de servicio predeterminada de Compute Engine.
Si la autoridad de certificación (CA) raíz de tu clúster va a caducar pronto, consulta cómo realizar una rotación de credenciales para evitar que se interrumpan las operaciones normales del clúster.
Soluciona problemas de extracción de imágenes. Consulta qué provoca estados como
ImagePullBackOff y ErrImagePull
y cómo resolverlos solucionando problemas habituales como
la autenticación y la conectividad de red.
Soluciona problemas de eventos de CrashLoopBackOff en GKE. Diagnostica problemas como el agotamiento de recursos, los errores de configuración de aplicaciones y los fallos de la sonda de actividad.
Solucionar problemas de eventos de falta de memoria (OOM) de Kubernetes. Identificar las causas,
distinguir los tipos de eventos y aplicar soluciones eficaces para los errores de falta de memoria a nivel de contenedor y de nodo.
Soluciona problemas de TPUs, como los relacionados con la cuota, el aprovisionamiento automático de nodos, la configuración de cargas de trabajo y la programación.
Solucionar problemas con las GPUs, incluidos los problemas con la instalación de controladores de GPU, los errores de complementos de dispositivos y las imágenes de contenedores.
Soluciona problemas de actualización de clústeres y nodos de GKE, como actualizaciones largas o incompletas, actualizaciones automáticas inesperadas, fallos y problemas posteriores a la actualización.
Soluciona problemas con espacios de nombres que se quedan en el estado Terminating identificando y eliminando los componentes incorrectos que impiden la eliminación.
Soluciona problemas con los paneles de monitorización, incluidos los problemas relacionados con la habilitación de la monitorización, la falta de recursos de Kubernetes y los permisos.
Soluciona algunos de los errores 400, 401, 403 y 404 que pueden producirse al usar GKE. En esta página también se incluye información sobre cómo solucionar errores de falta de permisos de edición en la cuenta.
Identifica y resuelve problemas conocidos que puedan afectar al uso de GKE.
Siguientes pasos
Si no encuentras una solución a tu problema en la documentación, consulta la sección Obtener asistencia para obtener más ayuda, incluidos consejos sobre los siguientes temas:
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Es difícil de entender","hardToUnderstand","thumb-down"],["La información o el código de muestra no son correctos","incorrectInformationOrSampleCode","thumb-down"],["Me faltan las muestras o la información que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-19 (UTC)."],[],[],null,[]]