Cuando tus clústeres o aplicaciones de Google Kubernetes Engine (GKE) tienen problemas, es fundamental determinar rápidamente si la causa es interna o está relacionada con unaGoogle Cloud interrupción del servicio más generalizada. No merece la pena dedicar tiempo a depurar localmente si la causa principal es un incidente conocido de la plataforma.
Usa esta página para determinar si un problema con tu clúster de GKE se debe a una interrupción del servicio más generalizada. Google Cloud Consulta dónde encontrar actualizaciones de estado oficiales, eventos de salud personalizados e información sobre incidentes de servicio en las siguientes fuentes:
- Google Cloud Estado del servicio: información sobre el estado de los servicios de Google Cloudpor región.
- Personalized Service Health: interrupciones del servicio relevantes para tus proyectos.
- Estadísticas y recomendaciones sobre incidentes de servicio: clústeres de GKE afectados por un incidente de servicio en curso.
Esta información es importante para los administradores y operadores de la plataforma, así como para los desarrolladores de aplicaciones que estén solucionando problemas y necesiten saber si los problemas observados están relacionados con un evento de estado del servicio de Google Cloud más amplio. Para obtener más información sobre los roles habituales y las tareas de ejemplo a los que hacemos referencia en el contenido deGoogle Cloud , consulta Roles y tareas habituales de los usuarios de GKE.
Revisar el estado del servicio Google Cloud
La página Google Cloud Estado del servicio proporciona información sobre el estado de los servicios que forman parte de Google Cloud.
Para revisar los incidentes relacionados con GKE, ve a la página Google Cloud Estado del servicio.
Ir a todos los incidentes notificados de Google Kubernetes Engine
Consultar Personalized Service Health
Personalized Service Health te permite identificarGoogle Cloud interrupciones del servicio que sean relevantes para tus proyectos. Estas interrupciones se denominan eventos de estado del servicio y la información sobre ellas está disponible en la Google Cloud consola y en una variedad de puntos de integración.
Para revisar los incidentes relacionados con GKE que sean relevantes para tus proyectos, consulta los eventos de estado del servicio en el panel de control Personalized Service Health de la Google Cloud consola.
Ir a Personalized Service Health
Puedes filtrar los incidentes por servicio, ubicación, relevancia y estado. El panel de control también proporciona detalles sobre los incidentes, como el alcance del impacto, los síntomas, las soluciones alternativas y las actualizaciones del progreso de la resolución. Para empezar, consulta la guía de inicio rápido para ver eventos de estado del servicio en laGoogle Cloud consola.
Consultar estadísticas y recomendaciones sobre incidentes de servicio
Las métricas y recomendaciones de incidentes de servicio te permiten identificar los clústeres de GKE que se ven afectados por un incidente de servicio en curso.
Para obtener información valiosa sobre los incidentes de servicio, consulta las estadísticas y las recomendaciones del subtipo GKE_RELIABILITY_INCIDENT
. Puedes obtener estadísticas mediante la Google Cloud consola, la CLI de Google Cloud o la API Recommender. Para obtener más información, consulta Ver estadísticas y recomendaciones.
Las estadísticas y las recomendaciones incluyen la siguiente información:
- Clúster afectado: clúster afectado por el incidente.
- Nombre del incidente: identificador del incidente que se usa como referencia cuando te comunicas con el equipo de Asistencia de Google Cloud.
- Descripción del incidente: información sobre el incidente proporcionada por el equipo de respuesta a incidentes.
- Última hora de entrada en vigor: la última vez que se actualizó la información sobre el incidente.
- Acción de mitigación: acción de mitigación recomendada por el equipo de respuesta ante incidentes, si está disponible.
La información sobre el incidente de servicio permanece visible hasta que el equipo de respuesta al incidente lo mitiga y determina que ya no es relevante. Google Cloud Habrá un retraso entre el momento en que se mitigue el incidente y deje de afectar a tus recursos, y el momento en que se elimine la estadística. Si has implementado una solución alternativa y ya no quieres ver la estadística, puedes cerrarla.
Siguientes pasos
Consulta Evaluar el estado de los clústeres y las cargas de trabajo en la consola Google Cloud (la página siguiente de esta serie).
Para obtener consejos sobre cómo resolver problemas específicos, consulta las guías de solución de problemas de GKE.
Si no encuentras una solución a tu problema en la documentación, consulta la sección Obtener asistencia para obtener más ayuda, incluidos consejos sobre los siguientes temas:
- Abrir un caso de asistencia poniéndose en contacto con el equipo de Atención al Cliente de Cloud.
- Obtener asistencia de la comunidad haciendo preguntas en Stack Overflow
y usando la etiqueta
google-kubernetes-engine
para buscar problemas similares. También puedes unirte al#kubernetes-engine
canal de Slack para obtener más ayuda de la comunidad. - Abrir errores o solicitudes de funciones mediante el seguimiento de problemas público.