Revisa el estado y los incidentes del servicio


Cuando tus clústeres o aplicaciones de Google Kubernetes Engine (GKE) tienen problemas, es fundamental determinar rápidamente si la causa es interna o se relaciona con unaGoogle Cloud interrupción del servicio más amplia. Dedicar tiempo a la depuración local es ineficiente si la causa raíz es un incidente conocido de la plataforma.

Usa esta página para determinar si un problema con tu clúster de GKE se debe a una interrupción más amplia del servicio de Google Cloud . Consulta las siguientes fuentes para saber dónde encontrar actualizaciones de estado oficiales, eventos de estado personalizados y estadísticas sobre incidentes de servicio:

  • Google Cloud Estado del servicio: Información de estado de los servicios de Google Cloud, por región.
  • Personalized Service Health: Interrupciones del servicio relevantes para tus proyectos
  • Estadísticas y recomendaciones sobre incidentes de servicio: Clústeres de GKE afectados por un incidente de servicio en curso.

Esta información es importante para los administradores y operadores de la plataforma, y para los desarrolladores de aplicaciones que están solucionando problemas y necesitan saber si los problemas observados están vinculados a un evento de estado del servicio Google Cloud más amplio. Para obtener más información sobre los roles comunes y las tareas de ejemplo a las que hacemos referencia en el contenido deGoogle Cloud , consulta Roles y tareas comunes de los usuarios de GKE.

Revisa el Google Cloud estado del servicio

En la página Google Cloud Estado del servicio, se proporciona información sobre el estado de los servicios que forman parte de Google Cloud.

Para revisar los incidentes relacionados con GKE, ve a la página Google Cloud Service Health.

Ir a todos los incidentes informados para Google Kubernetes Engine

Revisa Personalized Service Health

Personalized Service Health te permite identificar interrupciones del servicio deGoogle Cloud que son relevantes para tus proyectos. Estas interrupciones se denominan eventos de estado del servicio, y la información sobre ellas está disponible en la consola de Google Cloud y en una variedad de puntos de integración.

Para revisar los incidentes relacionados con GKE que son relevantes para tus proyectos, consulta los eventos de estado del servicio en el panel de Personalized Service Health en la Google Cloud consola.

Ir a Personalized Service Health

Puedes filtrar los incidentes por servicio, ubicación, relevancia y estado. El panel también proporciona detalles sobre los incidentes, como el alcance del impacto, los síntomas, las soluciones alternativas y las actualizaciones del progreso de la resolución. Para comenzar, consulta la Guía de inicio rápido: Visualiza eventos de Service Health en la consola deGoogle Cloud .

Revisa las estadísticas y recomendaciones sobre el incidente de servicio

Las estadísticas y recomendaciones sobre incidentes de servicio te permiten identificar los clústeres de GKE afectados por un incidente de servicio en curso.

Para obtener estadísticas sobre incidentes de servicio, consulta las estadísticas y recomendaciones del subtipo GKE_RELIABILITY_INCIDENT. Puedes obtener estadísticas con la consola, Google Cloud CLI o la API de Recommender. Google Cloud Para obtener más información, consulta Cómo ver estadísticas y recomendaciones.

Las estadísticas y recomendaciones incluyen la siguiente información:

  • Clúster afectado: Es un clúster que se ve afectado por el incidente.
  • Nombre del incidente: Es un identificador del incidente que se usa como referencia cuando te comunicas con el Atención al cliente de Cloud.
  • Descripción del incidente: Información sobre el incidente proporcionada por el equipo de respuesta ante incidentes.
  • Última hora efectiva: Es la última vez que se actualizó la información sobre el incidente.
  • Acción de mitigación: Es la acción de mitigación que recomienda el equipo de respuesta ante incidentes, si está disponible.

La estadística del incidente de servicio permanece visible hasta que el equipo de respuesta ante incidentes Google Cloud mitiga el incidente y determina que la estadística ya no es pertinente. Habrá una demora entre el momento en que se mitigue el incidente y deje de afectar tus recursos, y el momento en que se quite la estadística. Si implementaste una solución alternativa y ya no quieres ver la estadística, puedes descartarla.

¿Qué sigue?