Administra incidentes para políticas de alertas basadas en registros

Un incidente es un registro de cuándo se cumple la condición de una política de alertas. Por lo general, cuando se cumple una condición, Cloud Monitoring abre un incidente y envía una notificación cuando se recibe un registro que coincide con la condición de tu política de alertas. Sin embargo, los incidentes no se crean en las siguientes circunstancias:

  • La política está pospuesta o inhabilitada.
  • La frecuencia máxima de notificaciones superaría el límite de 1 notificación cada 5 minutos para cada política de alertas basada en registros.
  • El total diario de notificaciones superaría el límite de 20 notificaciones al día para cada política de alertas basada en registros

Para cada incidente, Monitoring crea una página Detalles del incidente que te permite administrarlo y que informa información del incidente que puede ayudarte a solucionar el problema. Por ejemplo, la página Detalles del incidente muestra una lista de entradas de registro que coinciden con la consulta de la política de alertas basada en registros. También puedes para encontrar vínculos a incidentes relacionados.

En este documento, se describe cómo puedes encontrar tus incidentes. También se describe cómo puedes usar la página Detalles del incidente para administrar incidentes de las políticas de alertas basadas en registros, que evalúan los datos de entrada de registro almacenados en registros individuales en Cloud Logging.

Antes de comenzar

Asegúrate de tener los permisos necesarios:

Para obtener los permisos que necesitas para ver y administrar incidentes con la consola de Google Cloud, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Para obtener más información sobre los roles de Cloud Monitoring, consulta Controla el acceso con Identity and Access Management.

Encuentra incidentes

Para ver una lista de incidentes en tu proyecto de Google Cloud, haz lo siguiente:

  1. En la consola de Google Cloud, ve a la página  Alertas.

    Ir a las Alertas

    Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuyo subtítulo es Monitoring.

    • En el panel Resumen, se muestra la cantidad de incidentes abiertos.
    • En el panel Incidentes, se muestran los incidentes más recientes. Para enumerar los incidentes más recientes en la tabla, incluidos los que están cerrados, haz clic en Mostrar incidentes cerrados.
  2. Para ver los detalles de un incidente específico, selecciona en la lista.

    Se abrirá la página Detalles del incidente. Para obtener más información sobre el Detalles del incidente, consulta la Investiga un incidente de esta página.

Cómo encontrar incidentes más antiguos

En el panel Incidentes en Alertas, se muestran los incidentes abiertos más recientes. Para ubicar los incidentes más antiguos, realiza una de las siguientes acciones:

  • Para desplazarte por las entradas de la tabla Incidentes, haz clic en  Más reciente o  Más antiguo.

  • Para navegar a la página Incidentes, haz clic en Ver todos los incidentes. En la página Incidentes, puedes hacer lo siguiente:

    • Mostrar incidentes cerrados: Para enumerar todos los incidentes en la tabla, haz clic en Mostrar incidentes cerrados.
    • Filtrar incidentes: Si deseas obtener información para agregar filtros, consulta Filtrar incidentes.
    • Confirma o cierra un incidente, o pospone su política de alertas. Para acceder a estas opciones, haz clic en  Más opciones en la fila del incidente. y elige una opción en el menú. Para obtener más información, consulta Administra incidentes.

Filtrar incidentes

Cuando ingresas un valor en la barra de filtros, solo los incidentes que coinciden con el filtro se enumeran en la tabla Incidentes. Si agregas varios filtros, solo se mostrará un incidente si cumple con todos los filtros.

Para agregar un filtro a la tabla de incidentes, haz lo siguiente:

  1. En la página Incidentes, haz clic en  Filtrar tabla y, luego, selecciona una propiedad de filtro. Las propiedades del filtro incluyen todas las siguientes opciones:

    • Estado del incidente
    • Nombre de la política de alertas
    • Cuando se abrió o cerró el incidente
  2. Selecciona un valor del menú secundario o ingresa un valor en la barra de filtros.

Cómo investigar un incidente

La página Detalles del incidente contiene información que puede ayudarte a identificar de un incidente.

Explora las entradas de registro

Explora las entradas de registro para encontrar patrones y problemas recurrentes relacionados con tu investigación. En el panel Registros, se muestran las entradas de registro que coinciden con la consulta de tu política de alertas basada en registros.

  • Para ver las entradas de registro en el Explorador de registros, haz clic en Ver en el Explorador de registros y, luego, seleccionar un proyecto de permisos.
  • Para ver el panel Registros en el Explorador de métricas, haz clic en Explorar datos.

Ver información complementaria

En la sección Etiquetas, se muestran las etiquetas y los valores del recurso supervisado incluidos en la entrada de registro que causó el incidente. Esta información puede ayudarte a identificar el recurso supervisado específico que causó el incidente. Para obtener más información, consulta Anota incidentes con etiquetas.

En la sección Documentación, se muestra la plantilla de documentación para las notificaciones que proporcionaste cuando creaste la política de alertas. Esta información puede incluir una descripción de lo que supervisa la política de alertas y, además, incluye sugerencias para la mitigación. Para obtener más información, consulta Anota las notificaciones con documentación definida por el usuario.

Si no configuraste la documentación para tu política de alertas, en el panel Documentation, se muestra el mensaje "No document is Configure" (No se configuró ninguna documentación).

Para ayudarte a descubrir los problemas subyacentes en tu aplicación, puedes explorar los incidentes relacionados con otras condiciones de la política de alertas.

En la sección Incidentes relacionados, se muestra una lista de incidentes que coinciden con una de las siguientes opciones:

  • El incidente se creó cuando se cumplió una condición de la misma política de alertas.
  • El incidente comparte una etiqueta con el incidente que se muestra en el incidente en la página de detalles.

Administración de incidentes

Los incidentes están en uno de los siguientes estados:

  •  Abierto: Se cumplió la condición de la política de alertas basadas en registros y el incidente aún está abierto. Si se vuelve a cumplir la misma condición y si ya hay un incidente abierto, no se abre uno nuevo.

  • Confirmado: El incidente está abierto y se marcó de forma manual como confirmado. Por lo general, este estado indica que se investiga el incidente.

  • Cerrado: Cerraste el incidente de forma manual o se cerró automáticamente después de que venciera el período de cierre automático.

Confirma incidentes

Te recomendamos que marques un incidente como confirmado cuando comiences a investigar la causa del incidente.

Para marcar un incidente como confirmado, haz lo siguiente:

  1. En el panel Incidentes de la página Alertas, haz lo siguiente: Haz clic en Ver todos los incidentes.
  2. En la página Incidentes, busca el incidente que deseas confirmar y, luego, realiza una de las siguientes acciones:

    • Haz clic en  Más opciones y, luego, selecciona Confirmar.
    • Abre la página de detalles del incidente y, luego, haz clic en Confirmar incidente.

Posponer una política de alertas

Para evitar que Monitoring cree incidentes y envíe notificaciones durante un período específico, pospone la política de alertas relacionada. Cuando pospones una política de alertas, los incidentes relacionados con ella permanezcan abiertos, pero no generen más notificaciones. Los incidentes se cierran según la duración del cierre automático de la política de alertas.

Para posponer un incidente que estás viendo, haz lo siguiente:

  1. En la página Detalles del incidente, haz clic en Política de posponer.

  2. Selecciona la duración del posponer. Después de seleccionar la duración de la función para posponer, comienza de inmediato.

También puedes posponer una política de alertas desde la página Incidentes buscando incidente que quieres posponer, haciendo clic  Más opciones y, luego, selecciona Posponer. Puedes posponer las políticas de alertas durante las interrupciones para evitar notificaciones durante el proceso de solución de problemas.

Cierra incidentes

Puedes permitir que Monitoring cierre un incidente por ti. puedes cerrar el incidente.

Monitoring cierra automáticamente un incidente cuando el de la política de alertas. De forma predeterminada, la duración del cierre automático es de 7 días. La duración mínima del cierre automático es de 30 minutos.

Para cerrar un incidente, haz lo siguiente:

  1. En el panel Incidentes de la página Alertas, haz lo siguiente: Haz clic en Ver todos los incidentes.
  2. En la página Incidentes, busca el incidente que deseas cerrar y, luego, realiza una de las siguientes acciones:

    • Haz clic en  Ver más y, luego, selecciona Cerrar incidente.
    • Abre la página Detalles del incidente de ese incidente. y, luego, en Cerrar incidente.
Si ves el mensaje Unable to close incident, vuelve a intentarlo en unos minutos. No puede cerrar un incidente nuevo de inmediato porque causaron el incidente aún se consideran activos por el sistema de alertas.

Retención y límites de datos

Para obtener información sobre los límites y el período de retención de los incidentes, consulta Límites de las alertas.

¿Qué sigue?