Esta página se ha traducido con Cloud Translation API.
Switch to English

Incidentes

Un incidente es un registro de la activación de una política de alertas. Cloud Monitoring abre un incidente cuando se cumple una condición de una política de alertas.

En esta página, se describe cómo puedes ver, investigar y administrar los incidentes.

Encuentra incidentes

Para encontrar una lista de incidentes, haz lo siguiente:

  1. En la barra de herramientas de Cloud Console, haz clic en el  Menú de navegación y, luego, selecciona Monitoring:

    Ir a Monitoring

  2. En el panel de navegación de Monitoring, selecciona  Alertas.

    En la página del panel de alertas, el panel Resumen enumera la cantidad de incidentes abiertos y la tabla Incidentes muestra los incidentes más recientes. De forma predeterminada, no se muestran los incidentes cerrados. Para incluir incidentes cerrados en la tabla, haz clic en Mostrar incidentes cerrados.

Busca incidentes más antiguos

La tabla Incidentes en Alertas muestra solo los incidentes más recientes. Para encontrar incidentes más antiguos, realiza una de las siguientes acciones:

  • Para desplazarte por las entradas de la tabla Incidentes, haz clic en  Más reciente o  Más antiguos.

  • Haga clic en Ver todos los incidentes para navegar a la página Incidentes.

    De forma predeterminada, esta tabla muestra todos los incidentes abiertos. Para incluir incidentes cerrados en la tabla, haz clic en Mostrar incidentes cerrados.

    Para controlar los incidentes que se enumeran, agrega filtros. Para obtener más información, consulta Filtra incidentes.

    Para administrar incidentes o políticas de alertas de esta tabla, haz clic en  Más opciones en la fila de incidentes y selecciona el menú de opciones. Para obtener más información sobre cómo confirmar o silenciar un incidente, consulta Administra incidentes.

Filtra incidentes

Para filtrar la tabla de incidentes, haz lo siguiente:

  1. En la página Incidentes, haz clic en  Filtrar tabla y selecciona un atributo de filtro. Puedes filtrar las siguientes opciones:

    • El estado del incidente
    • Nombre de la política de alertas
    • Cuándo se abrió o cerró el incidente
    • Tipo de métrica
    • Tipo de recurso
  2. Seleccione un valor en el menú secundario o ingrese un valor en la barra de filtros. Cuando ingresas un valor en la barra de filtros, la lista de opciones muestra solo las opciones que contienen el valor que ingresaste.

    Por ejemplo, si seleccionas Tipo de métrica y, luego, ingresas usage_time, es posible que solo veas las siguientes opciones en el menú secundario:

    agent.googleapis.com/cpu/usage_time
    compute.googleapis.com/guest/container/cpu/usage_time
    container.googleapis.com/container/cpu/usage_time

Si agregas varios filtros, se muestra un incidente solo si satisface todos los filtros.

Investiga incidentes

Después de haber encontrado el incidente que deseas investigar, ve a la página Detalles del incidente de ese incidente. Para ver los detalles, haz clic en el resumen del incidente en la tabla de incidentes de la página Alertas o Incidentes.

La siguiente captura de pantalla muestra la página de detalles de un incidente:

La página de detalles proporciona información resumida y herramientas de investigación para un incidente.

La página Detalles del incidente proporciona la siguiente información:

  • Información de estado, incluidos los siguientes:

    • Nombre: El nombre de la política de alertas que causó este incidente.
    • Estado: Es el estado del incidente: abierto, confirmado o cerrada.
    • Duración: la cantidad de tiempo durante el que se abrió el incidente.
  • Información sobre la política de alertas que causó el incidente:

    • Condición: La condición en la política de alertas que causó el incidente.
    • Mensaje: Una explicación breve de la causa según la configuración de la condición en la política de alertas. Este panel siempre se propaga.
    • Documentación: La documentación (opcional) de las notificaciones proporcionadas cuando se creó la política de alertas. Esta información puede incluir una descripción de lo que supervisa la política de alertas y puede incluir sugerencias para la mitigación. Debido a que la documentación es opcional, este panel podría estar vacío.
  • Etiquetas: las etiquetas y los valores del recurso supervisado y la métrica de la serie temporal que activó la política de alertas. Esta información puede ayudarte a identificar el recurso supervisado específico que causó el incidente.

La página Detalles de los incidentes también proporciona herramientas para investigar el incidente:

  • Cronograma de incidentes: Muestra dos representaciones visuales del incidente:

    • Una barra roja sobre un eje de tiempo representa el incidente; la longitud y la posición de la barra reflejan la duración del incidente.
    • Un gráfico muestra los datos de series temporales y el umbral que usa la política de alertas que causó el incidente. El incidente se abrió cuando algunas series temporales cumplieron una condición de la política de alertas.

    El eje de tiempo indica la duración del incidente con dos puntos etiquetados. La posición de estos puntos en el eje de tiempo determina el rango de datos que se muestra en el gráfico que acompaña al cronograma del incidente. De forma predeterminada, un punto se coloca en la apertura del incidente y uno en el cierre del incidente, o en el momento actual si el incidente aún está abierto.

    Puedes modificar el intervalo de tiempo en el cronograma del incidente y el gráfico:

    • Para cambiar el intervalo de tiempo que se muestra en el gráfico, arrastra cualquiera de los puntos en el eje de tiempo. Cuando se usa esta técnica, puedes enfocarte en intervalos específicos, por ejemplo, al comienzo o al final del incidente.

      Cuando se arrastra el gráfico, arrastra los puntos en el eje que establece un valor personalizado en el menú Intervalo (Time spaning) y, luego, inhabilita el menú. Para habilitar el menú Intervalo de tiempo, haga clic en Restablecer.

    • Para cambiar el rango de tiempo que se muestra en el cronograma, selecciona un rango en el menú Intervalo de tiempo.

  • Vínculos a otras herramientas de solución de problemas. La configuración de tu política de proyecto y alertas y la antig ofedad del incidente determinan qué vínculos están disponibles.

    • Para ver la página de detalles de la política de alertas, haz clic en Ver política.
    • Para editar la definición de la política de alertas, haz clic en Editar política.
    • Para acceder a un panel de información de rendimiento del recurso, haz clic en Ver detalles del recurso.
    • Para ver las entradas de registro relacionadas en el Explorador de registros, haz clic en Ver registros. Para obtener más información, consulta Usa el Explorador de registros.
    • Para investigar los datos del gráfico, haz clic en Ver en el Explorador de métricas.
  • Anotaciones: Proporciona un registro de tus resultados, resultados, sugerencias y otros comentarios de tu investigación del incidente.

    • Para agregar una anotación, ingresa texto en el campo y haz clic en Agregar comentario.
    • Para descartar el comentario, haz clic en Cancelar.

También puedes confirmar o silenciar incidentes desde la página Detalles del incidente. Para obtener más información, consulta Administra incidentes.

Administra los incidentes

Los incidentes se encuentran en uno de estos tres estados:

  • Abierto: El conjunto de condiciones de la política se está cumpliendo o no hay datos que indiquen que la condición ya no se cumple. Si una política contiene varias condiciones, los incidentes se abren en función de cómo se combinan esas condiciones. Consulta Condiciones de combinación para obtener más información.

  • Confirmado: El incidente está abierto y se marcó de forma manual como confirmado. Por lo general, este estado indica que se investiga el incidente.

  • Cerrado: El sistema observó que la condición dejó de cumplirse o se cumplieron 7 días sin que se advirtiera que la condición se seguía cumpliendo.

Cuando configures una política de alertas, asegúrate de que el estado estable proporcione una señal cuando todo esté bien. Esto es necesario para garantizar que el estado sin errores se pueda identificar y, si un incidente está abierto, para que este se cierre. Si no hay señal para indicar que se detuvo una condición de error, luego de que se abre un incidente, permanece abierto durante 7 días después de que se activa la política.

Por ejemplo, si creas una política que te notifica cuando el recuento de errores es superior a 0, asegúrate de que produzca un recuento de 0 errores cuando no haya errores. Si la política muestra un valor nulo o vacío en el estado sin error, no hay señal para indicar cuándo se detuvieron los errores. En algunas situaciones, Monitoring Language Language (MQL) admite la especificación de un valor predeterminado que se usa cuando no hay un valor medido disponible. Para ver un ejemplo, consulta Uso de proporción.

Confirma incidentes

Para marcar un incidente como confirmado, haz lo siguiente:

  • En el panel Incidentes en Alertas, haz clic en Ver todos los incidentes. Esto abrirá la ventana Incidentes.
  • Para confirmar un incidente, realiza una de las siguientes acciones:

    • Para el incidente que deseas confirmar, selecciona  Más opciones y, luego, Confirmar recepción.
    • Abre la página de detalles del incidente que deseas confirmar y haz clic en Confirmar incidente.

Debes tener la función de editor de Monitoring, roles/monitoring.editor, para confirmar los incidentes. A fin de obtener más información, consulta Control de acceso: funciones predefinidas.

Silencia condiciones

Si silencias una condición, se aíslan todos los incidentes abiertos con esa condición, y no recibirás una notificación de alerta cuando se deje de cumplir. Si se silencia una condición, se quita el incidente de la pantalla de incidentes activos. Cuando investigues un incidente, debes confirmarlo en lugar de silenciarlo.

Forzar un incidente no concilia la causa subyacente del incidente. Es decir, si la condición que generó el incidente aún se cumple en el siguiente ciclo de alertas, el incidente se vuelve a abrir.

Para silenciar una condición, haz lo siguiente:

  • En el panel Incidentes en Alertas, haz clic en Ver todos los incidentes.
  • En laIncidentes busca el incidente que quieres confirmar, selecciona Más opciones y, luego, seleccioneSilenciar condición asociada las rutas "a GCP".

Cierra incidentes

Los incidentes se cierran automáticamente; no puedes cerrar un incidente. Un incidente se cierra cuando el sistema observa que ya no se cumple la condición o cuando pasan 7 días sin una observación de que la condición aún se cumple.

Por ejemplo, supongamos que tienes una política de alertas configurada para generar un incidente si la latencia de respuesta HTTP supera los 2 segundos durante 10 minutos consecutivos y que se abrió un incidente. Si la siguiente medición de la latencia de respuesta HTTP es igual o inferior a 2 segundos, se cierra el incidente. Del mismo modo, si no se recibe ningún dato durante 7 días, se cerrará el incidente.

¿Qué sigue?