Administración y respuesta ante incidentes de StackdriverAlfa

Interrupciones menos frecuentes, más breves y a menor escala

Banner con imagen grande

Descripción general

La Administración y respuesta ante incidentes (IRM) de Stackdriver permite controlar el ciclo de vida completo de los incidentes debido a que incorpora la inteligencia impulsada por los datos y los procesos de respuesta probados rigurosamente, que sirven para disminuir el tiempo medio hasta lograr la mitigación. IRM aprovecha la actualidad, el nivel de detalle y la amplitud de los datos operativos de Stackdriver para correlacionar la información de forma automática en el contexto del incidente, lo que permite generar estadísticas y acelerar el proceso de investigación.

Sin configuración para iniciar el recorrido

Sin configuración para iniciar tu recorrido hacia la SRE

IRM codifica las recomendaciones de respuesta ante incidentes de SRE de Google a fin de que los usuarios alcancen la meta clave del recorrido a la SRE: un proceso para administrar los incidentes de producción. Si lo combinas con las alertas de Stackdriver, no tendrás que configurar IRM para comenzar a usarlo.

Acelera tu investigación

Estadísticas para acelerar tu investigación

Usa el análisis inteligente de los datos de operaciones de Stackdriver para identificar con rapidez la información de gran valor relacionada con los incidentes. El aprendizaje automático proporcionará estadísticas en función de tu entorno, especialmente a medida que este cambie con el tiempo.

Aprendizaje continuo

Aprendizaje continuo

Las construcciones sencillas permiten capturar rápidamente las actividades y decisiones clave de la respuesta ante incidentes para presentarlas de forma contextual en IRM y, así, mejorar el tiempo medio hasta lograr la mitigación.

Funciones

Análisis de situaciones

En cuanto a las alertas de Stackdriver, podrás revisar inmediatamente gráficos de las métricas infractoras, detalles de las alertas, vínculos directos a otros datos de operaciones y otros incidentes similares, actuales o pasados. Esto te permitirá comprender sin demora el alcance de la alerta y determinar los pasos que se deben seguir.

Funciones de SRE

Las funciones de respuesta ante incidentes de SRE de Google (comandante de incidentes, líder de operaciones, etc.) te permiten dirigir y controlar las vulneraciones de seguridad y asegurarte de que no hayan brechas ni superposiciones en las respuestas.

Transferencia del contexto

El sistema para cambio de turnos facilita la comunicación del contexto entre los turnos activos.

Integración de Slack

Aprovecha inmediatamente la configuración de Slack para las alertas de Stackdriver a fin de indicar el canal de comunicación primario de un incidente y suscribir los canales de Slack a las actualizaciones sobre los incidentes.

Incidentes y ajustes predeterminados escalados

Aumenta la visibilidad de los incidentes de gran alcance entre tu equipo a fin de coordinar mejor las respuestas. Los ajustes predeterminados de IRM permiten acelerar el proceso gracias a la especificación previa de las plantillas de resumen, los vínculos a las guías, las etiquetas y otro tipo de información, además de los equipos y las partes interesadas a los que se debe mantener informados.

API flexible

La API de incidentes (Alfa) permite ampliar la IU de IRM para agregar complementos personalizados de ChatOps a fin de actualizar y rastrear los incidentes desde Slack y otras herramientas de chat. Llena este formulario para que se te incluya en la lista blanca de la versión Alfa de la API.

Precios

Actualmente, IRM está disponible sin cargo mientras está en versión Alfa. No hay costos ni cuotas asociados al uso de sus funciones.

Recursos

Google Cloud

Comienza ahora

Aprende y compila

¿Eres nuevo en GCP? Empieza a usar cualquier producto sin costo con un crédito de $300.

¿Necesitas más ayuda?

Nuestros expertos te ayudarán a crear las soluciones más adecuadas o a encontrar el socio más conveniente según tus necesidades.

Este producto está en versión alpha. Para obtener más información sobre las etapas de lanzamiento de productos, consulta aquí.

Enviar comentarios sobre…

Stackdriver Incident Response and Management (IRM) Documentation
¿Necesitas ayuda? Visita nuestra página de asistencia.