Resposta e gerenciamento de incidentes do StackdriverAlpha

Falhas menores com menos intensidade e frequência

Banner principal

Visão geral

Com o Gerenciamento e Resposta a Incidentes (IRM, sigla em inglês) do Stackdriver, você tem um gerenciamento completo do ciclo de vida de incidentes que incorpora processos de resposta comprovados e inteligência orientada por dados para reduzir o tempo médio de mitigação. O IRM aproveita a amplitude, a profundidade e o frescor dos dados operacionais do Stackdriver para correlacionar informações automaticamente no contexto do incidente e produzir insights para acelerar o processo de investigação.

Iniciar sem configuração

Iniciar a jornada SRE sem configuração

Ao codificar as práticas recomendadas de resposta a incidentes SRE do Google, o IRM permite que os usuários atinjam o principal marco da jornada de SRE de um processo para gerenciar incidentes de produção. Quando emparelhado com o Stackdriver Alerting, não é preciso configurar o IRM para começar.

Acelere sua investigação

Insights para acelerar sua investigação

Com a análise inteligente dos dados operacionais do Stackdriver, você identifica rapidamente informações de alto valor relacionadas a incidentes. O aprendizado de máquina fornecerá insights ajustados ao seu ambiente, especialmente à medida que esse ambiente muda com o tempo.

Aprendizado contínuo

Aprendizado contínuo

Construções fáceis capturam rapidamente as principais atividades e decisões de resposta a incidentes para posterior apresentação contextual no IRM, o que reduz o tempo médio de mitigação.

Recursos

Percepção situacional

Ao usar alertas do Stackdriver, é possível analisar em tempo real gráficos da métrica de violação, ver detalhes do alerta, acessar links diretos para mais dados operacionais e incidentes semelhantes (históricos ou atuais) para entender rapidamente a extensão do alerta e determinar as próximas etapas.

Papéis SRE

Use os papéis de resposta a incidentes do Google SRE (Comandante do Incidente, Ops Lead etc.) para comandar e controlar incidentes e garantir que não haja lacunas ou sobreposições na resposta.

Transferência de contexto

Sistema de transferência que facilita a transferência de contexto entre diferentes turnos.

Integração com o Slack

Aproveite as configurações do Slack no Stackdriver Alerting para indicar o canal de comunicação principal de um incidente e assine canais do Slack para ver atualizações de incidentes.

Predefinições e escalonamento de incidentes

Coordene melhor as respostas aumentando a percepção de toda a equipe em relação a incidentes de escopo amplo. Use as predefinições do IRM para agilizar o processo definindo previamente modelos de resumo, links para manuais e outras informações, tags e as partes interessadas e equipes externas que precisam se manter informadas.

API flexível

A API Incident (Alfa) estende a IU do IRM para plug-ins personalizados do ChatOps que podem atualizar e rastrear incidentes do Slack e de outras ferramentas de bate-papo. Preencha este formulário para ter acesso à versão Alfa da API.

Preço

Na versão Alfa, o uso do IRM está disponível gratuitamente. Não há custos ou cotas associadas ao uso dos recursos.

Recursos

Google Cloud

Começar

Aprenda e crie

Ainda não conhece o GCP? Comece a usar qualquer produto do GCP gratuitamente com US$ 300 de crédito.

Precisa de mais ajuda?

Nossos especialistas ajudarão você a criar a solução certa ou encontrar o parceiro ideal para suas necessidades.

Este produto está na versão Alfa. Veja mais informações sobre nossas etapas de lançamento de produtos.

Enviar comentários sobre…

Stackdriver Incident Response and Management (IRM) Documentation
Precisa de ajuda? Acesse nossa página de suporte.