Resposta e gerenciamento de incidentesAlfa

Falhas menores com menos intensidade e frequência.

Consulte a documentação do produto.

Descrição do que é abordado no vídeo.

Visão geral

Com o Resposta e gerenciamento de incidentes (IRM, na sigla em inglês), você tem um gerenciamento completo do ciclo de vida de incidentes que incorpora processos de resposta comprovados e inteligência orientada por dados para reduzir o tempo médio de mitigação. O IRM aproveita a amplitude, a profundidade e a atualidade dos dados operacionais de outros produtos de operações do Google Cloud para correlacionar informações automaticamente no contexto do incidente e produzir insights para acelerar o processo de investigação.

Inicie a jornada SRE sem configuração

Ao codificar as práticas recomendadas de resposta a incidentes SRE do Google, o IRM permite que os usuários atinjam o principal marco da jornada de SRE de um processo para gerenciar incidentes de produção. Quando emparelhado com o Cloud Monitoring, não é preciso configurar o IRM para começar.

Insights para acelerar sua investigação

Com a análise inteligente dos dados operacionais do Resposta e gerenciamento de incidentes, você identifica rapidamente informações de alto valor relacionadas a incidentes. O machine learning fornecerá insights ajustados ao seu ambiente, especialmente à medida que esse ambiente muda com o tempo.

Aprendizado contínuo

Conceitos fáceis capturam rapidamente as principais atividades e decisões de resposta a incidentes para posterior apresentação contextual no IRM, o que reduz o tempo médio de mitigação.

Recursos

Percepção situacional

Ao usar alertas, é possível analisar em tempo real gráficos da métrica de violação, ver detalhes do alerta, acessar links diretos para mais dados operacionais e incidentes semelhantes (históricos ou atuais) para entender rapidamente a extensão do alerta e determinar as próximas etapas.

Papéis SRE

Use os papéis de resposta a incidentes do Google SRE (comandante do incidente, líder de operações etc.) para comandar e controlar incidentes e garantir que não haja lacunas ou sobreposições na resposta.

Transferência de contexto

Sistema que facilita a transferência de contexto entre diferentes turnos de plantão.

Integração com o Slack

Aproveite as configurações do Slack em alertas para indicar o canal de comunicação principal de um incidente e assine canais do Slack para ver atualizações de incidentes.

Predefinições e escalonamento de incidentes

Coordene melhor as respostas aumentando a percepção de toda a equipe em relação a incidentes de escopo amplo. Use as predefinições do IRM para agilizar o processo definindo previamente modelos de resumo, links para manuais e outras informações, tags e as partes interessadas e equipes externas que precisam se manter informadas.

API flexível

A API Incident (Alfa) estende a IU do IRM para plug-ins personalizados do ChatOps que podem atualizar e rastrear incidentes do Slack e de outras ferramentas de chat.

Recursos

Preços

Na versão Alfa, o IRM está disponível para uso gratuitamente. Não há custos ou cotas associadas ao uso dos recursos.

Próximos passos

Ganhe US$ 300 em créditos para aprender e criar no Google Cloud por até 12 meses.

Faça uma avaliação gratuita
Precisa de ajuda para começar?
Trabalhe com um parceiro confiável
Continue navegando