Stackdriver Incident Response and ManagementAlpha 版

缩减中断次数、持续时间和影响范围。

查看此产品的文档

概览

概览

Stackdriver Incident Response and Management (IRM) 提供端到端的突发事件生命周期管理,整合经过实践检验的成熟响应流程和数据驱动型智能,缩短突发事件的平均缓解时间。IRM 借助 Stackdriver 操作数据的广度、深度和时效性,在突发事件的上下文中生成数据洞见,加快调查流程。

零配置开启 SRE 之旅

IRM 精心整理了 Google SRE 突发事件响应最佳做法,助力用户在管理生产突发事件的过程中实现 SRE 之旅中的关键里程碑。与 Stackdriver Alerting 配合使用时,您不需要对 IRM 执行任何配置即可着手开始使用。

借助数据洞见加速调查

对您的 Stackdriver 操作数据执行智能分析,快速识别与突发事件相关的高价值信息。机器学习技术能够针对您的环境提供数据洞见,在您的环境随时间变化时更是如此。

持续学习

轻松构建模型,迅速捕获关键突发事件响应活动和相应决策,以备后续在 IRM 中相应的上下文中呈现给用户,缩短缓解突发事件的平均所需时间。

特性

事态感知

在收到 Stackdriver 警报时,立即查看存在问题的指标的图表、警报细节、更多操作数据的深层链接以及既往或当前的类似突发事件,便于快速了解警报涉及的范围并确定后续举措。

SRE 角色

利用 Google SRE 突发事件响应角色(Incident Commander、Ops Lead 等)指挥和控制突发事件,确保响应措施中不存在疏漏或重叠。

上下文交接

轮班移交系统能更好地促进相关上下文在轮值班次之间的交接。

Slack 集成

立即利用 Stackdriver Alerting 的 Slack 配置,指定突发事件的主要通讯频道,并为相关 Slack 频道订阅突发事件更新。

升级的突发事件和预设

提高团队成员对于大规模突发事件的认知,以便更好地协调响应工作。利用 IRM 的预设预先指定总结模板、方案手册链接和其他信息、标签以及需要通知的利益相关者和外部团队,加快突发事件响应流程。

灵活的 API

Incident API(Alpha 版)为 IRM 的界面提供了扩展能力,可实现自定义 ChatOps 插件,通过 Slack 和其他聊天工具更新和跟踪突发事件。填写这份表单,以请求加入可使用此 API Alpha 版的白名单。

资源

价格

IRM 的 Alpha 版目前可免费体验使用。使用其功能不会产生任何费用,也不会耗用相关配额。

Google Cloud

开始使用

学习和构建

刚接触 GCP?您可以领取 $300 赠金,免费开始使用任意 GCP 产品。

需要更多帮助?

我们的专家会根据您的需求,帮助您打造合适的解决方案,或者寻找合适的合作伙伴。

此产品目前为 Alpha 版。如需详细了解我们的产品发布阶段,请点击此处