Stackdriver Incident Response and ManagementAlpha 版

缩减中断次数、持续时间和影响范围。

主横幅

概览

Stackdriver Incident Response and Management (IRM) 提供端到端的突发事件生命周期管理,整合经过实践检验的成熟响应流程和数据驱动型智能,缩短突发事件的平均缓解时间。IRM 借助 Stackdriver 操作数据的广度、深度和新鲜度,在突发事件的上下文中生成数据洞见,加快调查流程。

零配置起步

零配置开启 SRE 之旅

IRM 精心整理了 SRE 突发事件响应最佳做法,助力用户制定管理生产中突发事件的流程,实现 SRE 之旅中的关键里程碑。与 Stackdriver Alerting 配合使用时,您不需要对 IRM 执行任何配置即可着手开始使用。

加速调查

借助数据洞见加速调查

对您的 Stackdriver 操作数据执行智能分析,快速识别与突发事件相关的高价值信息。机器学习技术能提供与您的环境密切相关的数据洞见,在您的环境随着事件推移而变化时也能灵活微调所提供信息的内容。

连续学习

连续学习

轻松构建模型,迅速捕获关键突发事件响应活动和相应决策,以备后续在 IRM 中相应的上下文中呈现给用户,缩短突发事件的平均缓解时间。

特性

事态认知

在收到 Stackdriver 警报时,立即查看存在问题的指标的图表、警报细节、更多操作数据的深层链接以及既往或当前的类似突发事件,便于快速了解警报涉及的范围并确定后续举措。

SRE 角色

利用 Google SRE 突发事件响应角色(Incident Commander、Ops Lead 等)指挥和控制突发事件,确保响应措施中不存在疏漏或重叠。

上下文转移

轮班移交系统能更好地促进相关上下文在轮值班次之间的转移。

Slack 集成

立即利用 Stackdriver Alerting 的 Slack 配置,指定突发事件的主要通讯频道,并订阅相关 Slack 频道,随时了解突发事件的最新动向。

升级的突发事件和预设

提高团队成员对于大规模突发事件的认知,以便更好地协调响应工作。利用 IRM 的预设预先指定总结模板、方案手册链接和其他信息、标签以及需要通知的利益相关者外部团队,从而加快突发事件响应流程。

灵活的 API

Incident API(Alpha 版)为 IRM 的自定义 ChatOps 界面提供了扩展能力,使之能够通过 Slack 和其他聊天工具汇报和跟踪突发事件的最新动向。填写这份表单,列示需要加入 API Alpha 版白名单的内容。

价格

IRM 的 Alpha 版目前可免费体验使用。使用其功能不会产生任何费用,也不会耗用相关配额。

资源

Google Cloud

开始使用

学习和构建

刚接触 GCP?您可以领取 $300 赠金,免费开始使用任意 GCP 产品。

需要更多帮助?

我们的专家会根据您的需求,帮您打造合适的解决方案,或帮您寻找合适的合作伙伴。

此产品目前为 Alpha 版。要详细了解我们的产品发布阶段,请点击此处

发送以下问题的反馈:

此网页
Stackdriver Incident Response and Management (IRM) Documentation
需要帮助?请访问我们的支持页面