Stackdriver Incident Response & Managementアルファ版

サービス停止の回数を低減し、期間を短縮し、小規模に抑えます

ヒーローバナー

概要

Stackdriver Incident Response and Management(IRM)は、実績のある対応プロセスとデータ駆動型のインテリジェンスを組み込んだエンドツーエンドのインシデントのライフサイクル管理を実現し、緩和までの時間の中央値を短縮します。幅広く深い、新鮮な Stackdriver のデータを活用して、インシデントの状況に応じて情報を自動的に関連付け、分析情報を提供し、調査プロセスを高速化できます。

導入に設定は不要

設定なしで実現可能な SRE

IRM は Google SRE のインシデント対応のベスト プラクティスを体系化しているため、本番環境のインシデントを管理するプロセスのメインとなる SRE を実現できます。Stackdriver のアラート機能と組み合わせれば、IRM の導入に設定は不要です。

調査を加速させる

分析情報によって調査を加速

Stackdriver のデータをインテリジェントに分析して、インシデントに関連する価値の高い情報を迅速に特定します。機械学習によって、環境が時間とともに変化してもその状況に最適な分析情報が提供されます。

継続的な学習

継続的な学習

容易に構築して重要なインシデント対応アクティビティと決定を迅速に捉え、収集したデータを状況に合わせて IRM で情報提示し、緩和までの時間の中央値を短縮できます。

特長

状況認識

Stackdriver のアラート機能では、違反している指標のグラフ、アラートの詳細、その他のデータへのディープリンク、過去と現在の類似インシデントを直ちに確認して、アラートの対象範囲をすばやく把握し、次の手順を決定できます。

SRE の役割

Google SRE のインシデント対応の役割(Incident Commander、Ops Lead など)を使用して、インシデントを統制および管理し、隔たりや重複のない対応が可能となります。

情報共有

シフト引き継ぎシステムにより、スタッフ間の情報共有がよりスムーズになります。

Slack との統合

Stackdriver のアラート機能の Slack との連携をすぐに利用して、インシデントにおけるメインの情報共有ツールを示し、Slack チャネルに登録してインシデントの最新情報を入手できます。

インシデントとプリセットのエスカレート

チーム内で広範囲にわたるインシデントに対する認識を高め、対応をより柔軟に調整できます。IRM のプリセットを使用して、概要テンプレート、ハンドブックなどの情報へのリンク、タグ、関係者と外部チームを事前に指定することで、プロセスの効率を向上させます。

柔軟な API

Incident API(アルファ版)では、IRM の UI をカスタムの ChatOps プラグイン用に拡張可能で、Slack などのチャットツールでインシデントについての最新情報を入手したり追跡したりできます。こちらのフォームに記入して、API アルファ版のホワイトリストにご登録ください。

料金

アルファ版の間、IRM は現在無料でご利用いただけます。機能の使用に伴う費用や割り当てはありません。

リソース

Google Cloud

使ってみる

無料で体験

GCP を初めてご利用の場合、あらゆる GCP プロダクトを $300 相当の無料クレジットでお試しいただけます。

さらにサポートが必要な場合

Google のエキスパートが、適切なソリューションの構築や、お客様のニーズに合ったパートナーを見つけるお手伝いをいたします。

このプロダクトはアルファ版です。プロダクトのリリース段階の詳細については、こちらをご覧ください。

フィードバックを送信...

Stackdriver Incident Response and Management (IRM) Documentation
ご不明な点がありましたら、Google のサポートページをご覧ください。