このドキュメントでは、Google Cloud コンソールを使用して、指標をモニタリングするアラート ポリシーを作成する方法について説明します。たとえば、仮想マシン(VM)の CPU 使用率をモニタリングするアラート ポリシーがトリガーされると、このポリシーによりオンコール チームに通知されることがあります。または、稼働時間チェックをモニタリングするポリシーにより、オンコール チームと開発チームに通知されることがあります。
このコンテンツは、ログベースのアラート ポリシーには適用されません。ログに特定のメッセージが表示されたときに通知する、ログベースのアラート ポリシーの詳細については、ログのモニタリングをご覧ください。
このドキュメントでは、以下については説明しません。
始める前に
-
Google Cloud コンソールを使用してアラート ポリシーを作成および変更するために必要な権限を取得するには、プロジェクトに対するモニタリング編集者(
roles/monitoring.editor
)の IAM ロールの付与を管理者に依頼してください。ロールの付与の詳細については、アクセスの管理をご覧ください。Cloud Monitoring のロールの詳細については、アクセス制御をご覧ください。
アラート ポリシーの一般的なコンセプトに精通していることを確認してください。 これらのトピックについては、アラートの概要をご覧ください。
アラートの受信に使用する通知チャンネルを構成します。これらの手順については、通知チャンネルを管理するをご覧ください。
冗長性を確保するために、複数のタイプの通知チャンネルを作成することをおすすめします。詳細については、通知チャンネルを管理するをご覧ください。
アラート ポリシーを作成する
このセクションでは、アラート ポリシーの作成方法について説明します。デフォルトでは、Google Cloud コンソールでアラート作成フローを開始すると、メニュー形式のインターフェースが表示されます。これらのメニューを使用して、モニタリングする指標タイプを選択し、ポリシーを構成します。指標選択メニューには、Google Cloud サービスによって生成されたすべての指標タイプと、定義したカスタム指標タイプが表示されます(指標タイプのデータがある場合)。
条件には 3 種類あります。これらの条件は、しきい値を超える指標の値、指標データが存在しないか、しきい値を超える指標の予測値に基づいてトリガーされます。これらの条件を構成する方法については、このドキュメントの次のセクションをご覧ください。
Google Cloud サービスによって生成された指標タイプや定義したカスタム指標タイプ以外のアラートを作成するには、特別なアラート作成フローのいずれかを使用します。たとえば、Google Cloud コンソールの [サービス] ページには、サービスレベル目標(SLO)のモニタリングに特化したガイド付きアラート作成フローが用意されています。ユーザーの関心がありそうな特殊なタイプのアラート ポリシーについては、以下をご覧ください。
ログメッセージの内容をモニタリングする場合は、ログのモニタリングをご覧ください。
指標の比率をモニタリングする場合は、MQL のアラート ポリシーをご覧ください。
指標の値に関するアラート
このセクションでは、組み込み指標タイプまたは作成したカスタム指標タイプをモニタリングするアラート ポリシーを作成し、その指標の値を静的しきい値と比較する方法について説明します。時系列の値を動的しきい値と比較するポリシーを作成するには、MQL を使用する必要があります。詳細については、MQL を使用して動的重大度を作成するをご覧ください。
このコンテンツは、ログベースのアラート ポリシーには適用されません。ログに特定のメッセージが表示されたときに通知する、ログベースのアラート ポリシーの詳細については、ログのモニタリングをご覧ください。
その指標の値と静的なしきい値を比較するアラート ポリシーを作成するには、次の手順を行います。
Google Cloud コンソールで [Monitoring] を選択するか、次のボタンをクリックします。
[Monitoring] に移動ナビゲーション パネルで notifications [アラート] を選択し、[ポリシーを作成] をクリックします。
モニタリング対象の時系列を選択します。
[Select a metric] をクリックして、フィルタバーに目的の指標タイプまたはリソースタイプの名前を入力します。たとえば、フィルタバーに「VM インスタンス」と入力すると、VM インスタンスの指標タイプのみが表示されます。「CPU」と入力すると、名前に「CPU」が含まれる指標タイプのみがメニューに表示されます。
メニューを移動して指標を選択し、[適用] をクリックします。
モニタリングする指標タイプが一覧に表示されない場合は、[Select a metric] メニューで [Show only active resources & metrics] を無効にします。詳細については、トラブルシューティング: 指標がメニューに表示されないをご覧ください。
省略可: 前のステップで選択した指標とリソースタイプに一致する時系列のサブセットをモニタリングするには、[フィルタを追加] をクリックします。フィルタ ダイアログで、フィルタリングに使用するラベル、コンパレータ、フィルタ値を選択します。たとえば、フィルタ
zone =~ ^us.*.a$
はゾーン名がus
で始まりa
で終わるすべての時系列データに一致する正規表現を使用します。詳細については、選択したデータをフィルタするをご覧ください。省略可: 時系列のポイントの配置方法を変更するには、[Transform data] セクションの [ローリング ウィンドウ] と [ローリング ウィンドウ関数] を設定します。
これらのフィールドは、ウィンドウに記録されるポイントの組み合わせ方を指定します。たとえば、ウィンドウが 15 分でウィンドウ関数が
max
であるとします。揃えられるポイントは最新の 15 分間に記録されたすべてのサンプルの最大値です。詳細については、時系列を配置するをご覧ください。省略可: ポリシーによってモニタリングされる時系列の数を減らす場合や、時系列のコレクションのみをモニタリングする場合は、時系列を結合します。たとえば、ゾーンの平均 VM インスタンスの CPU 使用率をモニタリングするとします。 デフォルトでは、時系列は結合されません。
すべての時系列を結合するには、次の操作を行います。
- [時系列をまたぐ] ヘッダーで expand_more [展開] をクリックします。
- [時系列集計] フィールドを
none
以外の値に設定します。たとえば、mean
を選択すると、表示される時系列の各ポイントは個々の時系列ポイントの平均になります。 - [時系列のグループ化の基準] フィールドが空であることを確認します。
ラベル値で時系列を結合またはグループ化するには、次の操作を行います。
- [時系列をまたぐ] ヘッダーで expand_more [展開] をクリックします。
- [時系列集計] フィールドを
none
以外の値に設定します。 - [時系列のグループ化の基準] フィールドで、グループ化するラベルを 1 つ以上選択します。
たとえば、
zone
でグループ化し、集計フィールドをmean
に設定すると、グラフに各ゾーンに対して 1 つの時系列が表示されます。特定のゾーンに表示される時系列は、そのゾーンを持つすべての時系列の平均です。[セカンダリ データ変換] フィールドは、デフォルトで無効になっています。有効にした場合、これらのオペレーションはプライマリ データの変換後に適用されます。
詳細については、時系列を結合するをご覧ください。
[Next(次へ)] をクリックします。
条件のトリガーを構成します。
[条件タイプ] フィールドはデフォルト値の [しきい値] のままにします。
[Alert trigger] メニューの値を選択します。このメニューを使用すると、条件をトリガーする前にしきい値に違反する必要がある時系列のサブセットを指定できます。
[しきい値の位置] と [しきい値] を使用して、指標の値がしきい値に違反するタイミングを入力します。たとえば、これらの値を [しきい値より上] と [
0.3
] に設定すると、0.3
より高い測定値はしきい値に違反します。省略可: 測定値がしきい値に違反してアラートがインシデントを生成するまでの期間を選択するには、[詳細オプション] を開いて [再テスト ウィンドウ] メニューを使用します。
デフォルト値は [再テストなし] です。この設定では、1 回の測定で通知を行えます。詳細と例については、アライメントの期間と継続時間をご覧ください。
省略可: データの受信が停止したときに Monitoring が条件を評価する方法を指定するには、[詳細オプション] を開いて [Evaluation missing data] メニューを使用します。
[再テスト ウィンドウ] の値が [再テストなし] の場合、[評価の欠落データ] メニューが無効になります。
Google Cloud コンソール
[欠落データの評価] フィールドSummary 詳細 欠落データがない 対応待ちのインシデントはオープンのままです。
新しいインシデントはオープンされません。条件が満たされている場合、データが到着しなくなっても、条件は引き続き満たされます。この条件でインシデントが対応待ちの場合、インシデントは対応待ちのままになります。インシデントが対応待ちで、データが送られてこない場合、自動クローズ タイマーは 15 分以上の時間をおいて開始されます。タイマーの期限が切れると、インシデントはクローズされます。
条件が満たされていない場合、データが到着しなくなっても、条件は引き続き満たされません。
欠落データポイントが、ポリシーに違反する値として扱われる 対応待ちのインシデントはオープンのままです。
新しいインシデントをオープンできます。条件が満たされている場合、データが到着しなくなっても、条件は引き続き満たされます。この条件でインシデントが対応待ちの場合、インシデントは対応待ちのままになります。インシデントが対応待ちで、自動クローズ期間に 24 時間を加えた期間にデータが到着しない場合、インシデントはクローズされます。
条件が満たされない場合は、この設定により、指標しきい値の条件が
metric-absence condition
のように動作します。再テストの時間枠で指定された時間内にデータを受信しない場合は、条件が満たされたと評価されます。条件が 1 つのアラート ポリシーでは、条件が満たされるとインシデントが開始されます。欠落データポイントが、ポリシーに違反しない値として扱われる 対応待ちのインシデントはクローズされます。
新しいインシデントはオープンされません。条件が満たされている場合、データの受信が停止すると、その条件は満たされなくなります。この条件のインシデントが対応待ちの場合、インシデントはクローズされます。
条件が満たされていない場合、データが到着しなくなっても、条件は引き続き満たされません。
[Next(次へ)] をクリックします。
省略可: 複数の条件を持つアラート ポリシーを作成します。
ほとんどのポリシーは、1 つの指標タイプをモニタリングします。たとえば、ポリシーで VM インスタンスに書き込まれたバイト数をモニタリングする場合があります。複数の指標タイプをモニタリングする場合は、複数の条件を持つポリシーを作成します。各条件では 1 つの指標タイプがモニタリングされます。条件を作成したら、条件を組み合わせる方法を指定します。詳細については、複数の条件を持つポリシーをご覧ください。
複数の条件を持つアラート ポリシーを作成するには、次の操作を行います。
- 追加する条件ごとに、[条件を追加] をクリックして条件を構成します。
- [次へ] をクリックし、条件を組み合わせる方法を構成します。
- [次へ] をクリックして通知とドキュメントの設定に進みます。
通知とドキュメントを構成します。
[通知チャネル] メニューを開いて通知チャネルを選択します。 冗長性を確保するために、複数のタイプの通知チャンネルをアラート ポリシーに追加することをおすすめします。詳細については、通知チャンネルを管理するをご覧ください。
インシデントがクローズされたときに通知を受け取るには、[Notify on incident closure] を選択します。 デフォルトでは、Google Cloud コンソールでアラート ポリシーを作成すると、インシデントが作成されたときにのみ通知が送信されます。
省略可: データの受信が停止してからインシデントがクローズされるまでの Monitoring の待機時間を変更するには、[インシデントの自動クローズ期間] メニューからオプションを選択します。 デフォルトでは、データの受信が停止すると、Monitoring は対応待ちのインシデントがクローズされるまで 7 日間待機します。
省略可: アラート ポリシーにカスタムラベルを追加するには、[Policy user labels] セクションで、次の操作を行います。
- [ラベルを追加] をクリックして、[キー] フィールドにラベルの名前を入力します。ラベル名の先頭は小文字にする必要があり、小文字、数字、アンダースコア、ダッシュを使用できます。たとえば、「
severity
」と入力します。 - [値] をクリックし、ラベルの値を入力します。ラベルの値には、英小文字、数字、アンダースコア、ダッシュを使用できます。たとえば、「
critical
」と入力します。
ポリシーラベルを使用してアラートを管理する方法については、アラート ポリシーに重大度レベルを追加するをご覧ください。
- [ラベルを追加] をクリックして、[キー] フィールドにラベルの名前を入力します。ラベル名の先頭は小文字にする必要があり、小文字、数字、アンダースコア、ダッシュを使用できます。たとえば、「
省略可: 通知付きのカスタム ドキュメントを指定する場合は、その内容を [ドキュメント] セクションに入力します。ドキュメントのフォーマットには Markdown を使用できます。ポリシー自体から情報を pull してドキュメントの内容を調整するには、変数を使用できます。 たとえば、
Addressing High CPU Usage
などのタイトルと、プロジェクトを識別する詳細をドキュメントに含めることができます。## Addressing High CPU Usage This note contains information about high CPU Usage. You can include variables in the documentation. For example: This alert originated from the project ${project}, using the variable $${project}.
通知が作成されると、Monitoring によって変数が通知の値に置き換えられます。この値は通知でのみ変数に置き換えられます。プレビュー ペインと Google Cloud コンソールの他の場所では、マークダウンの書式のみが表示されます。
詳細については、ドキュメント テンプレートでマークダウンと変数を使用するとチャネル コントロールの使用をご覧ください。
[アラート名] をクリックして、アラート ポリシーの名前を入力します。
[ポリシーを作成] をクリックします。
指標の不在に関するアラート
指定された期間の指標データの受信を停止したときに通知を受けるには、指標の不在条件でアラート ポリシーを作成します。指標の不在条件では、そのポリシーのインストールまたは変更後、最大期間時間枠内に測定が 1 回以上成功(測定でデータが取得される)している必要があります。構成可能な最大期間時間枠は、Google Cloud コンソールを使用する場合は 24 時間、Cloud Monitoring API を使用する場合は 24.5 時間です。
指標の不在条件を使用してアラート ポリシーを作成するには、次の操作を行います。
- Google Cloud コンソールで [Monitoring] を選択するか、次のボタンをクリックします。
[Monitoring] に移動 - ナビゲーション パネルで notifications [アラート] を選択し、[ポリシーを作成] をクリックします。
- モニタリング対象の指標を選択し、フィルタを追加して、データの変換方法を指定します。この手順は、すべての種類の条件で共通です。これらの手順の詳細については、指標値に関するアラート: 時系列を選択するをご覧ください。
条件のトリガーを構成します。
- 条件のタイプには [指標の不在] を選択します。
- [Alert trigger] メニューの値を選択します。このメニューを使用すると、条件をトリガーする前にデータを含めない時系列のサブセットを指定できます。
- [トリガーとなる不在時間] フィールドを使用してアラート通知を送信する前の指標データの不在時間を指定します。
モニタリングでは常に、ローリング ウィンドウを 24 時間に設定して「指標の不在」の条件を評価します。コンソールには、入力した値がオーバーライドされていることを示すメッセージが表示されます。
アラート ポリシーの通知チャネル、ドキュメント、名前を構成します。詳細については、指標値に関するアラート: 通知とドキュメントをご覧ください。
アラート ポリシーを確認して、[ポリシーを作成] をクリックします。
指標の予測値に関するアラートを作成する
予測ウィンドウでしきい値に違反するとアラート ポリシーが予測したときに通知を受け取るには、予測条件を作成します。予測条件は、制約指標をモニタリングするように設計されています。制約指標には、割り当て、メモリ、ストレージの使用状況を記録する指標が含まれます。
予測に基づいてアラートを作成するアラート ポリシーを作成するには、次の手順を行います。
- Google Cloud コンソールで [Monitoring] を選択するか、次のボタンをクリックします。
[Monitoring] に移動 - ナビゲーション パネルで notifications [アラート] を選択し、[ポリシーを作成] をクリックします。
モニタリング対象の指標を選択し、フィルタを追加して、データの変換方法を指定します。この手順は、すべての種類の条件で共通です。これらの手順の詳細については、指標値に関するアラート: 時系列を選択するをご覧ください。
値のタイプが double または int64 の制約指標を選択し、Amazon VM インスタンスの指標は選択しません。64 を超える時系列がモニタリングされると、Monitoring は値がしきい値に最も近い 64 個の時系列、またはすでにしきい値を超えている時系列を予測します。その他の時系列では、その値がしきい値と比較されます。
条件のトリガーを構成します。
条件のタイプとして [予測] を選択します。
[Alert trigger] メニューの値を選択します。このメニューを使用すると、条件をトリガーする前にしきい値に違反する必要がある時系列のサブセットを指定できます。
[予測ウィンドウ] の値を選択します。選択した値は、将来の予測時間です。この値は 1 時間(3,600 秒)から 7 日(604,800 秒)に設定する必要があります。
[しきい値の位置] と [しきい値] を使用して、選択した指標の予測値がしきい値に違反するタイミングを入力します。たとえば、これらの値を [しきい値より上] と [
10
] に設定すると、10
より高い測定値はしきい値に違反します。省略可: [詳細オプション] を開いて、[再テスト ウィンドウ] の値を設定します。このフィールドのデフォルト値は [再テストなし] です。この項目は 10 分以上に設定することをおすすめします。
たとえば、任意の時系列で条件がトリガーされるように予測条件を構成するとします。また、[再テスト ウィンドウ] が 15 分、予測ウィンドウが 1 時間、時系列が [Threshold] よりも高く、10 に設定されています。次のいずれかが発生すると、条件がトリガーされます。
- 時系列のすべての値が 10 を超え、少なくとも 15 分間は継続します。
- 15 分間隔で、1 つの時系列のすべての予測で、1 時間以内のうちにしきい値 10 を超えると予測されます。
省略可: データの受信が停止したときに Monitoring が条件を評価する方法を指定するには、[詳細オプション] を開いて [Evaluation missing data] メニューを使用します。
[再テスト ウィンドウ] の値が [再テストなし] の場合、[評価の欠落データ] メニューが無効になります。
データが 10 分以上欠落している場合、予測条件では予測が停止し、代わりに [評価の欠落データ] フィールドの値を使用してインシデントの管理方法が決まります。 モニタリングが再起動されると、予測が再起動されます。
Google Cloud コンソール
[欠落データの評価] フィールドSummary 詳細 欠落データがない 対応待ちのインシデントはオープンのままです。
新しいインシデントはオープンされません。条件が満たされている場合、データが到着しなくなっても、条件は引き続き満たされます。この条件でインシデントが対応待ちの場合、インシデントは対応待ちのままになります。インシデントが対応待ちで、データが送られてこない場合、自動クローズ タイマーは 15 分以上の時間をおいて開始されます。タイマーの期限が切れると、インシデントはクローズされます。
条件が満たされていない場合、データが到着しなくなっても、条件は引き続き満たされません。
欠落データポイントが、ポリシーに違反する値として扱われる 対応待ちのインシデントはオープンのままです。
新しいインシデントをオープンできます。条件が満たされている場合、データが到着しなくなっても、条件は引き続き満たされます。この条件でインシデントが対応待ちの場合、インシデントは対応待ちのままになります。インシデントが対応待ちで、自動クローズ期間に 24 時間を加えた期間にデータが到着しない場合、インシデントはクローズされます。
条件が満たされない場合は、この設定により、指標しきい値の条件が
metric-absence condition
のように動作します。再テストの時間枠で指定された時間内にデータを受信しない場合は、条件が満たされたと評価されます。条件が 1 つのアラート ポリシーでは、条件が満たされるとインシデントが開始されます。欠落データポイントが、ポリシーに違反しない値として扱われる 対応待ちのインシデントはクローズされます。
新しいインシデントはオープンされません。条件が満たされている場合、データの受信が停止すると、その条件は満たされなくなります。この条件のインシデントが対応待ちの場合、インシデントはクローズされます。
条件が満たされていない場合、データが到着しなくなっても、条件は引き続き満たされません。
[Next(次へ)] をクリックします。
アラート ポリシーの通知チャネル、ドキュメント、名前を構成します。詳細については、指標値に関するアラート: 通知とドキュメントをご覧ください。
アラート ポリシーを確認して、[ポリシーを作成] をクリックします。
指標の変化率に関するアラート
指標の変化率がしきい値を超えた場合に通知を受け取るには、変化率のアラート ポリシーを作成します。たとえば、CPU 使用率の急激な上昇時に通知を受け取るには、このタイプのポリシーを作成します。
このタイプのポリシーを作成するには、指標値に関するアラートで説明されている手順を行います。ただし、[ローリング ウィンドウ関数] フィールドが [percent change] に設定されていることを確認します。
percent change 関数を選択すると、Monitoring は次の処理を行います。
- 時系列に
DELTA
またはCUMULATIVE
の指標の種類がある場合、その時系列はGAUGE
の指標の種類を持つ時系列に変換されます。変換の詳細については、種類、タイプ、コンバージョンをご覧ください。 直近 10 分間のウィンドウの平均値を、再テストの前の 10 分間のウィンドウの平均値と比較することで変化率を計算します。
10 分間のルックバック ウィンドウは固定値です。変更はできません。ただし、条件を作成するときに再テスト ウィンドウを指定できます。
VM 上で実行されているプロセスの数に関するアラート
指定した条件を満たす VM 上で実行されているプロセスの数をモニタリングするには、process-health アラート ポリシーを作成します。たとえば、root ユーザーが開始したプロセスの数をカウントできます。呼び出しコマンドに特定の文字列が含まれるプロセスの数を数えることもできます。アラート ポリシーでは、プロセス数がしきい値を上回るか、下回ったときに通知できます。モニタリングできるプロセスについては、モニタリング対象のプロセスをご覧ください。
プロセスの状態の指標は、Ops エージェントまたは Monitoring エージェントがモニタリング対象リソースで実行されているときに使用できます。エージェントの詳細については、Google Cloud オペレーション スイートのエージェントをご覧ください。
VM 上で実行されているプロセスの数をモニタリングする手順は次のとおりです。
Google Cloud コンソールで [Monitoring] を選択するか、次のボタンをクリックします。
[Monitoring] に移動ナビゲーション パネルで notifications [アラート] を選択し、[ポリシーを作成] をクリックします。
[?] を選択して[指標の選択] ヘッダーをクリックして、ツールチップの [ダイレクト フィルタモード] を選択します。
モニタリング フィルタを入力します。
たとえば、名前に
nginx
が含まれている Compute Engine VM インスタンスで動作しているプロセスの数をカウントするには、次のように入力します。select_process_count("monitoring.regex.full_match(\".*nginx.*\")") resource.type="gce_instance"
詳しくは、次のリソースをご覧ください。
- 仮想マシン上で動作しているプロセスのカウントに使用するフィルタについては、プロセスの状態のフィルタをご覧ください。
- 一般的な構文については、Monitoring フィルタをご覧ください。
アラート ポリシー ダイアログを終了します。この手順は、このセクションでのみ概説しています。詳細については、指標値に関するアラートをご覧ください。
- 省略可: データ変換の設定を確認して更新します。
- [次へ] をクリックして条件のトリガーを構成します。
- [次へ] をクリックし、通知とドキュメントの手順を完了します。
- [アラート名] をクリックして、アラート ポリシーの名前を入力します。
- [ポリシーを作成] をクリックします。
モニタリング対象のプロセス
プロセスの状態条件によって、システム内で実行中のすべてのプロセスをモニタリングできるわけではありません。この条件により、プロセスを呼び出したコマンドラインに適用される正規表現を使用して、モニタリングするプロセスが選択されます。コマンドライン フィールドが使用できない場合、プロセスはモニタリングできません。
プロセスの状態条件でプロセスをモニタリングできるかどうかを判別する方法の 1 つは、アクティブなプロセスを調べることです。たとえば、Linux システムの場合、ps
コマンドを使用できます。
ps aux | grep nfs
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1598 0.0 0.0 0 0 ? S< Oct25 0:00 [nfsd4]
root 1639 0.0 0.0 0 0 ? S Oct25 2:33 [nfsd]
root 1640 0.0 0.0 0 0 ? S Oct25 2:36 [nfsd]
COMMAND
エントリが角かっこで囲まれている場合(たとえば、[nfsd]
)、プロセスのコマンドライン情報は利用できません。この場合、Cloud Monitoring を使用してプロセスをモニタリングすることはできません。
SLO 違反時のアラート
定義されたサービスレベル目標(SLO)に違反する危険があるときに通知を受け取るために、アラート ポリシーを作成します。たとえば、システムの SLO の中には、1 週間に 99% の可用性を実現するというものもあります。別の SLO では、30 日間のローリング期間中のリクエストのうち、レイテンシが 300 ミリ秒を超えるリクエストは 5% しか指定できません。
SLO のアラートの作成方法については、次のドキュメントをご覧ください。
Cloud Monitoring API の使用時に SLO アラート ポリシーを作成するには、API に提供するデータに時系列セレクタを含めます。 これらのセレクタの詳細については、SLO データの取得をご覧ください。
Google Cloud コンソールのアラート インターフェースを使用して、SLO アラート ポリシーを作成できます。手順については、プロセス状態のアラート ポリシーを作成するをご覧ください。ただし、Monitoring フィルタを入力する手順になったら、プロセスの状態式ではなく、時系列セレクタを入力します。
稼働時間チェックが失敗した場合のアラート
稼働時間チェックが失敗したときに通知するアラート ポリシーを作成することをおすすめします。稼働時間チェック インフラストラクチャには、ガイド付きのアラート作成フローが含まれています。 これらの手順の詳細については、稼働時間チェックに関するアラートをご覧ください。
条件をリソース グループに制限する
いくつかの条件でグループのメンバーが定義されているリソースのコレクションをモニタリングする場合は、リソース グループを作成してグループをモニタリングします。たとえば、本番環境で使用する Compute Engine VM インスタンスのリソース グループを定義できます。そのグループを作成したら、インスタンスのグループのみをモニタリングするアラート ポリシーを作成できます。グループ条件に一致する VM を追加すると、アラート ポリシーによってその VM が自動的にモニタリングされます。
リソース グループのアラート ポリシーは、Google Cloud コンソールを使用して作成できます。手順については、プロセス状態のアラート ポリシーを作成するをご覧ください。ただし、指標を選択してから、時系列を制限するフィルタをそのグループの基準と一致する時系列に追加します。
リソース グループをモニタリングするアラート ポリシーを作成するには、次の操作を行います。
Google Cloud コンソールで [Monitoring] を選択するか、次のボタンをクリックします。
[Monitoring] に移動ナビゲーション パネルで notifications [アラート] を選択し、[ポリシーを作成] をクリックします。
モニタリング対象の時系列を選択します。
[Select a metric] をクリックして、フィルタバーに目的の指標タイプまたはリソースタイプの名前を入力します。たとえば、フィルタバーに「VM インスタンス」と入力すると、VM インスタンスの指標タイプのみが表示されます。「CPU」と入力すると、名前に「CPU」が含まれる指標タイプのみがメニューに表示されます。
メニューを移動して指標を選択し、[適用] をクリックします。
モニタリングする指標タイプが一覧に表示されない場合は、[Select a metric] メニューで [Show only active resources & metrics] を無効にします。詳細については、トラブルシューティング: 指標がメニューに表示されないをご覧ください。
[フィルタを追加] をクリックして [グループ] を選択します。
arrow_drop_down [値] を開いて、グループ名を選択します。
[完了] をクリックします。
指標値に関するアラート: トリガーを構成するの説明に沿って、アラート ポリシーを構成する手順を完了します。
トラブルシューティング: 指標がメニューに表示されない
デフォルトでは、[指標を選択] メニューには、データが存在するすべての指標タイプが一覧表示されます。たとえば、Pub/Sub を使用していない場合、これらのメニューに Pub/Sub 指標は表示されません。
アラートでモニタリングするデータがまだ存在しない場合でも、アラートを構成できます。
Google Cloud 指標をモニタリングするアラートを作成するには、指標値のアラートの手順に従います。ただし、指標を選択するステップでは、[指標を選択] メニューで [有効なリソースと指標のみを表示] を無効にします。無効にすると、Google Cloud サービスのすべての指標とデータのあるすべての指標がメニューに表示されます。
カスタム指標タイプによってデータが生成される前に、カスタム指標タイプのアラートを構成する場合は、プロセスの状態のアラート ポリシーの作成の手順に沿って行います。Monitoring フィルタを入力する手順になったら、指標タイプとリソースを指定するフィルタを入力します。指標タイプを指定する Monitoring フィルタの例を次に示します。
metric.type="compute.googleapis.com/instance/disk/write_bytes_count" resource.type="gce_instance"