Cloud Monitoring ダッシュボードを使用する
このページでは、Cloud Monitoring ダッシュボードを使用して、使用可能な指標を表示する方法、カスタム ダッシュボードを作成する方法、アラートを設定する方法について説明します。
Firestore の指標を表示する
さまざまな Firestore 指標を表示してグラフを作成するには、次のいずれかを使用します。
Google Cloud コンソールの [Firestore] セクションにある [Monitoring] ページ。このページには、事前定義されたモニタリング ダッシュボードが表示されます。最大 1 つのカスタム ダッシュボードを作成することもできます。データベースの [モニタリング] ページにアクセスする手順は次のとおりです。
Google Cloud コンソールで、Firestore の [データベース] ページを開きます。
リストからデータベースを選択します。
ナビゲーション メニューで [モニタリング] をクリックしてダッシュボードを開きます。
Google Cloud コンソールの Cloud Monitoring 内の指標エクスプローラ。グラフの作成の詳細については、Metrics Explorer でグラフを作成するをご覧ください。
Cloud Monitoring ダッシュボードを表示する
Cloud Monitoring では、カスタム ダッシュボードを使用して、関連する情報を体系的に表示できます。たとえば、本番環境のプロジェクトのパフォーマンス指標とアラート ポリシーを表示するダッシュボードを作成できます。
カスタム ダッシュボードの設定の詳細については、カスタム ダッシュボードを管理するとダッシュボード ウィジェットを追加するをご覧ください。
エラー率をモニタリングする
モニタリング ダッシュボードを作成して、エラー率をモニタリングし、データベースの可用性を確保できます。可用性とは、データベースが予想される時間枠内で、正常なステータス コードで応答する率を指します。Firestore SLA では、有効なリクエストとして分類される内容の詳細が定義されています。
エラー率は、エラー レスポンスとなったリクエストの数を、送信されたリクエストの合計数で割ることによって求められます。
エラー率を計算するダッシュボードの例は、4xx
または 5xx
のエラー コードを持つ有効なリクエストの api/request_count
と、すべての有効なリクエストの api/request_count
の A/B 比率を計算することで作成できます。
図 1 は、Metrics Explorer で api/request_count 指標を使用してエラー率を可視化する方法を示しています。
アラート ポリシーを作成する
Cloud Monitoring では、アラートを作成して、指標の条件が変更されたときに通知できます。これらのアラートを使用すると、ユーザーに影響を与える前に潜在的な問題を通知できます。
アラートの作成の詳細については、指標しきい値のアラート ポリシーを作成するをご覧ください。
レイテンシ アラート ポリシーを作成する次の例について考えてみます。アラート ポリシーは、5 分間のローリング ウィンドウで p99 レイテンシを確認します。p99 レイテンシが 5 分間 250 ミリ秒を超えると、アラートがトリガーされます。
Console
Google Cloud コンソールで、モニタリングページに移動して、notifications アラートを選択します。
[ポリシーを作成] を選択します。
[Consumed API] リソースから [Request Latencies] 指標を選択します。
Firestore ネイティブ データベースの
firestore.googleapis.com
のサービスフィルタを追加。[次へ] をクリックしてトリガーを構成します。
[条件タイプ] として [しきい値] を選択します。
しきい値条件は、しきい値 250 ms に設定されています。アラートは、ローリング ウィンドウの期間全体(5 分間)に p99 レイテンシ値が同じ状態の場合にトリガーされます。
[しきい値] を 250 に設定します。
[次へ] をクリックして通知を構成します。
アラート ポリシー名を設定し、[次へ] をクリックします。
アラート構成を確認して [ポリシーを作成] をクリックします。
MQL
Monitoring Query Language(MQL)クエリを使用して、同じレイテンシ アラート ポリシーを実装できます。MQL の使用例については、MQL クエリの例をご覧ください。
fetch consumed_api
| metric 'serviceruntime.googleapis.com/api/request_latencies'
| filter (resource.service == 'firestore.googleapis.com')
| group_by 5m,
[value_request_latencies_percentile:
percentile(value.request_latencies, 99)]
| every 5m
| condition val() > 0.25 's'