指標の使用状況の表示と管理

このドキュメントでは、Cloud Monitoring の [指標管理] ページについて説明します。ここでは、オブザーバビリティに影響を与えることなく、課金対象指標の使用量を制御するために役立つ情報が提供されています。指標管理ページを使用すると、次のことができます。

プロジェクトで積極的に収集する課金対象の指標を決定します。
最も多くのデータを送信しているプロジェクトを特定します。
Google Cloud プロジェクトで使用される課金対象の指標に関連する費用を把握します。
使用パターンが変化したときに通知を受け取ることができるようにアラートを設定します。指標データの全体的な取り込みと、指標の動きに関するアラートを設定できます。
カスタムダッシュボードとアラートポリシーで、課金対象の指標がどのように使用されているかを確認します。ダッシュボードまたはアラートポリシーで指標を使用しない場合、その指標にはオブザーバビリティの利点がありません。
アラートポリシーまたはダッシュボードが関連付けられていない指標のグラフとアラートポリシーを作成します。
課金対象の指標のカーディナリティに関する発生しうる問題を特定する。
指標データの書き込みのエラーをトラブルシューティングを行います。
課金対象の指標の収集に関連付けられた監査ログを表示します。監査ログについては、Cloud Audit Logs の概要をご覧ください。

[指標管理] ページには、Google Cloud プロジェクトがアクセスできる課金対象の指標に関する情報が表示されます。Google Cloud プロジェクトは、指標スコープに表示されるすべての指標にアクセスできます。

[指標管理] ページには、現在の Google Cloud プロジェクトで定義されているアラートポリシーとカスタムダッシュボードへのリンクも表示されます。指標スコープ内にあるが、別のプロジェクトで定義されている指標のアラートポリシーまたはカスタムダッシュボードを表示するには、プロジェクト選択ツールを使用して、指標を保存する Google Cloud プロジェクトを選択します。

[指標管理] ページから、指標のエラーに関連する監査ログを表示することもできます。これらのログは、エラーの原因を特定するのに役立ちます。

課金対象の指標の料金モデル

一般に、Cloud Monitoring システムの指標は無料であり、外部システムまたはアプリケーションの指標はそうではありません。課金対象の指標は、取り込まれたバイト数とサンプル数のいずれかによって課金されます。このセクションでは、バイトとサンプルに基づく取り込みについて説明します。

Cloud Monitoring の課金対象機能の詳細については、料金に関するドキュメントの Cloud Monitoring をご覧ください。料金について詳しくは、Cloud Monitoring の料金サマリーをご覧ください。

取り込まれたバイトまたはサンプルに基づく課金

課金対象の指標は、取り込まれたバイト数とサンプル数のいずれかに応じて課金されます。指標が書き込まれるたびに、書き込みオペレーションにはデータの値が含まれます。データ値は、整数や浮動小数点数などのスカラーの場合もあれば、複数の異なる値を含む複雑なデータ型の分布の場合もあります。指標が書き込む可能性のある値のタイプの詳細については、値のタイプをご覧ください。

取り込みバイト数と取り込みサンプル数のいずれが課金の対象であるかにかかわらず、指標が書き込まれる頻度（サンプリングレート）と、指標によって書き込まれるデータの種類（スカラーまたは分布）の両方が、取り込まれるデータの量に影響します。

「取り込まれたバイト数」とは、バイト単位で測定された、取り込まれたデータの量に基づく料金です。料金計算では、各スカラー値は 8 バイトとしてカウントされ、各分布は 80 バイトとしてカウントされます。詳細と例については、取り込まれたバイト数で課金される指標をご覧ください。
「取り込まれたサンプル」とは、取り込まれた測定数に基づいた料金を意味します。料金計算では、各スカラー値は 1 つのサンプルとしてカウントされ、各分布は 2 つのサンプルと、ゼロ以外のカウントを持つヒストグラムバケットごとに 1 つのサンプルとしてカウントされます。詳細と例については、取り込まれたサンプル数によって課金される指標をご覧ください。

2 つの料金モデルの最大の違いは、分布値です。バイトベースの取り込みでは分布に対して定額料金が請求されますが、サンプルベースの取り込みでは分布内のデータが考慮されます。まばらなヒストグラムを含む分布（ゼロ以外の値を持つヒストグラムバケットが少ない）は、密集したヒストグラムの分布よりもサンプルが少ない（ほとんどのバケットにゼロ以外の値がある）ものとしてカウントされます。

[指標管理] ページの課金対象の指標

[指標管理] ページでは、課金対象の指標がドメインごとに報告されます。ドメインは、指標の収集の方法と場所に関する情報を提供します。

次の表は、[指標管理] ページで使用できる課金対象の指標のカテゴリと、取り込まれたバイトとサンプルのどちらで測定されたかを示しています。

ドメイン	指標の接頭辞	料金モデル	意味
エージェント	`agent.googleapis.com`	バイト	エージェントによって外部リソースから収集される指標。これらの指標のリストについては、Ops エージェントの指標と以前の Monitoring と Logging の指標をご覧ください。従来の Monitoring エージェントによって収集されたサードパーティの統合からの指標も、「エージェント」指標として報告されます。サードパーティアプリケーションの指標をご覧ください。 `agent.googleapis.com/processes/` 指標は、他の課金対象の指標のボリュームレートの 5% で課金されます。たとえば、100 MiB のプロセス指標の取り込みには、5 MiB の他の課金対象指標の取り込みと同じ費用が発生します。エージェントはエージェント自体に関する指標も収集します。接頭辞 `agent.googleapis.com/agent` で識別されるこれらの指標は課金対象ではなく、指標管理ページには表示されません。
ユーザー定義（カスタム）	`custom.googleapis.com`	バイト	定義した指標。
外部	`external.googleapis.com`	バイト	オープンソースライブラリまたはサードパーティプロバイダの指標。詳細については、外部指標をご覧ください。
ワークロード	`workload.googleapis.com`	バイト	Ops エージェントによって書き込まれたサードパーティの統合の指標。これらの指標のリストについては、サードパーティアプリケーションの指標をご覧ください。
Prometheus	`prometheus.googleapis.com`	例	Google Cloud Managed Service for Prometheusまたは、Ops エージェントとPrometheus レシーバーまたはOTLP レシーバーを使用して収集される指標。

その他の課金対象の指標

[指標管理] ページでは、課金対象の次のカテゴリは報告されません。

ユーザー定義のログベースの指標。これらの指標は、ログエントリ内の値のカウントによって導出され、接頭辞 logging.googleapis.com/user が付けられます。ユーザー定義のログベースの指標は、取り込まれたバイト数によって課金されます。
AWS コネクタプロジェクトを使用して収集された AWS CloudWatch 指標。これらの指標には接頭辞 aws.googleapis.com が付けられ、取り込まれたバイト数で課金されます。

準備

[指標管理] ページに含まれるグラフとログを表示し、アラートポリシーを作成するには、正しい承認が付与されている必要があります。

承認

Google Cloud コンソールを使用してアラートポリシーのダッシュボードを表示して作成するために必要な権限を取得するには、プロジェクトに対する Monitoring 編集者（roles/monitoring.editor）の IAM ロールの付与を管理者に依頼してください。ロールの付与の詳細については、アクセスの管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

監査ログの表示に必要な権限を取得するには、プロジェクトに対するプライベートログビューア（roles/logging.privateLogViewer）のIAM ロール付与を管理者に依頼してください。ロールの付与の詳細については、アクセスの管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

ロールの詳細については、Identity and Access Management を使用してアクセスを制御するをご覧ください。
これらの指標によって生成された監査ログは、監査ロギングが有効になっている場合の [指標管理] ページで確認できます。データの読み取りまたは書き込み時に監査ログを生成するようにプロジェクトを構成するには、次のようにします。
1. Google Cloud コンソールで、[監査ログ] ページに移動します:
  [監査ログ] に移動
  
  検索バーを使用してこのページを検索する場合は、小見出しが [IAM と管理者] である結果を選択します。
2. フィルタバーに「Stackdriver Monitoring API」と入力します。
3. Stackdriver Monitoring API を選択します。
4. [ログタイプ] タブで、[データ書き込み] と [データ読み取り] を選択し、[保存] をクリックします。
詳しくは、データアクセス監査ログを構成するをご覧ください。

指標のスコープに関する情報を表示する

[指標管理] ページに表示される指標のセットは、プロジェクトの指標スコープによって異なります。プロジェクト自体が指標スコープ内にある場合、[指標管理] ページの指標は現在のプロジェクトのものです。プロジェクトの指標スコープに複数のプロジェクトがある場合、[指標管理] ページに表示される指標には、それらのすべてのプロジェクトの指標が含まれます。コストに最も大きく影響する指標は別のプロジェクトで発生している可能性があります。

プロジェクトのスコープ情報の概要を表示するには、[指標スコープ] をクリックします。この概要の内容は次のとおりです。

プロジェクトにアクセスできる IAM プリンシパル。プリンシパルのセットには、ユーザー、グループ、サービスアカウントが含まれます。
指標スコープに表示される無料と課金対象の両方の指標の数。
現在のプロジェクトでモニタリングされているプロジェクトのリスト。これらのすべてのプロジェクトの課金対象の指標は、[指標管理] ページで確認できます。
現在のプロジェクトの指標を表示できるプロジェクトに関する情報。

指標スコープの詳細については、マルチプロジェクトビューを構成するをご覧ください。

課金対象の指標を調査する

[指標管理] ページには、指標スコープ内の課金対象の各指標の表が表示されます。この機能を使用すると、次のことができます。

課金対象の指標を、特徴を共有するカテゴリでフィルタリングします。指標のカテゴリを調べると、テーブル内のすべての指標を調べるときに検出が難しいパターンが明らかになる場合があります。
課金対象のボリュームに対する指標の貢献度を確認します。
収集されているものの、アラートポリシーやダッシュボードで使用されていない指標を特定します。使用されていない指標データは、オブザーバビリティのギャップまたは費用削減の機会を示している場合があります。
アラートポリシーまたはカスタムダッシュボードが関連付けられていない指標のアラートポリシーまたはグラフを作成します。
指標データの取得元のプロジェクトを特定します。このテーブルには、指標スコープ内のすべてのプロジェクトの指標が含まれます。プロジェクト内で特定の指標が収集されたことを確認する必要が生じる場合があります。
各指標のラベルとカーディナリティの情報を確認します。この情報は、指標の設計または使用状況に関する問題を調査する際に役立ちます。

課金対象の各指標に関する使用状況データのテーブルを表示するには、次のようにします。

Google Cloud コンソールで、 [指標の管理] ページに移動します。
[指標の管理] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] である結果を選択します。
ツールバーで時間枠を選択します。デフォルトでは、[指標管理] ページには、過去 1 日間に収集された指標に関する情報が表示されます。次のスクリーンショットは、指標テーブルの例を示しています。

表示する指標を選択する

費用を管理するには、最も多くのトラフィックが発生している課金対象の指標を把握する必要があります。たとえば、1 時間ごとに 60 MiB のデータが取り込まれることを認識するだけでは不十分です。ただし、課金対象のデータのほとんどが 1 つまたは 2 つの指標によるものであることがわかっている場合は、それらの指標の使用状況を調査できます。

課金対象の指標を一覧表示するには、次のようにします。

Google Cloud コンソールで、 [指標の管理] ページに移動します。
[指標の管理] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] である結果を選択します。
ツールバーで時間枠を選択します。デフォルトでは、このタブには過去 1 日間に収集された指標に関する情報が表示されます。
表示を特定の指標のグループに限定するには、クイックフィルタを使用するか、テーブルを直接フィルタリングします。

指標テーブルには、現在の Google Cloud プロジェクトの指標スコープに含まれる課金対象の指標が一覧表示されます。次のスクリーンショットに示すように、テーブルには指標ごとに、その指標の課金対象のボリュームの貢献度が表示され、指標に関連付けられたアラートポリシーとカスタムダッシュボードへのリンクが提供されます。指標に関連付けられたアラートポリシーまたはダッシュボードがない場合、テーブルには、クリックして作成できるボタンが含まれています。

指標テーブルには、指標スコープ内のプロジェクトの各指標に関する情報が表示されます。

課金対象のボリュームに対する貢献度で指標を並べ替えるには、[課金対象のボリューム/合計] と [サンプルの課金対象のボリューム/合計] の列のヘッダーをクリックします。

指標テーブルには、指標のドメイン、指標のラベルのセット、指標が取り込まれたプロジェクト、指標のカーディナリティも表示されます。次のスクリーンショットには、これらの列の例を示します。

指標テーブルには、指標スコープの指標の指標ドメイン、ラベル、プロジェクト ID、カーディナリティが報告されます。

ラベルとカーディナリティの情報は、課金対象のボリュームが増加した原因を特定するうえで有用です。Cloud Monitoring では、カーディナリティは指標とリソースに関連付けられた時系列の数を表し、ラベルとその値に関連付けられます。ラベル値の組み合わせごとに 1 つの時系列があります。詳細については、カーディナリティをご覧ください。

請求対象のボリュームの変化は、取り込まれるデータが増えることを意味します。変更が突然または予期せず発生する場合は、指標に関連付けられたラベル数の変更や方法の変更が原因である可能性があり、ラベルの値が設定されます。いずれの場合も、指標のカーディナリティが増加し、結果として請求額が大きくなる可能性があります。指標管理を使用して指標の問題を特定する方法については、指標の問題の調査をご覧ください。

クイックフィルタを使用する

次のグループの指標のみを表示するには、[クイックフィルタ] ペインでエントリを選択します。

アクティブな指標と非アクティブな指標: 過去 25 時間以内に時系列データが書き込まれた、または書き込まれていない指標。
現在の Google Cloud プロジェクトのアラートポリシーで使用されている指標、または使用されていない指標。
現在の Google Cloud プロジェクトのカスタムダッシュボードで使用されている、または使用されていない指標。これらのフィルタには、Cloud Monitoring によって提供される事前定義されたダッシュボードで使用される指標は含まれません。
課金対象の指標の概要で説明される指標のカテゴリ。

フィルタペインを使用して、フィルタ可能な特性で指標を選択します。

たとえば、アラートポリシーやカスタムダッシュボードで使用されていない指標がある場合、指標に料金を支払い、オブザーバビリティのメリットを得られない可能性があります。アラートポリシーが表示されない指標や、現在の Google Cloud プロジェクトで定義されているカスタムダッシュボードに表示されない指標を一覧表示するには、アラートポリシーなしまたはカスタムダッシュボードなしクイックフィルタを選択します。

表を直接フィルタリングする

適切なクイックフィルタがない場合は、 [フィルタ] バーを使用して指標のセットを検索できます。たとえば、マルチプロジェクトの指標スコープがあり、そのプロジェクトの指標のみを一覧表示する場合は、クイックフィルタは使用できません。特定のプロジェクトの指標のみを一覧表示するには、フィルタリストから [Project] を選択し、プロジェクトの識別子を入力します。

明示的なフィルタを使用して、フィルタの組み合わせに一致する指標を検索することもできます。クイックフィルタは一度に 1 つしか選択できないため、クイックフィルタを使用して、アラートポリシーにもカスタムダッシュボードにもないアクティブな指標のみを列挙することはできません。要件の組み合わせに一致する指標を検索するには、フィルタバーにフィルタを追加します。たとえば、アラートポリシーやカスタムダッシュボードに表示されないアクティブな指標を一覧表示するには、フィルタバーに次のフィルタを追加します。

Status: Active
Alert Policies: (Empty)
Custom Dashboards: (Empty)

デフォルトでは、複数のフィルタを追加すると、行がすべてのフィルタを満たすときにテーブルに行が含まれます。ただし、他の 2 つのフィルタ要素の間に OR フィルタを挿入できます。

モニタリングされていない指標のアラートポリシーを作成する

テーブル内の指標にアラートポリシーが関連付けられていない場合は、テーブルに [アラートを作成] ボタンが表示されます。指標のアラートポリシーを作成するには、指標の行で [アラートを作成] をクリックします。

条件フィールドが入力され、[アラートポリシー] ダイアログが開きます。すべての設定を確認して、次の変更を行うことをおすすめします。

条件のしきい値を更新します。デフォルト値では不十分な場合があります。
ポリシーに通知チャンネルを追加します。
ポリシーに名前を付けます。

また、 [アクション] をクリックしてから、[指標のアラートを作成] をクリックして、任意の指標のアラートポリシーを作成できます。

詳細については、アラートポリシーを作成するをご覧ください。

モニタリングされていない指標のグラフを作成する

テーブル内の指標にカスタムダッシュボードが関連付けられていない場合、テーブルには [グラフを作成] ボタンが表示されます。このボタンを使用すると、グラフを作成し、カスタムダッシュボード上に配置できます。指標のグラフを作成するには、次のようにします。

指標の行で [グラフを作成] をクリックします。

[エクスプローラ] パネルが開き、選択した指標を表示するように事前構成されています。グラフの構成は変更できます。Metrics Explorer の使用の詳細については、Metrics Explorer でグラフを作成するをご覧ください。
グラフをカスタムダッシュボードに保存するには、[ダッシュボードに保存] をクリックします。
[グラフを保存] パネルで、次のようにします。
1. グラフのデフォルトタイトルを適用するか、変更します。
2. グラフを保存する既存のカスタムダッシュボードを選択するか、[新しいダッシュボード] を選択してグラフ用の新しいダッシュボードを作成します。
3. [グラフを保存] をクリックします。

指標を操作する

[診断] ページを使用して指標に関する情報の一部を表示できますが、より多くの情報が必要な場合もあります。たとえば、特定の指標のグラフを表示できます。または、指標の取り込み率が想定外の状態になったときに通知するアラートポリシーを作成することもできます。

特定の指標の詳細情報を取得する方法は次のとおりです。

Google Cloud コンソールで、 [指標の管理] ページに移動します。
[指標の管理] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] である結果を選択します。
テーブルで指標を見つけて、 [アクション] をクリックし、次のいずれかを行います。
- 現在の指標を表示するグラフを表示するには、[Metrics Explorer で表示する] を選択します。
  
  Metrics Explorer が開き、選択した指標を表示するように事前構成されています。グラフ構成の変更や破棄を行うことができます。また、カスタムダッシュボードに追加することもできます。
- 指標をモニタリングするアラートポリシーを作成するには、[指標のアラートを作成] を選択します。
  
  条件フィールドが入力され、[アラートポリシー] ダイアログが開きます。すべての設定を確認して、次の変更を行うことをおすすめします。
  - 条件のしきい値を更新します。デフォルト値では不十分な場合があります。
  - ポリシーに通知チャンネルを追加します。
  - ポリシーに名前を付けます。
  詳細については、アラートポリシーを作成するをご覧ください。
- 指標に関連付けられた監査ログを表示するには、[指標の監査ログを表示] を選択します。

課金対象の指標の取り込みの表示とアラート

取り込まれた課金対象のバイトと課金対象のサンプルの数によって、費用の大部分が決まります。課金対象の指標の使用に伴う月額費用を予測するには、データの取り込み率を知る必要があります。[指標管理] ページでは、指標の使用状況の概要を確認できます。これにより、次のことを行うことができます。

課金対象の指標の使用状況の傾向を表示します。
指標スコープ内のプロジェクトが予想よりも多い、または少ない指標データを送信しているかどうかを確認します。
最も多くのデータを生成している指標を特定します。
最も Prometheus データの生成を担当する名前空間を特定します。
指標の書き込みエラーの割合を表示します。エラー率は、指標の書き込みのうち、指標の書き込みの総数に対するエラーステータスを返す割合です。

指標の使用状況の概要を表示する

課金対象の指標の数、指標の取り込み率、エラー率の概要を表示するには、次のようにします。

Google Cloud コンソールで、 [指標の管理] ページに移動します。
[指標の管理] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] である結果を選択します。
ツールバーで時間枠を選択します。デフォルトでは、[指標管理] ページには、過去 1 日間に収集された指標に関する情報が表示されます。次のスクリーンショットの例をご覧ください。
- 指標スコープ内のプロジェクトで現在アクティブな請求対象の指標の数の概要を確認するには、アクティブな指標スコアカードをご覧ください。指標は、過去 25 時間以内にデータが書き込まれた場合にアクティブになります。
- 費用詳しくは、取り込まれた課金対象のバイト数と取り込まれた課金対象のサンプルのスコアカードを使用してください。詳細については、指標の取り込みの全体的な傾向を表示するをご覧ください。
- 課金対象の指標の設計または使用に関する問題を特定するのに役立つ情報を見つけるには、指標書き込みエラーのスコアカードを使用します。詳細については、指標の問題の調査をご覧ください。

[指標管理] ページには、実際の費用ではなく、取り込んだデータの量が表示されます。現在のお支払い情報を表示するには、ツールバーで [お支払い情報を表示] をクリックします。

指標の取り込みの全体的な傾向を表示する

アプリケーションが一定量のデータを生成しているかどうか（安定したアプリケーションにおいて想定される動作）を判断するには、取り込みスコアカードを使用して収集率を確認します。指標を表示する時間枠を変更すると、グラフの谷、ピーク、または傾向が表示される場合があります。

収集率の推移を表示するには、次の操作を行います。

Google Cloud コンソールで、 [指標の管理] ページに移動します。
[指標の管理] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] である結果を選択します。
ツールバーで時間枠を選択します。
取り込まれたバイトまたはサンプルのスコアカードで [グラフを表示] をクリックします。ここでは、課金対象のサンプルのグラフについて説明しますが、課金対象のバイトのグラフも同じように機能します。次のような一連のグラフが表示されます。

デフォルトでは、グラフの凡例は閉じられています。グラフに表示される時系列のリストを表示するには、[ 凡例] をクリックします。時間参照を設定する方法、または特定の時間枠でグラフを展開する方法については、グラフ化されたデータを調べるをご覧ください。

注: Google Cloud プロジェクトで課金対象の指標が取り込まれていない場合、これらのグラフにはデータが表示されません。グラフには「選択した期間にはデータがありません」と表示されます。このメッセージはエラーではありません。

たとえば、時間枠を 1 週間に設定すると、取り込まれたデータが時間の経過とともに一定かつ想定外に増加した場合は、その増加が特定の指標によるものか、指標グループ全体にわたる一般的な傾向であるかを確認できます。ある指標が応答可能である場合は、指標のカーディナリティも増加しているかどうかを確認して調べることができます。

現在の指標スコープに取り込まれた課金対象のサンプルの割合を表示するには、取り込まれた課金対象のサンプルの合計のグラフを使用します。
課金対象の合計値に対する指標スコープ内の各プロジェクトの貢献を表示するには、[取り込まれた課金対象のサンプル別のプロジェクト] グラフを使用します。このグラフは、最も多くのデータを送信しているプロジェクトと、送信中のプロジェクトがデータ量を増加または減少しているかを確認できます。
（課金対象のサンプルのみ）課金対象の値に最も大きく貢献している指標を送信する名前空間を検索するには、Namespace Volume Ingestion グラフを使用します。
課金対象の値に大きく影響する指標スコープの指標を表示するには、[取り込まれた課金対象サンプルの上位 10 の指標] グラフを使用します。収集率の急激な上昇、下落、傾向、またはラインが他とは大きく異なる指標を探す場合があります。
指標スコープ内のすべての指標の課金対象値への貢献度を表示するには、取り込まれた課金対象サンプル別のすべての指標グラフを使用します。このグラフには、トップ 10 グラフの指標が含まれており、指標からの収集率の全体的な分布を確認できます。

これらのグラフを詳細に分析するには、 [その他のオプション] をクリックして [Metrics Explorer で表示する] を選択します。Namespace Volume Ingestion グラフから始まり、Metrics Explorer を使用して取り込みボリュームのアトリビューションを実行する例については、以下をご覧ください。

Metrics Explorer を使用してデータを分析する方法（今月の動作と先月の動作の比較など）については、グラフデータの確認をご覧ください。

指標の取り込みに基づいてアラートを作成する

取り込み可能な指標における指標収集率の急増、低下、傾向の通知を受けるには、アラートポリシーを作成します。たとえば、指標収集の低下はアプリケーションのパフォーマンスが低いことを示している可能性があります。同様に、急増は予期しない請求が発生する可能性があります。最後に、増加傾向は、指標のラベルが多すぎるか、カーディナリティが増加していることを示します。いずれの場合でも、アラートポリシーで異常な動作を通知し、状況を解決できます。

取り込みバイト数で課金される指標と、取り込まれたサンプル数によって課金される指標の両方がある場合は、両方の課金値に対してアラートポリシーを作成する必要があります。

指標の収集率をモニタリングするアラートポリシーを作成するには、次の手順を行います。

Google Cloud コンソールで、 [指標の管理] ページに移動します。
[指標の管理] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] である結果を選択します。
ツールバーで時間枠を選択します。
取り込まれたバイトまたはサンプルのスコアカードで [グラフを表示] をクリックします。
データをモニタリングするグラフで、[Create alerting policy] をクリックします。

条件フィールドが入力され、[アラートポリシー] ダイアログが開きます。すべての設定を確認して、次の変更を行うことをおすすめします。
- 条件のしきい値を更新します。デフォルト値では不十分な場合があります。
- ポリシーに通知チャンネルを追加します。
- ポリシーに名前を付けます。
詳細については、アラートポリシーを作成するをご覧ください。

指標に関する問題を調査する

[指標管理] ページを使用して、課金対象の指標の構造または使用に関する問題を調査できます。たとえば、次のことを行います。

特定の指標に起因する課金対象ボリュームの増加。
特定の指標に対するクエリのレイテンシが増加しているというレポート。
指標データの書き込みエラー。これは、書き込まれるデータの量またはレートの制限に達する可能性があります。

指標データの書き込みでエラーが発生する可能性は、請求可能なボリュームの予期せずの増加やクエリのレイテンシの増加など、他の問題と相関している可能性があります。たとえば、指標の構成を変更すると、カーディナリティの問題が発生する可能性があります。これは、取り込まれるデータの量とクエリのレイテンシの両方に影響する可能性があり、指標の書き込みエラー結果に可能性もあります。

指標書き込みエラーを表示する

指標の書き込みエラースコアカードから、次のことができます。

指標書き込みリクエストのステータスを表示します。
指標書き込みエラー率がしきい値を超えた場合に通知するアラートポリシーを作成します。
監査ログが有効になっている場合は、指標書き込みエラーの監査ログを表示します。これらのログは、指標の書き込みエラーの原因に関する分析情報を提供できます。

指標データの書き込みエラーに関する情報を表示するには、次のようにします。

Google Cloud コンソールで、 [指標の管理] ページに移動します。
[指標の管理] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] である結果を選択します。
ツールバーで時間枠を選択します。
[指標の書き込みエラー] スコアカードで、[エラーを表示] をクリックします。
- Cloud Monitoring API への指標書き込みリクエストのステータスを表示するには、API - 時系列の作成（ステータスコード）グラフを使用します。このグラフは、timeSeries.create メソッドの呼び出しを示しています。
  
  各時系列には、特定の HTTP ステータスコードの書き込みの割合が表示されます。グラフに 2xx ステータスの結果が 1 行だけ表示される場合、指標の書き込みエラーはありません。次のスクリーンショットは、2xx のステータス結果と、少数の 4xx および 5xx ステータスの結果の両方を示しています。
  
  指標書き込みリクエスト数の増加が発生している場合は、カーディナリティに問題がある可能性があります。
- グラフにエラーのステータスコードが表示され、プロジェクトの監査ログを有効にしている場合は、ログを使用してエラーの原因を調査できます。ログの事前構成されたクエリは、Monitoring API メソッド timeSeries.create に関連するエラーを探します。このメソッドは、指標が書き込まれるたびに呼び出されます。
  
  timeSeries.create エラーのログでは、エラーステータスコードの理由を確認できます。たとえば、一度に書き込むデータが多すぎる場合、またはアクティブな時系列の数が制限を超えると、このメソッドは失敗する可能性があります。詳しくは、Monitoring の割り当てドキュメントのユーザー定義の指標のセクションをご覧ください。
  
  注: 「以下のログが表示されない場合」で始まる通知と、[監査ログを有効にする] ボタンは常に表示されます。監査ログに監査ログが表示されることもあります。この通知は、ログが表示されない場合に、監査ロギングを有効にする必要がある可能性があることを示しています。ログが表示されない場合、表示するログが存在しない可能性があります。

指標作成エラーを調査する

失敗した可能性がある指標に関連する別の方法は、metricDescriptors.create メソッドです。metricDescriptors.create メソッドは、新しい指標の時系列データを初めて作成するとき、または指標データの構造を変更するときに、通常は新しいラベルを追加するときに呼び出されます。このメソッドのエラーの監査ログは、指標テーブルの各指標のエントリから確認できます。

特定の指標の監査ログを表示するには、次の手順を行います。

Google Cloud コンソールで、 [指標の管理] ページに移動します。
[指標の管理] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] である結果を選択します。
ツールバーで時間枠を選択します。
テーブルで指標を見つけて、 [アクション] をクリックします。
[指標の監査ログを表示] を選択します。

ログの事前構成されたクエリは、Monitoring API メソッド metricDescriptors.create に関連するエラーを探します。

metricDescriptors.create メソッドのエラーは、指標の設計で問題を特定する際に役立ちます。指標記述子の許容数または指標記述子のラベル数を超えると、このメソッドにエラーが表示されることがあります。詳しくは、Monitoring の割り当てドキュメントのユーザー定義指標のセクションをご覧ください。

次のステップ

Ops エージェントを使用して指標を収集します。
Google Cloud Managed Service for Prometheus を使用して指標を収集します。
BindPlane を使用してオンプレミスとハイブリッドクラウドの指標を収集する
Monitoring API を使用してユーザー定義の指標を作成する
料金