Cloud Monitoring

このドキュメントでは、GKE on Azure を Cloud Monitoring と統合する方法と、指標を表示する方法について説明します。

始める前に

  1. Google Cloud CLI を構成し、Google Cloud プロジェクトで必要な API を有効にする。

  2. Cloud Logging と Cloud Monitoring を承認し、Google Cloud Observability の権限を設定する。

概要

GKE on Azure には、ノード、Pod、コンテナのシステム指標用に Cloud Monitoring との統合が組み込まれています。これにより、クラスタ内のワークロードのリソース消費の確認、ダッシュボードの構築、アラートの構成を簡単に行うことができます。

GKE on Azure は、指標コレクタ gke-metrics-agent をクラスタにインストールします。このエージェントは OpenTelemetry Collector に基づいており、クラスタ内のすべてのノードで実行されます。1 分ごとに指標をサンプリングし、測定値を Cloud Monitoring にアップロードします。

クラスタの指標は、アップロードされると Google Cloud プロジェクトに保存されます。すべてのクラスタにわたるデータの集計、カスタム ダッシュボードの構築、単一クラスタのデータの探索、折れ線グラフの表示、アラートの設定などが可能です。

Metrics Explorer の使用

1.27 以降

Metrics Explorer を使用してモニタリング対象リソースの指標を表示するには、次の操作を行います。

  1. Google Cloud コンソールで、[Metrics explorer] ページに移動します。

    Metrics Explorer に移動

    検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] の結果を選択します。

  2. [指標] 要素の [指標を選択] メニューを開いてフィルタバーに「Kubernetes Container」と入力し、サブメニューを使用して特定のリソースタイプと指標を選択します。
    1. [有効なリソース] メニューで、[Kubernetes コンテナ] を選択します。
    2. [有効な指標カテゴリ] メニューで、[Anthos] を選択します。
    3. [有効な指標] メニューで、[CPU 使用時間] を選択します。
    4. [適用] をクリックします。
  3. 表示から時系列を削除するには、[フィルタ] 要素を使用します。

  4. 時系列を結合するには、[集計] 要素のメニューを使用します。たとえば、ゾーンに基づいて VM の CPU 使用率を表示するには、最初のメニューを [平均] に設定し、2 番目のメニューを [ゾーン] に設定します。

    [集計] 要素の最初のメニューが [未集計] に設定されている場合は、すべての時系列が表示されます。[集計] 要素のデフォルト設定は、選択した指標タイプによって決まります。

  5. 割り当てと、1 日に 1 つのサンプルを報告するその他の指標については、次の操作を行います。
    1. [表示] ペインで、[ウィジェット タイプ] を [積み上げ棒グラフ] に設定します。
    2. 期間は 1 週間以上で設定します。

1.26 以前

Metrics Explorer を使用してモニタリング対象リソースの指標を表示するには、次の操作を行います。

  1. Google Cloud コンソールで、[Metrics explorer] ページに移動します。

    Metrics Explorer に移動

    検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] の結果を選択します。

  2. [指標] 要素の [指標を選択] メニューを開いてフィルタバーに「Kubernetes Container」と入力し、サブメニューを使用して特定のリソースタイプと指標を選択します。
    1. [有効なリソース] メニューで、[Kubernetes コンテナ] を選択します。
    2. [有効な指標カテゴリ] メニューで、[コンテナ] を選択します。
    3. [有効な指標] メニューで、[CPU 使用時間] を選択します。
    4. [適用] をクリックします。
  3. 表示から時系列を削除するには、[フィルタ] 要素を使用します。

  4. 時系列を結合するには、[集計] 要素のメニューを使用します。たとえば、ゾーンに基づいて VM の CPU 使用率を表示するには、最初のメニューを [平均] に設定し、2 番目のメニューを [ゾーン] に設定します。

    [集計] 要素の最初のメニューが [未集計] に設定されている場合は、すべての時系列が表示されます。[集計] 要素のデフォルト設定は、選択した指標タイプによって決まります。

  5. 割り当てと、1 日に 1 つのサンプルを報告するその他の指標については、次の操作を行います。
    1. [表示] ペインで、[ウィジェット タイプ] を [積み上げ棒グラフ] に設定します。
    2. 期間は 1 週間以上で設定します。

指標のモニタリング対象リソースのタイプ

指標は、次の 3 つのモニタリング対象リソースタイプのいずれかを使用して収集されます。これらのタイプは、測定対象の Kubernetes オブジェクトに対応しています。

たとえば、Pod に関する測定では、モニタリング対象リソースタイプ k8s_pod が使用されます。したがって、これらの指標には、特定の Pod を識別する pod_namenamespace_name のラベルが含まれます。特定のクラスタの指標を表示するには、次の形式を使用します。

azureClusters/CLUSTER_NAME

モニタリング対象リソースタイプごとに異なる指標タイプが使用されます。これらの指標タイプの詳細については、GKE システムの指標をご覧ください。

収集される指標

次のステップ