Cloud Monitoring
このドキュメントでは、GKE on Azure を Cloud Monitoring と統合する方法と、指標を表示する方法について説明します。
始める前に
Google Cloud CLI を構成し、Google Cloud プロジェクトで必要な API を有効にする。
Cloud Logging と Cloud Monitoring を承認し、Google Cloud Observability の権限を設定する。
概要
GKE on Azure には、ノード、Pod、コンテナのシステム指標用に Cloud Monitoring との統合が組み込まれています。これにより、クラスタ内のワークロードのリソース消費の確認、ダッシュボードの構築、アラートの構成を簡単に行うことができます。
GKE on Azure は、指標コレクタ gke-metrics-agent
をクラスタにインストールします。このエージェントは OpenTelemetry Collector に基づいており、クラスタ内のすべてのノードで実行されます。1 分ごとに指標をサンプリングし、測定値を Cloud Monitoring にアップロードします。
クラスタの指標は、アップロードされると Google Cloud プロジェクトに保存されます。すべてのクラスタにわたるデータの集計、カスタム ダッシュボードの構築、単一クラスタのデータの探索、折れ線グラフの表示、アラートの設定などが可能です。
Metrics Explorer の使用
1.27 以降
Metrics Explorer を使用してモニタリング対象リソースの指標を表示するには、次の操作を行います。
-
Google Cloud コンソールで、[leaderboardMetrics explorer] ページに移動します。
検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] の結果を選択します。
- [指標] 要素の [指標を選択] メニューを開いてフィルタバーに「
Kubernetes Container
」と入力し、サブメニューを使用して特定のリソースタイプと指標を選択します。- [有効なリソース] メニューで、[Kubernetes コンテナ] を選択します。
- [有効な指標カテゴリ] メニューで、[Anthos] を選択します。
- [有効な指標] メニューで、[CPU 使用時間] を選択します。
- [適用] をクリックします。
表示から時系列を削除するには、[フィルタ] 要素を使用します。
時系列を結合するには、[集計] 要素のメニューを使用します。たとえば、ゾーンに基づいて VM の CPU 使用率を表示するには、最初のメニューを [平均] に設定し、2 番目のメニューを [ゾーン] に設定します。
[集計] 要素の最初のメニューが [未集計] に設定されている場合は、すべての時系列が表示されます。[集計] 要素のデフォルト設定は、選択した指標タイプによって決まります。
- 割り当てと、1 日に 1 つのサンプルを報告するその他の指標については、次の操作を行います。
- [表示] ペインで、[ウィジェット タイプ] を [積み上げ棒グラフ] に設定します。
- 期間は 1 週間以上で設定します。
1.26 以前
Metrics Explorer を使用してモニタリング対象リソースの指標を表示するには、次の操作を行います。
-
Google Cloud コンソールで、[leaderboardMetrics explorer] ページに移動します。
検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] の結果を選択します。
- [指標] 要素の [指標を選択] メニューを開いてフィルタバーに「
Kubernetes Container
」と入力し、サブメニューを使用して特定のリソースタイプと指標を選択します。- [有効なリソース] メニューで、[Kubernetes コンテナ] を選択します。
- [有効な指標カテゴリ] メニューで、[コンテナ] を選択します。
- [有効な指標] メニューで、[CPU 使用時間] を選択します。
- [適用] をクリックします。
表示から時系列を削除するには、[フィルタ] 要素を使用します。
時系列を結合するには、[集計] 要素のメニューを使用します。たとえば、ゾーンに基づいて VM の CPU 使用率を表示するには、最初のメニューを [平均] に設定し、2 番目のメニューを [ゾーン] に設定します。
[集計] 要素の最初のメニューが [未集計] に設定されている場合は、すべての時系列が表示されます。[集計] 要素のデフォルト設定は、選択した指標タイプによって決まります。
- 割り当てと、1 日に 1 つのサンプルを報告するその他の指標については、次の操作を行います。
- [表示] ペインで、[ウィジェット タイプ] を [積み上げ棒グラフ] に設定します。
- 期間は 1 週間以上で設定します。
指標のモニタリング対象リソースのタイプ
指標は、次の 3 つのモニタリング対象リソースタイプのいずれかを使用して収集されます。これらのタイプは、測定対象の Kubernetes オブジェクトに対応しています。
たとえば、Pod に関する測定では、モニタリング対象リソースタイプ k8s_pod
が使用されます。したがって、これらの指標には、特定の Pod を識別する pod_name
と namespace_name
のラベルが含まれます。特定のクラスタの指標を表示するには、次の形式を使用します。
azureClusters/CLUSTER_NAME
モニタリング対象リソースタイプごとに異なる指標タイプが使用されます。これらの指標タイプの詳細については、GKE システムの指標をご覧ください。
収集される指標
- v1.29.3-gke.600
- v1.28.8-gke.800
- v1.28.7-gke.1700
- v1.28.5-gke.1200
- v1.28.5-gke.100
- v1.28.3-gke.700
- v1.27.12-gke.800
- v1.27.11-gke.1600
- v1.27.10-gke.500
- v1.27.9-gke.100
- v1.27.7-gke.600
- v1.27.6-gke.700
- v1.27.5-gke.200
- v1.27.4-gke.1600
- v1.26.14-gke.1500
- v1.26.13-gke.400
- v1.26.12-gke.100
- v1.26.10-gke.600
- v1.26.9-gke.700
- v1.26.8-gke.200
- v1.26.7-gke.500
- v1.26.5-gke.1400
- v1.26.5-gke.1200
- v1.26.4-gke.2200
- v1.26.2-gke.1001
- v1.25.14-gke.700
- v1.25.13-gke.200
- v1.25.12-gke.500
- v1.25.10-gke.1400
- v1.25.10-gke.1200
- v1.25.8-gke.500
- v1.25.7-gke.1000
- v1.25.6-gke.1600
- v1.25.5-gke.2000
- v1.25.5-gke.1500
- v1.25.4-gke.1300
- v1.24.14-gke.2700
- v1.24.14-gke.1400
- v1.24.13-gke.500
- v1.24.11-gke.1000
- v1.24.10-gke.1200
- v1.24.9-gke.2000
- v1.24.9-gke.1500
- v1.24.8-gke.1300
- v1.24.5-gke.200
- v1.24.3-gke.2100
- v1.23.16-gke.2800
- v1.23.16-gke.200
- v1.23.14-gke.1800
- v1.23.14-gke.1100
- v1.23.11-gke.300
- v1.23.9-gke.2100
- v1.23.9-gke.800
- v1.23.8-gke.1700
- v1.23.7-gke.1300
- v1.22.15-gke.100
- v1.22.12-gke.2300
- v1.22.12-gke.1100
- v1.22.12-gke.200
- v1.22.10-gke.1500
- v1.22.8-gke.2100
- v1.22.8-gke.1300
- v1.22.8-gke.200
- v1.21.14-gke.2900
- v1.21.14-gke.2100
- v1.21.11-gke.1900
- v1.21.11-gke.1800
- v1.21.11-gke.1100
- v1.21.11-gke.100
- v1.21.6-gke.1500
- v1.21.5-gke.2800
次のステップ
- Managed Service for Prometheus でマネージド データ収集を設定する
- Metrics Explorer の使用
- ログベースの指標の作成
- Cloud Monitoring のクエリの作成
- アラートの設定
- GKE Enterprise の概要