このドキュメントでは、GKE on AWS を Cloud Monitoring に統合する方法と、指標を表示する方法について説明します。
始める前に
Google Cloud CLI を構成して、 Google Cloud プロジェクトで必要な API を有効にします。
Cloud Logging と Cloud Monitoring を認可し、Google Cloud Observability の権限を設定します。
概要
GKE on AWS には、ノード、Pod、コンテナのシステム指標をモニタリングするために、Cloud Monitoring との統合機能が組み込まれています。これにより、クラスタ内のワークロードのリソース消費の確認、ダッシュボードの構築、アラートの構成を簡単に行うことができます。
GKE on AWS によって、クラスタに指標コレクタ gke-metrics-agent がインストールされます。このエージェントは OpenTelemetry Collector に基づいており、クラスタ内のすべてのノードで実行されます。1 分ごとに指標をサンプリングし、測定値を Cloud Monitoring にアップロードします。
アップロードされたクラスタの指標はGoogle Cloud プロジェクトに保持されます。すべてのクラスタにわたるデータの集計、カスタム ダッシュボードの構築、単一クラスタのデータの探索、折れ線グラフの表示、アラートの設定などが可能です。
Metrics Explorer の使用
1.27 以降
Metrics Explorer を使用してモニタリング対象リソースの指標を表示するには、次の操作を行います。
- 
Google Cloud コンソールで leaderboard [Metrics explorer] のページに移動します。
検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] の結果を選択します。
 - Google Cloud コンソールのツールバーで、 Google Cloud プロジェクトを選択します。App Hub の構成には、App Hub ホスト プロジェクトまたはアプリ管理用フォルダの管理プロジェクトを選択します。
 - [指標] 要素の [指標を選択] メニューを開いてフィルタバーに「
Kubernetes Container」と入力し、サブメニューを使用して特定のリソースタイプと指標を選択します。- [有効なリソース] メニューで [Kubernetes コンテナ] を選択します。
 - [有効な指標カテゴリ] メニューで [Anthos] を選択します。
 - [有効な指標] メニューで [CPU 使用時間] を選択します。
 - [適用] をクリックします。
 
 クエリ結果から時系列を削除するフィルタを追加するには、[フィルタ] 要素を使用します。
時系列を結合するには、[集計] 要素のメニューを使用します。たとえば、ゾーンに基づいて VM の CPU 使用率を表示するには、最初のメニューを [平均] に設定し、2 番目のメニューを [ゾーン] に設定します。
[集計] 要素の最初のメニューが [未集計] に設定されている場合は、すべての時系列が表示されます。[集計] 要素のデフォルト設定は、選択した指標タイプによって決まります。
- 割り当てと、1 日に 1 つのサンプルを報告するその他の指標については、次の操作を行います。
- [表示] ペインで、[ウィジェット タイプ] を [積み上げ棒グラフ] に設定します。
 - 期間は少なくとも 1 週間に設定します。
 
 
1.26 以前
Metrics Explorer を使用してモニタリング対象リソースの指標を表示するには、次の操作を行います。
- 
Google Cloud コンソールで leaderboard [Metrics explorer] のページに移動します。
検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] の結果を選択します。
 - Google Cloud コンソールのツールバーで、 Google Cloud プロジェクトを選択します。App Hub の構成には、App Hub ホスト プロジェクトまたはアプリ管理用フォルダの管理プロジェクトを選択します。
 - [指標] 要素の [指標を選択] メニューを開いてフィルタバーに「
Kubernetes Container」と入力し、サブメニューを使用して特定のリソースタイプと指標を選択します。- [有効なリソース] メニューで [Kubernetes コンテナ] を選択します。
 - [有効な指標カテゴリ] メニューで、[コンテナ] を選択します。
 - [有効な指標] メニューで [CPU 使用時間] を選択します。
 - [適用] をクリックします。
 
 クエリ結果から時系列を削除するフィルタを追加するには、[フィルタ] 要素を使用します。
時系列を結合するには、[集計] 要素のメニューを使用します。たとえば、ゾーンに基づいて VM の CPU 使用率を表示するには、最初のメニューを [平均] に設定し、2 番目のメニューを [ゾーン] に設定します。
[集計] 要素の最初のメニューが [未集計] に設定されている場合は、すべての時系列が表示されます。[集計] 要素のデフォルト設定は、選択した指標タイプによって決まります。
- 割り当てと、1 日に 1 つのサンプルを報告するその他の指標については、次の操作を行います。
- [表示] ペインで、[ウィジェット タイプ] を [積み上げ棒グラフ] に設定します。
 - 期間は少なくとも 1 週間に設定します。
 
 
指標のモニタリング対象リソースのタイプ
指標は、次の 3 つのモニタリング対象リソースタイプのいずれかを使用して収集されます。これらのタイプは、測定対象の Kubernetes オブジェクトに対応しています。
たとえば、Pod に関する測定では、モニタリング対象リソースタイプ k8s_pod が使用されます。したがって、これらの指標には、特定の Pod を識別する pod_name と namespace_name のラベルが含まれます。特定のクラスタの指標を表示するには、次の形式を使用します。
awsClusters/CLUSTER_NAME
モニタリング対象リソースタイプごとに異なる指標タイプが使用されます。これらの指標タイプの詳細については、GKE システムの指標をご覧ください。
収集される指標
- v1.32.4-gke.200
 - v1.31.7-gke.1000
 - v1.31.6-gke.200
 - v1.31.4-gke.500
 - v1.31.1-gke.1800
 - v1.30.11-gke.800
 - v1.30.10-gke.200
 - v1.30.8-gke.100
 - v1.30.5-gke.1000
 - v1.30.5-gke.200
 - v1.30.4-gke.400
 - v1.30.3-gke.100
 - v1.29.14-gke.200
 - v1.29.12-gke.100
 - v1.29.10-gke.100
 - v1.29.8-gke.1800
 - v1.29.8-gke.600
 - v1.29.7-gke.100
 - v1.29.6-gke.600
 - v1.29.5-gke.1100
 - v1.29.5-gke.700
 - v1.29.4-gke.200
 - v1.29.3-gke.600
 - v1.28.14-gke.200
 - v1.28.13-gke.600
 - v1.28.12-gke.100
 - v1.28.11-gke.600
 - v1.28.10-gke.1300
 - v1.28.10-gke.800
 - v1.28.9-gke.400
 - v1.28.8-gke.800
 - v1.28.7-gke.1700
 - v1.28.5-gke.1200
 - v1.28.5-gke.100
 - v1.28.3-gke.700
 - v1.27.14-gke.1600
 - v1.27.14-gke.1200
 - v1.27.14-gke.700
 - v1.27.13-gke.500
 - v1.27.12-gke.800
 - v1.27.11-gke.1600
 - v1.27.10-gke.500
 - v1.27.9-gke.100
 - v1.27.7-gke.600
 - v1.27.6-gke.700
 - v1.27.5-gke.200
 - v1.27.4-gke.1600
 - v1.26.14-gke.1500
 - v1.26.13-gke.400
 - v1.26.12-gke.100
 - v1.26.10-gke.600
 - v1.26.9-gke.700
 - v1.26.8-gke.200
 - v1.26.7-gke.500
 - v1.26.5-gke.1400
 - v1.26.5-gke.1200
 - v1.26.4-gke.2200
 - v1.26.2-gke.1001
 - v1.25.14-gke.700
 - v1.25.13-gke.200
 - v1.25.12-gke.500
 - v1.25.10-gke.1400
 - v1.25.10-gke.1200
 - v1.25.8-gke.500
 - v1.25.7-gke.1000
 - v1.25.6-gke.1600
 - v1.25.5-gke.2000
 - v1.25.5-gke.1500
 - v1.25.4-gke.1300
 - v1.24.14-gke.2700
 - v1.24.14-gke.1400
 - v1.24.13-gke.500
 - v1.24.11-gke.1000
 - v1.24.10-gke.1200
 - v1.24.9-gke.2000
 - v1.24.9-gke.1500
 - v1.24.8-gke.1300
 - v1.24.5-gke.200
 - v1.24.3-gke.2200
 - v1.24.3-gke.2100
 - v1.23.16-gke.2800
 - v1.23.16-gke.200
 - v1.23.14-gke.1800
 - v1.23.14-gke.1100
 - v1.23.11-gke.300
 - v1.23.9-gke.2200
 - v1.23.9-gke.2100
 - v1.23.9-gke.800
 - v1.23.8-gke.1700
 - v1.23.7-gke.1300
 - v1.22.15-gke.100
 - v1.22.12-gke.2300
 - v1.22.12-gke.1100
 - v1.22.12-gke.200
 - v1.22.10-gke.1500
 - v1.22.8-gke.2100
 - v1.22.8-gke.1300
 - v1.22.8-gke.200
 - v1.21.14-gke.2900
 - v1.21.14-gke.2100
 - v1.21.11-gke.1900
 - v1.21.11-gke.1800
 - v1.21.11-gke.1100
 - v1.21.11-gke.100
 - v1.21.6-gke.1500
 - v1.21.5-gke.2800
 
次のステップ
- Managed Service for Prometheus でマネージド データ収集を設定する
 - Metrics Explorer の使用
 - ログベースの指標を作成する
 - Cloud Monitoring のクエリの作成
 - アラートの設定
 - GKE の概要