Anthos clusters on bare metal は、ベアメタル向け Google Distributed Cloud（ソフトウェアのみ）になりました。詳細については、プロダクトの概要をご覧ください。

ロギングとモニタリングの構成

ベアメタル用 Google Distributed Cloud（ソフトウェアのみ）では、クラウドベースのマネージドサービス、オープンソースツール、サードパーティの商用ソリューションとの互換性の検証など、クラスタのロギングとモニタリングに関して複数のオプションが用意されています。このページでは、これらのオプションについて説明し、環境に適したソリューションを選択するための基本的なガイダンスを示します。

このページは、サービスレベル目標（SLO）の遵守など、デプロイされたアプリケーションやサービスの状態をモニタリングする管理者、アーキテクト、オペレータを対象としています。Google Cloud のコンテンツで参照する一般的なロールとタスク例の詳細については、一般的な GKE Enterprise ユーザーロールとタスクをご覧ください。

Google Distributed Cloud のオプション

クラスタのロギングとモニタリングには、いくつかのオプションがあります。

Cloud Logging と Cloud Monitoring。ベアメタルシステムコンポーネントでデフォルトで有効になっています。
Prometheus と Grafana は Cloud Marketplace から入手できます。
サードパーティソリューションによる検証済みの構成。

Cloud Logging と Cloud Monitoring

Google Cloud Observability は、Google Cloud の組み込みのオブザーバビリティソリューションです。フルマネージドのロギングソリューション、指標の収集、モニタリング、ダッシュボード、アラートが提供されます。Cloud Monitoring は、クラウドベースの GKE クラスタと同様の方法で、Google Distributed Cloud クラスタをモニタリングします。

必要なサービスアカウントと IAM ロールを使用してクラスタを作成すると、Cloud Logging と Cloud Monitoring がデフォルトで有効になります。Cloud Logging と Cloud Monitoring を無効にすることはできません。サービスアカウントと必要なロールの詳細については、サービスアカウントを構成するをご覧ください。

エージェントは、ロギングとモニタリングの範囲、収集する指標のレベルを変更するように構成できます。

ロギングとモニタリングのスコープは、システムコンポーネントのみ（デフォルト）、またはシステムコンポーネントとアプリケーションに設定できます。
収集された指標のレベルは、最適化された指標のセット（デフォルト）または完全な指標に対して構成できます。

詳細については、このドキュメントの Google Distributed Cloud の Stackdriver エージェントの構成をご覧ください。

Logging と Monitoring は、簡単に構成でき、強力な、たった一つのクラウドベースのオブザーバビリティソリューションを提供します。Google Distributed Cloud でワークロードを実行する場合は、Logging と Monitoring の使用を強くおすすめします。Google Distributed Cloud と標準のオンプレミスインフラストラクチャで実行されるコンポーネントがあるアプリケーションの場合は、アプリケーションのエンドツーエンドのビューのために、その他のソリューションも検討できます。

Google Cloud プロジェクトにデフォルトで複製されるアーキテクチャ、構成、データの詳細については、Google Distributed Cloud のロギングとモニタリングの仕組みのセクションをご覧ください。
Logging の詳細については、Cloud Logging のドキュメントをご覧ください。
Monitoring の詳細については、Cloud Monitoring のドキュメントをご覧ください。
フリートレベルで Google Distributed Cloud から Cloud Monitoring リソース使用率の指標を表示して使用する方法については、Google Kubernetes Engine（GKE）Enterprise エディションの使用の概要をご覧ください。

Prometheus と Grafana

Prometheus と Grafana は、Cloud Marketplace で入手可能な人気の高いオープンソースモニタリングサービスです。

Prometheus は、アプリケーションとシステムの指標を収集します。
Alertmanager は、複数の異なるアラートメカニズムを使用してアラートの送信を行います。
Grafana はダッシュボードツールです。

すべてのモニタリングニーズに、Cloud Monitoring をベースとする Google Cloud Managed Service for Prometheus を使用することをおすすめします。Google Cloud Managed Service for Prometheus では、無料でシステムコンポーネントをモニタリングできます。Google Cloud Managed Service for Prometheus には Grafana との互換性もあります。ただし、純粋なローカルモニタリングシステムが必要な場合は、クラスタに Prometheus と Grafana をインストールすることもできます。

Prometheus をローカルにインストールし、システムコンポーネントから指標を収集する場合は、システムコンポーネントの指標エンドポイントにアクセスする権限をローカルの Prometheus インスタンスに付与する必要があります。

Prometheus インスタンスのサービスアカウントを事前定義された gke-metrics-agent ClusterRole にバインドし、サービスアカウントトークンを認証情報として使用して、次のシステムコンポーネントから指標をスクレイピングします。
- kube-apiserver
- kube-scheduler
- kube-controller-manager
- kubelet
- node-exporter
kube-system/stackdriver-prometheus-etcd-scrape シークレットに保存されているクライアントキーと証明書を使用して、etcd からの指標スクレイピングを認証します。
名前空間から kube-state-metrics へのアクセスを許可する NetworkPolicy を作成します。

サードパーティのソリューション

Google は、サードパーティのロギングおよびモニタリングソリューションプロバイダと協力して、Google Distributed Cloud とサードパーティの製品が適切に連動するよう支援しています。Datadog、Elastic、Splunk などの製品があります。今後もサードパーティの製品が検証され、追加される予定です。

Google Distributed Cloud でサードパーティのソリューションを使用する場合は、次のソリューションガイドをご覧ください。

Google Distributed Cloud のロギングとモニタリングの仕組み

Cloud Logging と Cloud Monitoring は、新しい管理クラスタまたはユーザークラスタの作成時に、各クラスタにインストールされ、起動されます。

Stackdriver エージェントには、クラスタごとに次のコンポーネントが含まれています。

Stackdriver Operator（stackdriver-operator-*）。クラスタにデプロイされた他のすべての Stackdriver エージェントのライフサイクルを管理します。
Stackdriver のカスタムリソース。 Google Distributed Cloud インストールプロセスで自動的に作成されるリソース。
GKE Metrics Agent（gke-metrics-agent-*）。各ノードから Cloud Monitoring に指標をスクレイピングする OpenTelemetry Collector ベースの DaemonSet。クラスタに関するより多くの指標を提供するために、node-exporter DaemonSet と kube-state-metrics デプロイメントも含まれています。
Stackdriver Log Forwarder（stackdriver-log-forwarder-*）。各マシンから Cloud Logging にログを転送する Fluent Bit DeamonSet。Log Forwarder は、ログエントリをノードにローカルでバッファリングして、最大 4 時間再送信します。バッファがいっぱいになるか、Log Forwarder が Cloud Logging API に 4 時間以上アクセスできない場合、ログは削除されます。

注: メタデータエージェントはプレビューが可能で、Google Cloud 利用規約の pre-GA のサービス規約が適用されます。一般提供前のプロダクトについてはサポートが制限され、一般提供前のプロダクトの変更は、他の pre-GA バージョンと互換性がない可能性があります。詳細については、リリースステージの説明をご覧ください。
メタデータエージェント（stackdriver-metadata-agent-）。Pod、Deployment、ノードなどの Kubernetes リソースのメタデータを Ops API の構成モニタリングに送信する Deployment。このデータを使用して、デプロイ名、ノード名、Kubernetes サービス名などでクエリを実行できるようにすることで、指標クエリが強化されます。

Stackdriver によってインストールされたエージェントは、次のコマンドを実行して確認できます。

kubectl -n kube-system get pods -l "managed-by=stackdriver"

このコマンドの出力は、次のようになります。

kube-system   gke-metrics-agent-4th8r                                     1/1     Running   1 (40h ago)   40h
kube-system   gke-metrics-agent-8lt4s                                     1/1     Running   1 (40h ago)   40h
kube-system   gke-metrics-agent-dhxld                                     1/1     Running   1 (40h ago)   40h
kube-system   gke-metrics-agent-lbkl2                                     1/1     Running   1 (40h ago)   40h
kube-system   gke-metrics-agent-pblfk                                     1/1     Running   1 (40h ago)   40h
kube-system   gke-metrics-agent-qfwft                                     1/1     Running   1 (40h ago)   40h
kube-system   kube-state-metrics-9948b86dd-6chhh                          1/1     Running   1 (40h ago)   40h
kube-system   node-exporter-5s4pg                                         1/1     Running   1 (40h ago)   40h
kube-system   node-exporter-d9gwv                                         1/1     Running   2 (40h ago)   40h
kube-system   node-exporter-fhbql                                         1/1     Running   1 (40h ago)   40h
kube-system   node-exporter-gzf8t                                         1/1     Running   1 (40h ago)   40h
kube-system   node-exporter-tsrpp                                         1/1     Running   1 (40h ago)   40h
kube-system   node-exporter-xzww7                                         1/1     Running   1 (40h ago)   40h
kube-system   stackdriver-log-forwarder-8lwxh                             1/1     Running   1 (40h ago)   40h
kube-system   stackdriver-log-forwarder-f7cgf                             1/1     Running   2 (40h ago)   40h
kube-system   stackdriver-log-forwarder-fl5gf                             1/1     Running   1 (40h ago)   40h
kube-system   stackdriver-log-forwarder-q5lq8                             1/1     Running   2 (40h ago)   40h
kube-system   stackdriver-log-forwarder-www4b                             1/1     Running   1 (40h ago)   40h
kube-system   stackdriver-log-forwarder-xqgjc                             1/1     Running   1 (40h ago)   40h
kube-system   stackdriver-metadata-agent-cluster-level-5bb5b6d6bc-z9rx7   1/1     Running   1 (40h ago)   40h

Cloud Monitoring の指標

Cloud Monitoring によって収集される指標のリストについては、Google Distributed Cloud の指標を表示するをご覧ください。

Google Distributed Cloud 用の Stackdriver エージェントの構成

Google Distributed Cloud にインストールされた Stackdriver エージェントは、クラスタの問題の管理とトラブルシューティングを目的として、システムコンポーネントに関するデータを収集します。以降のセクションでは、Stackdriver の構成とオペレーティングモードについて説明します。

システムコンポーネントのみ（デフォルトモード）

Stackdriver エージェントはインストール時に、デフォルトでログと指標を収集するように構成されます。Google 提供のシステムコンポーネントのパフォーマンス詳細（CPU やメモリ使用率など）などのメタデータを収集します。管理クラスタ内のすべてのワークロード、およびユーザークラスタでは、コンポーネントに kube-system、gke-system、gke-connect、istio-system、config-management-system 名前空間のワークロードが含まれます。

システムコンポーネントとアプリケーション

デフォルトモードでアプリケーションのロギングとモニタリングを有効にするには、アプリケーションのロギングとモニタリングを有効にするの手順に沿って行います。

最適化された指標（デフォルト指標）

デフォルトでは、クラスタで実行される kube-state-metrics Deployment は、最適化された一連の kube 指標を収集して Google Cloud Observability（旧称 Stackdriver）に報告します。

この最適化された一連の指標を収集するために必要なリソースは少ないため、全体的なパフォーマンスと拡張性を向上させることができます。

除外された kube 指標

最適化された指標からは、次の kube 指標が除外されます。

kube_certificatesigningrequest_cert_length
kube_certificatesigningrequest_condition
kube_certificatesigningrequest_created
kube_certificatesigningrequest_labels
kube_configmap_annotations
kube_configmap_info
kube_configmap_labels
kube_configmap_metadata_resource_version
kube_daemonset_annotations
kube_daemonset_created
kube_daemonset_labels
kube_daemonset_metadata_generation
kube_daemonset_status_observed_generation
kube_deployment_annotations
kube_deployment_created
kube_deployment_labels
kube_deployment_spec_paused
kube_deployment_spec_strategy_rollingupdate_max_surge
kube_deployment_spec_strategy_rollingupdate_max_unavailable
kube_deployment_status_condition
kube_deployment_status_replicas_ready
kube_endpoint_annotations
kube_endpoint_created
kube_endpoint_info
kube_endpoint_labels
kube_endpoint_ports
kube_horizontalpodautoscaler_annotations
kube_horizontalpodautoscaler_info
kube_horizontalpodautoscaler_labels
kube_horizontalpodautoscaler_metadata_generation
kube_horizontalpodautoscaler_status_condition
kube_job_annotations
kube_job_complete
kube_job_created
kube_job_info
kube_job_labels
kube_job_owner
kube_job_spec_completions
kube_job_spec_parallelism
kube_job_status_completion_time
kube_job_status_start_time
kube_job_status_succeeded
kube_lease_owner
kube_lease_renew_time
kube_limitrange
kube_limitrange_created
kube_mutatingwebhookconfiguration_info
kube_namespace_labels
kube_networkpolicy_annotations
kube_networkpolicy_labels
kube_networkpolicy_spec_egress_rules
kube_networkpolicy_spec_ingress_rules
kube_node_annotations
kube_node_role
kube_persistentvolume_annotations
kube_persistentvolume_labels
kube_persistentvolumeclaim_access_mode
kube_persistentvolumeclaim_annotations
kube_persistentvolumeclaim_labels
kube_pod_annotations
kube_pod_completion_time
kube_pod_container_resource_limits
kube_pod_container_resource_requests
kube_pod_container_state_started
kube_pod_created
kube_pod_init_container_info
kube_pod_init_container_resource_limits
kube_pod_init_container_resource_requests
kube_pod_init_container_status_last_terminated_reason
kube_pod_init_container_status_ready
kube_pod_init_container_status_restarts_total
kube_pod_init_container_status_running
kube_pod_init_container_status_terminated
kube_pod_init_container_status_terminated_reason
kube_pod_init_container_status_waiting
kube_pod_init_container_status_waiting_reason
kube_pod_labels
kube_pod_owner
kube_pod_restart_policy
kube_pod_spec_volumes_persistentvolumeclaims_readonly
kube_pod_start_time
kube_poddisruptionbudget_annotations
kube_poddisruptionbudget_created
kube_poddisruptionbudget_labels
kube_poddisruptionbudget_status_expected_pods
kube_poddisruptionbudget_status_observed_generation
kube_poddisruptionbudget_status_pod_disruptions_allowed
kube_replicaset_annotations
kube_replicaset_created
kube_replicaset_labels
kube_replicaset_metadata_generation
kube_replicaset_owner
kube_replicaset_status_observed_generation
kube_resourcequota_created
kube_secret_annotations
kube_secret_info
kube_secret_labels
kube_secret_metadata_resource_version
kube_secret_type
kube_service_annotations
kube_service_created
kube_service_info
kube_service_labels
kube_service_spec_type
kube_statefulset_annotations
kube_statefulset_created
kube_statefulset_labels
kube_statefulset_status_current_revision
kube_statefulset_status_update_revision
kube_storageclass_annotations
kube_storageclass_created
kube_storageclass_info
kube_storageclass_labels
kube_validatingwebhookconfiguration_info
kube_validatingwebhookconfiguration_metadata_resource_version
kube_volumeattachment_created
kube_volumeattachment_info
kube_volumeattachment_labels
kube_volumeattachment_spec_source_persistentvolume
kube_volumeattachment_status_attached
kube_volumeattachment_status_attachment_metadata

Google Distributed Cloud 指標の完全なセットは、Anthos の指標を表示するに記載されています。

最適化された指標を無効にする（推奨しません）には、Stackdriver カスタムリソースのデフォルト設定をオーバーライドします。

選択したシステムコンポーネントに Google Cloud Managed Service for Prometheus を使用する

Google Cloud Managed Service for Prometheus は Cloud Monitoring の一部であり、システムコンポーネントのオプションとして使用できます。Google Cloud Managed Service for Prometheus のメリットは次のとおりです。

アラートや Grafana ダッシュボードを変更することなく、既存の Prometheus ベースのモニタリングを引き続き使用できます。
GKE と Google Distributed Cloud の両方を使用する場合、すべてのクラスタで同じ Prometheus Query Language（PromQL）を指標として使用できます。Google Cloud コンソールの Metrics Explorer で、[PromQL] タブを使用することもできます。

Google Cloud Managed Service for Prometheus の有効化と無効化

Google Distributed Cloud では、Google Cloud Managed Service for Prometheus はデフォルトで有効になっています。

Google Cloud Managed Service for Prometheus を無効にするには:

stackdriver という Stackdriver オブジェクトを編集のために開きます。

kubectl --kubeconfig CLUSTER_KUBECONFIG --namespace kube-system \
    edit stackdriver stackdriver

enableGMPForSystemMetrics フィーチャーゲートを追加して、false に設定します。

apiVersion: addons.gke.io/v1alpha1
kind: Stackdriver
metadata:
  name: stackdriver
  namespace: kube-system
spec:
  featureGates:
    enableGMPForSystemMetrics: false

編集セッションを閉じます。

指標データを表示する

enableGMPForSystemMetrics を true に設定すると、以下のコンポーネントの指標は、Cloud Monitoring での保存方法とクエリの方法が異なる形式になります。

kube-apiserver
kube-scheduler
kube-controller-manager
kubelet と cadvisor
kube-state-metrics
node-exporter

新しい形式では、PromQL または Monitoring Query Language（MQL）を使用して、前述の指標をクエリできます。

PromQL

次に PromQL クエリの例を示します。

histogram_quantile(0.95, sum(rate(apiserver_request_duration_seconds_bucket[5m])) by (le))

MQL

MQL を使用するには、モニタリング対象リソースを prometheus_target に設定し、kubernetes.io/anthos の接頭辞を持つ指標名を使用して、指標名に接尾辞として Prometheus タイプを追加します。

fetch prometheus_target
| metric 'kubernetes.io/anthos/apiserver_request_duration_seconds/histogram'
| align delta(5m)
| every 5m
| group_by [], [value_histogram_percentile: percentile(value.histogram, 95)]

Google Cloud Managed Service for Prometheus を使用した Grafana ダッシュボードの構成

Google Cloud Managed Service for Prometheus の指標データで Grafana を使用するには、まず Grafana データソースを構成して認証する必要があります。データソースを構成して認証するには、データソース同期ツール（datasource-syncer）を使用して OAuth2 認証情報を生成し、Grafana データソース API を介して Grafana に同期します。データソース同期ツールは、Grafana のデータソースで Cloud Monitoring API を Prometheus サーバー URL（URL 値は https://monitoring.googleapis.com で始まる）として設定します。

Grafana を使用したクエリの手順に沿って、Google Cloud Managed Service for Prometheus からデータをクエリするように Grafana データソースを認証し、構成します。

サンプルの Grafana ダッシュボードは、GitHub の anthos-samples リポジトリで提供されています。サンプルダッシュボードをインストールする手順は次のとおりです。

サンプル JSON ファイルをダウンロードします。

git clone https://github.com/GoogleCloudPlatform/anthos-samples.git
cd anthos-samples/gmp-grafana-dashboards

Grafana データソースを Managed Service for Prometheus と異なる名前で作成している場合は、すべての JSON ファイルの datasource フィールドを変更します。
```
sed -i "s/Managed Service for Prometheus/[DATASOURCE_NAME]/g" ./*.json
```
[DATASOURCE_NAME] は、Prometheus frontend サービスを指す Grafana のデータソースの名前に置き換えます。
ブラウザから Grafana UI にアクセスし、[Dashboards] メニューの [+ Import] を選択します。
JSON ファイルをアップロードするか、ファイルの内容をコピーして貼り付けて、[読み込む] を選択します。ファイルの内容が正常に読み込まれたら、[インポートする] を選択します。必要に応じて、インポートする前にダッシュボード名と UID を変更することもできます。
Google Distributed Cloud とデータソースが正しく構成されていれば、インポートされたダッシュボードは正常に読み込まれます。たとえば、次のスクリーンショットでは、cluster-capacity.json によって構成されたダッシュボードを示します。

参考情報

Google Cloud Managed Service for Prometheus の詳細については、以下をご覧ください。

Stackdriver コンポーネントリソースの構成

クラスタを作成すると、Google Distributed Cloud が Stackdriver カスタムリソースを自動的に作成します。カスタムリソースの仕様を編集して、Stackdriver コンポーネントの CPU リクエストとメモリリクエストのデフォルト値と上限をオーバーライドできます。また、デフォルトの最適化された指標の設定を個別にオーバーライドすることもできます。

Stackdriver コンポーネントのデフォルトの CPU およびメモリのリクエストと上限のオーバーライド

Pod 密度が高いクラスタでは、ロギングとモニタリングのオーバーヘッドが増加します。極端な場合、Stackdriver コンポーネントにより、CPU とメモリの使用率が上限に近いことが報告されるか、リソースの上限が原因の再起動が繰り返し発生することがあります。この場合、Stackdriver コンポーネントの CPU とメモリのリクエストおよび制限のデフォルト値をオーバーライドするには、次の手順を行います。

次のコマンドを実行して、コマンドラインエディタで Stackdriver カスタムリソースを開きます。
```
kubectl -n kube-system edit stackdriver stackdriver
```
Stackdriver カスタムリソースで、spec フィールドの下に resourceAttrOverride セクションを追加します。
```
resourceAttrOverride:
      DAEMONSET_OR_DEPLOYMENT_NAME/CONTAINER_NAME:
        LIMITS_OR_REQUESTS:
          RESOURCE: RESOURCE_QUANTITY
```
resourceAttrOverride セクションは、指定したコンポーネントの既存のデフォルトの制限とリクエストをすべてオーバーライドします。次のコンポーネントは、resourceAttrOverride によってサポートされています。
- gke-metrics-agent/gke-metrics-agent
- stackdriver-log-forwarder/stackdriver-log-forwarder
- stackdriver-metadata-agent-cluster-level/metadata-agent
- node-exporter/node-exporter
- kube-state-metrics/kube-state-metrics
サンプルファイルは次のようになります。
```
apiVersion: addons.gke.io/v1alpha1
kind: Stackdriver
metadata:
  name: stackdriver
  namespace: kube-system
spec:
  anthosDistribution: baremetal
  projectID: my-project
  clusterName: my-cluster
  clusterLocation: us-west-1a
  resourceAttrOverride:
    gke-metrics-agent/gke-metrics-agent:
      requests:
        cpu: 110m
        memory: 240Mi
      limits:
        cpu: 200m
        memory: 4.5Gi
```
Stackdriver カスタムリソースに対する変更を保存するには、保存してコマンドラインエディタを終了します。

Pod のヘルスチェックを行います。

kubectl -n kube-system get pods -l "managed-by=stackdriver"

正常な Pod のレスポンスは次のようになります。

gke-metrics-agent-4th8r                1/1     Running   1   40h

コンポーネントの Pod 仕様を確認して、リソースが正しく設定されていることを確認します。

kubectl -n kube-system describe pod POD_NAME

POD_NAME は、変更した Pod の名前に置き換えます。例: gke-metrics-agent-4th8r。

レスポンスは次のようになります。

  Name:         gke-metrics-agent-4th8r
  Namespace:    kube-system
  ...
  Containers:
    gke-metrics-agent:
      Limits:
        cpu: 200m
        memory: 4.5Gi
      Requests:
        cpu: 110m
        memory: 240Mi
      ...

最適化された指標を無効にする

デフォルトでは、クラスタで実行される kube-state-metrics Deployment は、最適化された一連の kube 指標を収集して Stackdriver に報告します。追加の指標が必要な場合は、Google Distributed Cloud の指標のリストから代替指標を見つけることをおすすめします。

使用可能な代替措置の例を以下に示します。

無効な指標	代替措置
`kube_pod_start_time`	`container/uptime`
`kube_pod_container_resource_requests`	`container/cpu/request_cores` `container/memory/request_bytes`
`kube_pod_container_resource_limits`	`container/cpu/limit_cores` `container/memory/limit_bytes`

最適化された指標のデフォルト設定を無効にする（おすすめしません）には、次の手順を行います。

コマンドラインエディタで Stackdriver カスタムリソースを開きます。
```
kubectl -n kube-system edit stackdriver stackdriver
```

optimizedMetrics フィールドを false に設定します。

apiVersion: addons.gke.io/v1alpha1
kind: Stackdriver
metadata:
name: stackdriver
namespace: kube-system
spec:
anthosDistribution: baremetal
projectID: my-project
clusterName: my-cluster
clusterLocation: us-west-1a
optimizedMetrics: false

変更を保存してコマンドラインエディタを終了します。

指標サーバー

Metrics Server は、さまざまな自動スケーリングパイプラインに対するコンテナリソース指標のソースです。Metrics Server は、kubelets から指標を取得し、Kubernetes Metrics API を介して公開します。HPA と VPA により、これらの指標が自動スケーリング開始の判断に使われます。Metrics Server は、アドオンリサイザーを使用してスケーリングされます。

Pod 密度の高さが原因で、ロギングとモニタリングのオーバーヘッドが大きくなりすぎている場合は、リソースの上限により Metrics Server が停止、再起動されることがあります。この場合は、gke-managed-metrics-server 名前空間の metrics-server-config ConfigMap を編集し、cpuPerNode と memoryPerNode の値を変更することで、指標サーバーにより多くのリソースを割り当てることができます。

kubectl edit cm metrics-server-config -n gke-managed-metrics-server

ConfigMap の内容の例:

apiVersion: v1
data:
  NannyConfiguration: |-
    apiVersion: nannyconfig/v1alpha1
    kind: NannyConfiguration
    cpuPerNode: 3m
    memoryPerNode: 20Mi
kind: ConfigMap

ConfigMap を更新したら、次のコマンドを使用して metrics-server Pod を再作成します。

kubectl delete pod -l k8s-app=metrics-server -n gke-managed-metrics-server

Logging と Monitoring の構成要件

Google Distributed Cloud で Cloud Logging と Cloud Monitoring を有効にするには、いくつかの構成要件があります。これらの手順は、Google サービスの有効化ページのLogging と Monitoring で使用するサービスアカウントの構成と、次のリストに含まれています。

Cloud Monitoring ワークスペースは Google Cloud プロジェクト内に作成する必要があります。これを行うには、Google Cloud コンソールで [モニタリング] をクリックし、ワークフローに従います。
次の Stackdriver API を有効にする必要があります。
Stackdriver エージェントが使用するサービスアカウントに次の IAM ロールを割り当てる必要があります。
- logging.logWriter
- monitoring.metricWriter
- stackdriver.resourceMetadata.writer
- monitoring.dashboardEditor
- opsconfigmonitoring.resourceMetadata.writer

料金

Google Kubernetes Engine（GKE）Enterprise エディションのシステムログと指標は無料です。

Google Distributed Cloud クラスタでは、Google Kubernetes Engine（GKE）Enterprise エディションのシステムログと指標には次のものが含まれます。

管理クラスタ内のすべてのコンポーネントのログと指標
ユーザークラスタ内の次の名前空間のコンポーネントのログと指標: kube-system、gke-system、gke-connect、knative-serving、istio-system、monitoring-system、config-management-system、gatekeeper-system、cnrm-system

詳細については、Google Cloud Observability の料金をご覧ください。

Cloud Logging の指標のクレジットについては、販売担当者にお問い合わせください。