このページは Cloud Translation API によって翻訳されました。

オブザーバビリティの概要

オブザーバビリティとは、インフラストラクチャとサービスのステータスと健全性を確認するためのシステムモニタリング、ロギング、アラートなどの追跡情報を指します。Google Distributed Cloud（GDC）エアギャップアプライアンスのオブザーバビリティコンポーネントは、Grafana ダッシュボードに表示されるログと指標を収集します。これらのログと指標に対してクエリを実行して、運用上の問題を特定できます。

プラットフォーム管理者は、オブザーバビリティプラットフォームを使用してシステムクラスタとユーザークラスタをモニタリングし、Grafana ユーザーインターフェース（UI）でログと指標を可視化できます。アプリケーションオペレーターは、アプリケーションのログ、指標、イベントの形式でモニタリングデータと運用データを収集できます。

オブザーバビリティプラットフォームは、スタックコンポーネントを管理クラスタとユーザークラスタにデプロイします。プラットフォーム管理者の Grafana インスタンスには、CPU 使用率やストレージ消費量などの組織レベルの指標と、GDC の管理クラスタ、システムクラスタ、ユーザークラスタの操作可能なコンポーネントからのアラート、ログ、指標が含まれます。

Application Operators の Grafana インスタンスには、プロジェクトのデフォルトのダッシュボードやログは含まれていません。ダッシュボードを作成すると、プロジェクトの指標収集を有効にした場合にのみ表示されます。

プラットフォームコンポーネント

GDC のモニタリングスタックとロギングスタックには、オブザーバビリティプラットフォームの一部としてオープンソースサービスが含まれています。これらのサービスは、Kubernetes Pod、ベアメタルマシン、ネットワークスイッチ、ストレージアプライアンスからログを収集します。

各オブザーバビリティコンポーネントの詳細については、次の表をご覧ください。

コンポーネント	タイプ	クラスタ	説明
`anthos-prometheus-k8s`	StatefulSet	システムのみ	Prometheus（https://prometheus.io/docs/introduction/overview ）: 指標の収集と保存、アラートの評価を行う時系列データベース。ラベルを Key-Value ペアとして追加し、Kubernetes ノード、Pod、ベアメタルマシン、ネットワークスイッチ、ストレージアプライアンスから指標を収集します。データベースは、ユーザークラスタの指標を同じクラスタに保存し、すべてのクラスタの指標を管理クラスタに集約します。
`grafana`	StatefulSet	システムのみ	Grafana（https://grafana.com/docs/grafana/latest/）: 指標とアラートのダッシュボードを可視化するためのユーザーインターフェース。Prometheus が収集した指標を表示し、Loki からログをクエリします。これにより、ユーザーは指標とアラートのダッシュボードを可視化できます。
`alertmanager`	StatefulSet	システムのみ	Alertmanager（https://prometheus.io/docs/alerting/latest/alertmanager/）: ログまたは指標がシステムコンポーネントの障害または異常な動作を示している場合にアラートを送信する、ユーザー定義のマネージャー。Prometheus アラートのルーティング、サイレンシング、集約を管理します。
`loki`	StatefulSet	システムのみ	Loki（https://grafana.com/docs/loki/latest/）: さまざまなコンポーネントからログを保存し、すべてのクラスタからログを集計する時系列データベース。
`audit-logs-loki`	StatefulSet	システムのみ	Loki: 監査目的に必要な長期ログを収集するセカンダリインスタンス。すべてのクラスタからログを集約します。
`anthos-log-forwarder`	DaemonSet	すべてのクラスタ	Fluent Bit（https://docs.fluentbit.io/manual）: さまざまなコンポーネントからログを取得して Loki に挿入するプロセッサ。さまざまな場所からログを収集し、処理して転送します。すべてのクラスタのすべてのノードで実行されます。
`anthos-audit-logs-forwarder`	DaemonSet	すべてのクラスタ	Fluent Bit: 監査目的で長期間保存されるログを読み込むためのセカンダリインスタンス。
`audit-log-failure-detector`	DaemonSet	すべてのクラスタ	監査ログの収集の失敗を検出して報告する GDC コンポーネント。すべてのクラスタのすべてのノードで実行されます。
`logmon-operator`	デプロイ	すべてのクラスタ	オブザーバビリティスタックコンポーネントをデプロイする GDC `Logmon` オペレータ。

GDC は、ロギングとモニタリングの構成用に GKE Enterprise が開発したカスタムリソースも活用します。これらのカスタムリソースを使用すると、Prometheus のスクレイピングターゲットとアラートルール、Alertmanager 構成、Grafana ダッシュボード、ログのスクレイピングターゲットを構成できます。

オブザーバビリティの概要

プラットフォーム コンポーネント

プラットフォームコンポーネント