このページは Cloud Translation API によって翻訳されました。

ハイブリッドクラウドとマルチクラウドのモニタリングおよびロギングパターン

Last reviewed 2024-06-11 UTC

このドキュメントでは、ハイブリッドクラウドとマルチクラウドのデプロイのモニタリングおよびロギングアーキテクチャと、 Google Cloudを使用してそれらを実装するためのベストプラクティスについて説明します。このドキュメントを使用することにより、ご自身の環境に適したパターンとプロダクトを知ることができます。

ハイブリッドやマルチクラウドのアーキテクチャを設定するにあたり、要件および制約条件の元となるアプリケーションワークロードは、企業ごとにそれぞれ異なります。これらの制約や要件を満たすようにアーキテクチャを設計し、調整する必要がありますが、適用できるパターンとして、いくつか一般的なものに整理できます。

このドキュメントで扱うパターンは、次の 2 つのカテゴリに分類されます。

「一括表示」アーキテクチャでは、モニタリングとロギングがすべて一元化され、単一のアクセスポイントと管理機能が提供されます。
「アプリケーション・運用分離」アーキテクチャでは、機密データに対するコンプライアンス要件を満たすように、機密性の高いアプリケーションデータは、機密性の低い運用データから分離されます。

アーキテクチャパターンの選択

次の図のディシジョンツリーを使用して、ユースケースに最適なアーキテクチャを決定できます。

モニタリングおよびロギングアーキテクチャを選択するためのディシジョンツリー。

各アーキテクチャの詳細はこのドキュメントで説明しますが、大まかな選択肢として次のものがあります。

Monitoring からレガシーソリューションにエクスポートする。
レガシーソリューションに直接エクスポートする。
Prometheus と Fluentd または Fluent Bit で Monitoring を使用する。
observIQ BindPlane で Monitoring を使用する。

一括表示アーキテクチャ

ハイブリッドシステムの共通目標は、複数のアプリケーションや複数の環境にある各ソースからのモニタリング情報とロギング情報を 1 か所に集めて一元的に表示することです。このような表示形式を「一括表示」といいます。

次の図は、このパターンを示しています。オンプレミスとクラウドの両方のアプリケーションからのモニタリングデータとロギングデータが、クラウドでホストされる 1 つのリポジトリに一元化されています。

モニタリングとロギングのアーキテクチャの概要

このアーキテクチャには、次のメリットがあります。

すべてのモニタリングとロギングについて 1 つの一貫したビューが表示されます。
データの保存と保持を 1 つの場所で管理できます。
一元化されたアクセス制御と監査を行えます。ただし、中央リポジトリに転送されるデータのセキュリティを確保する必要があります。

一括表示先としての Monitoring

Cloud Monitoring は、サービス、コンテナ、アプリケーション、インフラストラクチャ用の Google 管理のモニタリングおよび管理ソリューションです。Google Cloud Observability を使用すると、指標、ログ、トレース、イベントを一元管理し、堅牢なストレージソリューションを実現できます。このスイートは、ダッシュボード、レポート作成、アラート通知などのオブザーバビリティツールの完全なスイートも提供します。

すべての Google Cloud プロダクトとサービスは、Monitoring との統合をサポートしています。さらに、Monitoring をハイブリッドリソースとオンプレミスリソースに拡張するために使用できる統合ツールがいくつかあります。

次のベストプラクティスは、Monitoring を一括表示先として使用するすべてのアーキテクチャに適用されます。

ログ保持に対するコンプライアンス要件を満たすには、組織のログシンクを設定します。
ログイベントを迅速に分析するには、セキュリティとアクセス分析のための BigQuery へのログエクスポートを設定します。
ログバケットに保存されているログを分析するには、Log Analytics で SQL クエリを実行します。
機密データを扱うプロジェクトの場合、データアクセス監査ログを有効にして、データにアクセスしたユーザーをトラックできるようにすることを検討してください。
社会保障番号、クレジットカード番号、メールアドレスなどの機密情報を除外するには、ログデータをフィルタします。カスタム Fluent Bit 構成またはログの除外を使用した取り込みを使用することによってフィルタできます。また、コンプライアンス要件を満たすために、フィルタされていないログも個別にエクスポートできます。

observIQ による Monitoring と BindPlane を使用したハイブリッドモニタリングとロギング

Google のパートナーである observIQ の BindPlane を使用すると、オンプレミス VM とアマゾンウェブサービス（AWS）、Microsoft Azure、Alibaba Cloud、IBM Cloud を Google Cloud などの他のクラウドプロバイダの両方からモニタリングデータとロギングデータを Google Cloudにインポートできます。次の図は、Monitoring と BindPlane によってハイブリッドクラウドの一括表示が実現される仕組みを示しています。

BindPlane と Monitoring によるモニタリングとロギングのためのアーキテクチャの概要。

このアーキテクチャには、次のメリットがあります。

VM などのリソースのモニタリングに加えて、BindPlane には 50 を超える一般的なデータソース向けの緊密な組み込みのインテグレーションが用意されています。
BindPlane の使用にあたり、追加のライセンス費用は発生しません。BindPlane の指標は、カスタム指標として Monitoring にインポートされ、課金対象となります。同様に、BindPlane ログは他の Logging ログと同じレートで課金されます。

このパターンの実装の詳細については、BindPlane を使用したオンプレミスリソースのロギングとモニタリングをご覧ください。

Prometheus と Monitoring を使用したハイブリッド Google Kubernetes Engine モニタリング

Google Cloudによって完全に管理されている一般的なオープンソースモニタリングソリューションである Google Cloud Managed Service for Prometheus を使用して、複数の Kubernetes クラスタで実行されるアプリケーションを Monitoring でモニタリングできます。このアーキテクチャは、Google Cloud 上の Google Kubernetes Engine（GKE）とオンプレミスデータセンターの Google Distributed Cloud に分散されている Kubernetes ワークロードを実行する場合に便利です。両方に統合された 1 つのインターフェースを利用できるためです。Google Cloud 次の図は、データ収集に Prometheus と Monitoring のコレクタを使用する方法を示しています。

Prometheus と Monitoring を使用した GKE モニタリングのアーキテクチャの概要。

このアーキテクチャには、次のメリットがあります。

クラウド環境とオンプレミス環境の両方で一貫した Kubernetes 指標を利用できます。
Prometheus を大規模に手動で管理、運用することなく、Prometheus を使用することでワークロードをモニタリングし、アラートを送信できるようになります。
Prometheus の使用にあたり、追加のライセンス費用は発生しません。Prometheus の指標が Monitoring にインポートされます。インポートは課金対象であり、取り込まれたサンプル数に応じて課金されます。

このアーキテクチャには、次のデメリットがあります。

Prometheus はモニタリングのみをサポートしているため、ロギングは別途構成する必要があります。次のセクションでは、Fluentd または Fluent Bit を使用したロギングの一般的なオプションについて説明します。

次のベストプラクティスをおすすめします。

Prometheus はデフォルトで公開されたすべての指標を収集します。各指標が、課金対象の指標になります。予期しない費用を回避するには、Monitoring の費用管理の実装を検討してください。

Fluentd または Fluent Bit と Cloud Logging を使用したハイブリッド GKE のロギング

Fluentd または一般的なオープンソースロギングエージェントである Fluent ビットと Cloud Logging を使用すると、複数の GKE クラスタで実行されているアプリケーションから Cloud Logging にログを取り込むことができます。このアーキテクチャは、Google Cloud 上の GKE とオンプレミスデータセンターの Google Distributed Cloud に分散されている Kubernetes ワークロードを実行する場合に便利です。GKE と Google Distributed Cloud 間で統合された 1 つのインターフェースを利用できるためです。 Google Cloud 次の図は、ログのフローを示しています。

Fluentd または Fluent Bit、Monitoring、Logging を使用した GKE モニタリングのアーキテクチャの概要。

このアーキテクチャには、次のメリットがあります。

クラウド環境とオンプレミス環境の両方で一貫した Kubernetes ロギングを使用できます。
Logging をカスタマイズして、機密情報を除外できます。
Fluentd または Fluent Bit の使用にあたり、追加のライセンス費用は発生しません。Fluentd または Fluent Bit を使用して Logging にインポートされたログは、課金対象です。

このアーキテクチャには、次のデメリットがあります。

Fluentd と Fluent Bit はロギングのみをサポートしているため、モニタリングは別途構成する必要があります。Prometheus を使用したモニタリングの一般的なオプションについては前のセクションで説明しました。

このパターンの実装の詳細については、Google Kubernetes Engine ログ用の Fluent Bit のカスタマイズをご覧ください。

一括表示に対応したパートナーサービス

Datadog や Splunk などのサードパーティのモニタリングサービスやロギングサービスをすでに使用している場合、Logging に移行したくないかもしれません。その場合、 Google Cloud から多くの一般的モニタリングおよびロギングサービスにデータをエクスポートできます。統合されたモニタリングサービスおよびロギングサービスと、ニーズに合った個別のモニタリングおよびロギングサービスのいずれを使用するかを選択できます。

Logging からパートナーサービスへのエクスポート

このパターンでは、Datadog などのパートナーのモニタリングサービスが Cloud Monitoring API に接続することを承認します。この承認により、サービスは Logging で利用可能な指標をすべて取り込むことができるため、Datadog はモニタリング用の一括表示先として機能します。

データのロギングのために、Logging では Pub/Sub へのエクスポート（ログシンク）が利用できます。このようにエクスポートすると、パートナーロギングサービス（Elastic、Splunk など）が Logging から大量のログをリアルタイムで取り込むためのパフォーマンスと復元性を確保できます。これらのパートナーサービスはログ用の一括表示を提供します。

次の図に、ロギングとモニタリングの複合アーキテクチャを示します。

モニタリングとロギングのデータをパートナーサービスにエクスポートするためのアーキテクチャの概要。

このアーキテクチャには、次のメリットがあります。

使い慣れた既存のツールを引き続き使用できます。
Google Cloud サポートは、Logging ログを使用したトラブルシューティングに引き続き対応します。

このアーキテクチャには、次のデメリットがあります。

通常、パートナーソリューションは外部でホストされます。つまり、ネットワーク接続が中断された場合、パートナーソリューションを利用できない、またはパートナーソリューションがデータを収集できない状況が発生します。セルフホスティングによってこのリスクを回避できる場合もありますが、ソリューションのインフラストラクチャを自分で維持する必要があります。
外部でホストされるダッシュボードは、Google Cloud サポートでは直接利用できません。これにより、トラブルシューティングとその解決が遅れる可能性があります。
商用パートナーソリューションには、高額なライセンス料が必要になる場合があります。

統合の具体例のうち、次のものがあります。

Datadog: Compute Engine 指標のモニタリングと Logging のログの収集
Elastic: Logging のログの Elastic Cloud へのエクスポート
Splunk: Logging のエクスポートのシナリオ

Grafana を使用して Prometheus と Logging の指標を分析する

Grafana は、指標の収集のために、一般に Prometheus と組み合わされている人気のあるオープンソースモニタリングツールです。このアーキテクチャでは、Prometheus をオンプレミスの収集レイヤとして使用し、Grafana をGoogle Cloud とオンプレミスリソースの両方を表示する一括表示先として使用します。次の図は、 Google Cloud とオンプレミスの指標を分析するサンプルアーキテクチャを示しています。

一括表示先である Grafana を使用してモニタリングするためのアーキテクチャの概要。

このアーキテクチャには、次のメリットがあります。

VM とコンテナの両方があるハイブリッド環境に適しています。
組織ですでに Prometheus と Grafana を使用している場合、ユーザーは引き続き Prometheus と Grafana を使用できます。

このアーキテクチャには、次のデメリットがあります。

Prometheus はモニタリングのみをサポートしているため、Fluentd や Grafana 用 Cloud Logging プラグインなどを使用して、ロギングを個別に構成する必要があります。
Prometheus はオープンソースで拡張可能ですが、サポート対象のエンタープライズソフトウェア統合は限られています。
Prometheus と Grafana はサードパーティのツールであり、Google のプロダクトではありません。Google は、Prometheus または Grafana をサポートしていません。

詳細については、Grafana 用 Cloud Logging プラグインを使用したトラブルシューティングの改善をご覧ください。

Fluentd を使用したログのエクスポート

Fluentd または Fluent Bit を Logging のログコレクタとして使用する方法については、前述のパターンで説明しました。Fluentd または Fluent Bit をサポートする他のロギングシステムまたはデータ分析システム（BigQuery、Elastic、Splunk など）にもこれと同じ基本アーキテクチャを使用できます。次の図は、このパターンを示しています。

Fluentd または Fluent Bit からログを直接エクスポートするアーキテクチャの概要。

このアーキテクチャには、次のメリットがあります。

VM とコンテナの両方があるハイブリッド環境に適しています。
Fluentd はシステムログなどの多くのデータソースからデータを読み込むことができます。
Fluentd は、多くの一般的なサードパーティのロギングおよびデータ分析システム用の出力プラグインを提供しています。
Fluent Bit は、システムログなどのさまざまな入力を読み取ることもできます。
Fluent Bit は、多くの一般的なサードパーティのロギングシステムおよびデータ分析システムの出力を提供しています。

このアーキテクチャには、次のデメリットがあります。

Fluentd と Fluent Bit はログのみをサポートしているため、モニタリングは別途構成する必要があります。前のセクションでは、Prometheus と Grafana を使用したモニタリングの一般的なオプションについて説明しました。
Fluentd と Fluent Bit はサードパーティのツールであり、Google の公式プロダクトではありません。Google はこれらをサポートしていません。
エクスポートされたログは、トラブルシューティングのために Google Cloud サポートで利用できません。特に、Google はロギングが有効になっていない Google Distributed Cloud クラスタのサポートを提供していません。

アプリケーションデータと運用データの分離

一括表示アーキテクチャを利用するには、アプリケーションのモニタリングデータとロギングデータをクラウドにストリーミングする必要があります。ただし、規制またはコンプライアンスの要件により、顧客データをオンプレミスに保持しなければならない、あるいはパブリッククラウドに保存できるデータに厳しい制約を受ける場合があります。

これらのハイブリッド環境は機密性の高いアプリケーションデータを低リスクの運用データから分離するため、次の図に示すように、有用なパターンです。

アプリケーションデータと運用データを分離するためのアーキテクチャの概要。

ハイブリッドクラウドとマルチクラウドのアーキテクチャを使用してアプリケーションデータとシステムデータを分離する

オンプレミスクラスタをモニタリングするには、Prometheus や Grafana などのオープンソースツールを使用できます。テレメトリーデータを収集して転送するには、OpenTelemetry Collector や observIQ BindPlane などのソリューションを使用できます。これらのツールを使用すると、機密性の高いアプリケーションデータを、セルフホスト型のモニタリングソリューションやロギングソリューションなどのオンプレミスで完全に取り込んで表示するように構成できます。機密性の低いシステムデータは、 Google Cloudの Monitoring と Logging にエクスポートできます。次の図は、このアーキテクチャを示しています。

GKE を使用したアプリケーションデータとシステムデータの分離。

このアーキテクチャには、次のメリットがあります。

機密性の高いアプリケーションデータは完全にオンプレミスで保持されます。
オンプレミスのモニタリングとロギングにはクラウドの依存関係がなく、ネットワーク接続が中断されても引き続き使用できます。
オンプレミスとGoogle Cloudの両方の GKE システムデータは、すべて Monitoring と Logging に一元化され、必要に応じて Google Cloud サポートも利用できます。

次のステップ

ハイブリッドとマルチクラウドのパターンとプラクティスのシリーズで、アーキテクチャパターンと安全なネットワーキングアーキテクチャパターンなどの、ハイブリッドとマルチクラウドのベストプラクティスの詳細を確認する。
Cloud Kebernetes のベストプラクティスクエストに登録して、GKE でのオブザーバビリティなどに関する実践的な演習を行う。
Google Cloud に関するリファレンスアーキテクチャ、図、ベストプラクティスを確認する。Cloud アーキテクチャセンターをご覧ください。

ハイブリッド クラウドとマルチクラウドのモニタリングおよびロギング パターン

アーキテクチャ パターンの選択

一括表示アーキテクチャ

一括表示先としての Monitoring

observIQ による Monitoring と BindPlane を使用したハイブリッド モニタリングとロギング

Prometheus と Monitoring を使用したハイブリッド Google Kubernetes Engine モニタリング

Fluentd または Fluent Bit と Cloud Logging を使用したハイブリッド GKE のロギング

一括表示に対応したパートナー サービス

Logging からパートナー サービスへのエクスポート

Grafana を使用して Prometheus と Logging の指標を分析する

Fluentd を使用したログのエクスポート

アプリケーション データと運用データの分離

ハイブリッド クラウドとマルチクラウドのアーキテクチャを使用してアプリケーション データとシステムデータを分離する

次のステップ

ハイブリッドクラウドとマルチクラウドのモニタリングおよびロギングパターン

アーキテクチャパターンの選択

observIQ による Monitoring と BindPlane を使用したハイブリッドモニタリングとロギング

一括表示に対応したパートナーサービス

Logging からパートナーサービスへのエクスポート

アプリケーションデータと運用データの分離

ハイブリッドクラウドとマルチクラウドのアーキテクチャを使用してアプリケーションデータとシステムデータを分離する