Google Cloud VMware Engine と Google Cloud のオペレーション スイートのモニタリングがさらにシンプルに
Google Cloud Japan Team
※この投稿は米国時間 2021 年 9 月 2 日に、Google Cloud blog に投稿されたものの抄訳です。
アップグレードとパッチ適用の自動化、セキュリティ強化、コストを節約できるサブスクリプション ベースのモデル、オンデマンド容量など、クラウドへのワークロードの移行には多くのメリットがあります。すでにクラウドへの移行を済ませている組織や、移行を真剣に検討している組織のなかには、インフラストラクチャやアプリケーション、ネットワーク、ワークロードなどのモニタリングに何を使えばよいかわからないところもあることでしょう。Google Cloud VMware Engine をご利用いただいているお客様なら、プレビュー版の Google Cloud Operations エージェントを使用して VMware インフラストラクチャのモニタリングを行っていただけます。さらに、Google Cloud VMware Engine サブスクリプションを利用中の多くのお客様については、使用量が無料枠のしきい値を超えていない限り Google Cloud のオペレーション スイートを無料でご利用いただけます。
Google Cloud VMware Engine モニタリングでインフラストラクチャ データを 1 つのポータルに集約
モニタリングをよりシンプルで安全かつ費用対効果の高いものにするために、Google Cloud のオペレーション スイートに Google Cloud VMware Engine を追加しました。Google Cloud VMware Engine 用の最新のプレビュー版 Cloud Operations エージェントでは、サードパーティ ソリューションと統合することなく、vCenter と vSAN の指標、および vCenter の syslog を収集できます。さらに、このエージェントでは、インフラストラクチャの指標とログをオンプレミス環境から Cloud Operations に移行することもできます。
この新しいエージェントを使用することで、インフラストラクチャのモニタリングを 1 つのツールに集約できます。また、事前構築済みおよびカスタマイズ可能なダッシュボードや既存のアラート システムとの統合など、Google Cloud Operations のあらゆる機能を利用して、独自のしきい値とロジックに基づくアラートを構築できます。
仕組みは次のとおりです。
Google Cloud VMWare Engine のログおよび指標の収集の仕組み
プレビュー版 Cloud Operations エージェントを使用した、Google Cloud VMware Engine とオペレーション スイートの統合。最新のソリューションでは、お客様がサードパーティ ソリューションと統合したり認証情報を共有したりすることなく、Google のインフラストラクチャを通じてすべてのデータが転送されます。
必要なほぼすべての設定をお客様側で構成できます。たとえば、スマートフォンの SMS メッセージを使ってアラートを構成し、新しい VM がインスタンスにロールアップされると通知を受け取るようにすることで、即座に状況を把握できます。ニーズがさらに複雑な場合でも、アルゴリズムを適用したり、モデルを構築したりして詳細な分析情報を手に入れることができます。
Google Cloud VMware Engine モニタリングへの移行はいたってシンプル
なんらかの開発やツールの作成などをする必要がなく、ダッシュボード ソリューションやアラート ソリューションとの指標統合に頭を悩ませることもないため、Google Cloud VMware Engine モニタリングは簡単に実装して使用できます。いつもと同じように、VMware Engine プライベート クラウドをロールアウトする際に次の手順に従うことで、syslog、vCenter、vSAN の指標を収集します。
エージェントをホストする Linux OS VM インスタンスをプライベート クラウド上に作成する
コードを 1 行だけ実行してエージェントをインストールする
エージェントを構成する
ログ転送を構成する
Infrastructure as Code、または Cloud Console を使用して、ロギングとモニタリングの権限を持つサービス アカウントを作成する
任意: すぐに使用できる無料の Google Cloud VMware Engine ダッシュボードを Git リポジトリからインストールすることもできます。
詳しい手順はこちらでご覧いただけます。
セットアップがほとんど不要なほどシンプル
モニタリングの設定が完了しても、収集対象の指標を選択する画面は表示されません。ただし、収集対象から外す指標は選択できます(デフォルトでは vCenter と vSAN の指標が収集されます)。サーバー、メタデータ、情報(VM インスタンスの名前など)がツールによって特定されます。指標とログがツールによって定期的に収集されます。Google Cloud オペレーション アカウントにログインするとすぐに指標が反映され始めます。
データが流れ始めたら、あらかじめ用意された Google Cloud VMware Engine の 3 つのダッシュボード(Overview、Contentions、VM Performance)を使用して、モニタリング業務をスピードアップすることもできます。
Google Cloud VMware Engine Overview ダッシュボードには、データセンター、プライベート クラウド、ESXi ノード、危険な状態にある VM インスタンス、合計 VM インスタンスなどのおおまかな数をはじめ、デプロイメントの概要を把握できます。指標はダッシュボードで簡単に入れ替え、追加、削除できます。ダッシュボードを下にスクロールすると、ESXi ホスト、VM インスタンスの順番でデプロイメントの詳細が表示されます。
Google Cloud VMware Engine Contentions ダッシュボードでは、どのリソース(CPU、メモリ、またはストレージ)が上限に達しつつあるか、どのアセット(ESXi ホスト、VM インスタンス)が大半のリソースを消費しているかを把握できます。
VM の状況をリアルタイムで把握
Google Cloud VMware Engine Virtual Machines Performance ダッシュボードには、仮想マシンに関する情報が豊富に表示されます。このダッシュボードで特定のグループや個別の仮想マシンに注目する場合は、ダッシュボードのフィルタリング機能を使用することをおすすめします。
統合アラートによる時間の節約
Google Cloud VMware Engine の注目すべき特徴は、Google が VMware インフラストラクチャを管理し、Google サイト信頼性エンジニアが vCenter の重要なイベントをモニタリングする点です。しかし、さまざまなオブザーバビリティのユースケースにおいて、Google Cloud VMware Engine プライベート クラウドからログと指標を収集する必要がある場合もあります。ここでは、企業のインフラストラクチャ管理者の一般的なユースケースを例にとってみます。
アプリケーションを Google Cloud VMware Engine に移行した後、管理者は指標エージェントが収集した指標のなかから好きなものを使用して、Cloud アラートを通じてポリシーを作成し、任意のチャネル(SMS、メール、Slack 通知など)からアラートを送信できます。CPU、メモリ、またはストレージが危険と思われるしきい値を超えると、管理者にアラートが送信されます。モニタリングは Cloud Operations によって行われるため、管理者はアラートがトリガーされたときだけインフラストラクチャを確認すればよくなります。
CPU 使用率が 1 分以上 95% を超えている場合のアラート ポリシーの例
統合されたロギングとモニタリングの威力
ロギングデータも忘れてはいけない大切な要素です。最新の環境では vCenter の syslog を Cloud Operations に送信することもできます。指標データ同様、syslog データも Cloud Logging でほぼリアルタイムに利用できるようになっています。ここからは、セキュリティ監査担当者の一般的なユースケースについて見ていきましょう。
vCenter と ID ドメインを統合した後、vCenter のローカル ユーザーによるログイン イベントを監査するとします。さらに、ローカル ユーザーが使用された場合にアラートを受信します。次のログフィルタを使用することで、(架空の)ローカル ユーザー「break_glass_user@gve.local」がいつ使用され、どの IP アドレスからイベントが発生したかを特定できます。
jsonPayload."@fields.privatecloud_name":your-private-cloud-name
jsonPayload.message:"Successful login break_glass_user@gve.local"
イベントのサンプルは以下の Cloud Logging のスクリーンショットにあります。ログイン イベントのソースサーバーの IP アドレスがメッセージ フィールドに表示されていますが、スクリーンショットではグレー表示されている点に注目してください。
オペレーターとセキュリティ監査担当者向けのアラートは、ログフィルタに基づいて Cloud Operations で構成できます。次に、ローカル ユーザーのログイン回数を測定するログベースの指標を作成します。作成したばかりの指標に基づいて Cloud Monitoring でアラート ポリシーを作成し、アラート用の適切な通知チャンネル(メール、Slack チャンネル、Pub/Sub など)を構成します。インシデントが表示される Cloud Monitoring で確認と確認応答を行います。
Google はこれからも発展を続けます
Google Cloud VMware Engine モニタリングによって多くの高度なツールが利用できるようになっていますが、その機能については構築を始めたばかりです。統合のセットアップを完全に不要にし、指標の追加、ワークロードとワークロード VM の可視化を行うとともに、最も重要な情報をすぐに使えるようにするという野心的なロードマップを Google では掲げています。詳細については、モニタリングのドキュメントをご覧ください。
-Google Cloud VMware Engine プロダクト マネージャー Nargis Sakhibova
-Google Cloud プロフェッショナル サービス、戦略クラウド エンジニア Konrad Schieban