パフォーマンス ダッシュボードの概要

パフォーマンス ダッシュボードは、Google Cloud ネットワーク全体のパフォーマンスと、プロジェクトのリソースのパフォーマンスを可視化します。

このパフォーマンス モニタリング機能を使用すると、アプリケーションの問題と基盤となる Google Cloud ネットワークの問題とを区別できます。過去のネットワーク パフォーマンスの問題を調査することもできます。

パフォーマンス ダッシュボードは Cloud Monitoring にもデータをエクスポートします。Monitoring を使用してデータのクエリを実行し、追加情報を取得できます。詳細については、パフォーマンス ダッシュボードの指標のリファレンスをご覧ください。

プロジェクトのパフォーマンス ビュー

プロジェクト パフォーマンス ビューでは、パフォーマンス ダッシュボードにプロジェクト仮想マシン(VM)インスタンスが存在するゾーンのパケットロスまたはレイテンシ指標のみが表示されます。たとえば、VM 間トラフィックや VM からインターネットへのトラフィックです。ワークロードがデプロイされるリージョンは、最大 5 つ選択できます。このダッシュボードでは、次の情報を確認できます。

  • パケットロスの概要
  • 選択したリージョンのリージョンペア間のパケットロス平均
  • 選択したリージョンのゾーンペア間のパケットロス平均
  • レイテンシの概要
  • 選択したリージョンのリージョンペア間のレイテンシの中央値
  • 選択したリージョンのゾーンペア間のレイテンシの中央値

VM インスタンス間のトラフィック

パフォーマンス ダッシュボードには、Compute Engine 仮想マシン(VM)インスタンスが存在するゾーンのパケットロスとレイテンシの指標が表示されます(概要グラフとヒートマップ ビューに表示されます)。現在のデータと過去 6 週間の指標が表示されます。たとえば、プロジェクト内に、ゾーン A とゾーン B の VM を持つ Virtual Private Cloud(VPC)ネットワークがあるとします。この場合、パフォーマンス ダッシュボードには、これら 2 つのゾーン間のプロジェクトのパケットロスとレイテンシの指標が表示されます。

選択した期間に応じて、実際の VM 間のトラフィックのサンプルから集計されたレイテンシ指標も表形式で表示できます。レイテンシの詳細テーブルに、VM とそれに対応するレイテンシの詳細が表示されます。

Google Cloud とインターネット ロケーション間のトラフィック

パフォーマンス ダッシュボードには、Compute Engine 仮想マシン(VM)インスタンスが存在するリージョンと、その VM と通信するエンドデバイスのインターネット ロケーションのレイテンシ指標が表示されます。現在のレイテンシの指標と 6 週間分の履歴データが表示されます。たとえば、プロジェクトの Virtual Private Cloud ネットワークで、リージョン A の仮想マシンが都市 X と Y のクライアントからトラフィックを受信しているとします。このような場合、パフォーマンス ダッシュボードはリージョン A と都市 X および Y との間のプロジェクトのレイテンシ指標を提供します。

プロジェクトの指標を表示するには、パフォーマンス ダッシュボード ページの上部にある [プロジェクトのパフォーマンスを表示] をクリックします。測定対象に関するその他の例と詳細については、指標をご覧ください。

Google Cloud のパフォーマンス ビュー

Google Cloud のパフォーマンス ビューでは、パフォーマンス ダッシュボードにすべての Google Cloud のゾーン間のパケットロスとレイテンシの指標が表示されます。たとえば、VM 間トラフィックや Google Cloud からインターネットへのトラフィックです。ダッシュボードには、Google Cloud ネットワークのステータスが表示され、Google Cloud 全体のパフォーマンスとプロジェクトで観察したパフォーマンスを比較できます。最大 5 つの Google Cloud リージョンを選択して、次の情報を確認できます。

  • パケットロスの概要 このビューでは、Google Cloud のすべての VM 間パケットロスで、最大 50 個のゾーンペアを表示できます。
  • ゾーンペア間のパケットロス平均。
  • レイテンシの概要。 このビューでは、すべての Google Cloud の VM 間のラウンド トリップ時間(RTT)があるゾーンペアを最大 50 個まで表示できます。
  • ゾーンペア間のレイテンシの中央値。

VM インスタンス間のトラフィック

パフォーマンス ダッシュボードには、すべての Google Cloud のパケットロスとレイテンシの指標が表示されます。これらの指標は、プロジェクトごとのダッシュボードで明らかになった問題がプロジェクトに固有のものであるかどうかを理解する際に有用です。

Google Cloud のパフォーマンス ビューには、選択した時間枠(デフォルトでは 1 時間)のゾーンペア(最大 50 個)の時系列データが表示されます。

プロジェクトがそれらのゾーンにデプロイされていない場合でも、Google Cloud ゾーンペアのネットワーク パフォーマンスを表示できます。リージョン レベルとゾーンレベルの両方でパフォーマンスを表示できます。サマリー時系列グラフには、Google Cloud 全体で集計された VM 間パケットロスまたはレイテンシが特に大きいゾーンペアが 50 個まで表示されます。

Google Cloud とインターネット ロケーション間のトラフィック

パフォーマンス ダッシュボードには、Google Cloud リージョン全体の VM とインターネット エンドポイント間のレイテンシ指標が表示されます。トラフィックは都市、地域、国レベルで集計できます。特定のリージョンとロケーションのペアに十分な Google Cloud トラフィックがある場合は、そのペアに対応するレイテンシ指標を表示できます。

これらの指標は、プロジェクトごとのダッシュボードで確認された問題がプロジェクトに固有なものかどうか評価するのに役立ちます。グローバル指標も、将来のデプロイを計画する際に有用です。

Google Cloud のパフォーマンス指標を表示するには、パフォーマンス ダッシュボード ページの上部にある [すべての Google Cloud のパフォーマンスを表示] をクリックします。プロジェクト パフォーマンス ビューから Google Cloud のパフォーマンス指標を表示するには、特定のゾーンペアの上にポインタを置きます。測定対象に関するその他の例と詳細については、指標をご覧ください。

指標

パフォーマンス ダッシュボードには、パケットロスとレイテンシ(ラウンド トリップ時間(RTT))の 2 種類の指標があります。プロジェクトのパケットロス指標を取得するには、プロジェクトに十分な数の VM が必要です。レイテンシ指標を取得するには、十分な量のトラフィックが必要です。それ以外は、パフォーマンス ダッシュボードは設定不要です。

以降のセクションで、両方の指標について詳しく説明します。

パケットロス

パケットロス指標には、次の間でのアクティブ プローブの結果が表示されます。

  • 1 つの VPC ネットワーク内の VM。

  • ピアリングされた VPC ネットワーク内の VM で、1 つまたは両方のネットワークがプロジェクト内にある場合。ピアリングされたネットワークが異なるプロジェクトにある場合、パケットロスは宛先プロジェクトに表示されます。

  • プロジェクトで使用されている共有 VPC ネットワーク内の VM。共有 VPC ネットワークを使用する 2 つのプロジェクト間のパケットロスは、宛先のサービス プロジェクトに表示されます。

たとえば、プロジェクト A に、ゾーン A にのみ VM が配置されたネットワーク A と、ゾーン M にのみ VM が配置されたネットワーク M という 2 つの VPC ネットワークがあるとします。これら 2 つのネットワークがピアリングされている場合、プロジェクト A のパフォーマンス ダッシュボードには A と M のゾーンペアのパケットロス データが表示されます。ネットワークがピアリングされていない場合、パフォーマンス ダッシュボードにはそのゾーンペアのパケットロス指標は表示されません。

一方で、これら 2 つのネットワークが同じプロジェクト内に存在しないとします。つまり、ネットワーク A がプロジェクト A の一部であり、ネットワーク M がプロジェクト M の一部であるとします。ネットワークがピアリングされていると、プロジェクト M のパフォーマンス ダッシュボードに、ゾーン M が宛先ゾーンである場合にパケットロスのデータが表示されます逆に、ゾーン A が宛先ゾーンの場合、パケットロス データはプロジェクト A にのみ表示されます。ネットワークがピアリングされていない場合、プロジェクトのパフォーマンス ダッシュボードにはゾーンペアのパケットロスのデータは表示されません。

すべてのプローブで収集されたデータは、パフォーマンス ダッシュボードで集約されます。つまり、パフォーマンス ダッシュボードでは、プロジェクト内パケットロスと他のタイプ(他のプロジェクトのピアリングされた VPC ネットワークに関連するパケットロスなど)のデータを分離することはできません。ただし、Monitoring を使用してドリルダウンし、さらに詳細な結果を確認できます。詳細については、パフォーマンス ダッシュボードの指標のリファレンスをご覧ください。

パフォーマンス ダッシュボードは、Cloud VPN 接続経由でプローブを送信しません。

手順

パフォーマンス ダッシュボードは、VM を格納する物理ホスト上でワーカーを実行します。このワーカーは、トラフィックと同じネットワーク上で実行されるプローブ パケットを挿入して受信します。ワーカーは VM ではなく物理ホストで実行されるため、このようなワーカーは VM リソースを消費せず、トラフィックが VM に表示されません。

プローブは、互いに通信できる VM のメッシュ全体をカバーします。これは、必ずしもトラフィック パターンと同じではありません。したがって、パフォーマンス ダッシュボードにパケットロスの兆候が表示されることがありますが、アプリケーションでパケットロスが測定されたという証拠は示されません。

プローブされたすべての VM に対して、内部 IP アドレスと外部 IP アドレス(存在する場合)の両方を使用して VM にアクセスを試みます。プローブは Google Cloud を離れるわけではありませんが、外部 IP アドレスを使用すると、インターネットからのトラフィックなど、外部トラフィックで使用されるパスの一部をパフォーマンス ダッシュボードに表示できます。

内部 IP アドレスのパケットロスは UDP パケットを使用して測定され、外部 IP アドレスのパケットロスは TCP パケットを使用して測定されます。

指標の可用性と信頼レベル

パフォーマンス ダッシュボードは、ネットワーク内のすべての VM 間のペアのサブセットをプローブします。収集されたデータは、発生する可能性のあるパケットロスを推測するために使用されます。データにおける Google の信頼度はプローブ率に依存し、プローブ率は各ゾーンにある VM の数と VM がデプロイされているゾーンの数によって異なります。たとえば、10 個の VM を 2 つのゾーンに配置すると、10 個の VM を 10 個のゾーンに配置する場合よりも信頼度が高くなります。

Google Kubernetes Engine(GKE)によって作成されたものも含めて、すべての VM は、VM の総数に含まれます。

次の表に、さまざまなレベルの信頼度を示します。ヒートマップでは、より低いレベルの信頼度がアスタリスク(*)や N/A でフラグ設定されます。

レベル 各ゾーンに必要な VM の数 パフォーマンス ダッシュボードのヒートマップに表示される内容
95% の信頼度 プロジェクト内のゾーン数の 10 倍の数の VMたとえば、プロジェクト内に 12 個のゾーンがある場合、各ゾーンに 120 個の VM が必要です。 追加表記のない測定結果
90% の信頼度 プロジェクト内のゾーン数に対して 2.5 倍の数の VMたとえば、プロジェクト内に 12 個のゾーンがある場合、各ゾーンに 30 個の VM が必要です。 追加表記のない測定結果
信頼度が低い アスタリスクの付いた測定結果
プローブ数が少ないため、意味のあるデータを導出できない N/A

Google Cloud のパケットロス指標は常に利用できます。アスタリスク(*)は、1 分あたり 400 件未満のプローブが存在する場合に表示されます。

プロジェクト固有のレイテンシ

レイテンシ指標は、次の対象間におけるユーザー トラフィックを使用して測定されます。

  • 1 つの VPC ネットワーク内の VM
  • ピアリングされる VPC ネットワーク間の VM(ネットワークが同じプロジェクト内にある場合)
  • VM とインターネット エンドポイント

また、共有 VPC ネットワーク内のサービス プロジェクトのパフォーマンス ダッシュボードには、サービス プロジェクト内のゾーンのみのデータが表示されます。たとえば、ゾーン A の VM とサービス プロジェクト A がホスト プロジェクトを使用して、ゾーン B とサービス プロジェクト B の VM と通信するとします。トラフィックに関する測定は、サービス プロジェクトにもホスト プロジェクトにも使用できません。

Google Cloud レイテンシ

レイテンシ指標は、次の対象間における実際のユーザー トラフィックを使用して測定されます。

  • 1 つの VPC ネットワーク内の VM
  • ピアリングされた VPC ネットワーク間の VM
  • VM とインターネット エンドポイント

プロジェクトと Google Cloud のレイテンシの測定方法

レイテンシは、TCP パケットを使用して測定されます。

実際のトラフィックのサンプルに基づいて、TCP シーケンス番号(SEQ)を送信してから、対応する ACK を受信するまでの経過時間でレイテンシが測定され、これにはネットワーク RTT と TCP スタック関連の遅延が含まれます。ダッシュボードでは、関連するすべての測定結果の中央値でレイテンシが表示されます。

レイテンシ指標は、VPC フローログと同じデータソースとサンプリング手法に基づいています。

プロジェクト固有のレイテンシは、プロジェクトのサンプルに基づいています。Google Cloud のレイテンシは、Google Cloud 全体からのサンプルに基づいています。

グローバル レイテンシ指標は、Google Cloud からインターネット エンドポイントへのアクティブなプローブではなく、TCP トラフィック ヘッダーのパッシブ サンプリングから導き出されます。

レイテンシ指標の異常

レイテンシ指標に関する次のような異常に注意してください。

  • 低レート環境の場合、Network Intelligence Center は 60 秒のプローブを使用してレイテンシ指標を測定します。そのため、TCP ベースのサービスから返されるアプリケーション レベルのレスポンスに遅延が発生している場合、パケット サンプリングに基づく RTT 指標は、高いレイテンシ レベルを誤って示すことがあります。RTT 値の大きさが不正確であると判断するには、通常はこれらがアプリケーション レベルでの遅延と関連しているかどうかを確認します。

    TCP ベースのサービスが ACK で迅速に応答した場合でも、サンプリングにおいて ACK が見逃され、後続のデータ レスポンスがかなり前の SEND に対する終了 ACK として判定されると、RTT の測定全体に歪みが生じます。この場合、RTT 指標は無視してかまいません。

  • プロジェクト固有のレイテンシ データが、グローバル レイテンシ データと一致していないことがあります。この不整合は、グローバル データセットに他のネットワーク パスも組み込まれており、そのレイテンシが特定のプロジェクトによって使用されるネットワーク パスからのレイテンシと比べて大幅に異なっている場合に発生することがあります。

指標の可用性

Google Cloud のレイテンシ指標は、常に利用できます。プロジェクトごとのレイテンシ指標は、TCP トラフィックが 1 分あたり約 1,000 パケット以上の場合にのみ利用できます。

指標の集計表

次の表は、パケットロスとレイテンシの指標を報告するために使用されるプローブ手法とプロトコルをまとめたものです。

パケットロス レイテンシ
プロービング方法 アクティブ プロービング(合成した VM トラフィック) パッシブ プロービング(実際の VM トラフィック)
プロトコル UDP(内部 IP アドレス)、TCP(外部 IP アドレス) TCP(内部 / 外部 IP アドレス)

レイテンシ ビュー

レイテンシの詳細: インターネットから Google Cloud へのトラフィック タイプには、テーブルビュー、マップビュー、タイムライン ビューの 3 つのビューがあります。

テーブルビュー

テーブルビューには、選択した地理的エリアと、プロジェクト内の VM インスタンスを含むリージョン間の RTT の中央値が表示されます。テーブルには次の情報が表示されます。

  • 国: 国の名前。
  • 都市: 都市の数。特定の都市のレイテンシの詳細は、国の詳細グラフで確認できます。
  • 宛先リージョン: 特定の国のユーザーについてトラフィックがある宛先リージョンの数。
  • 中央値のレイテンシ: 国とリージョン間の RTT 中央値(ミリ秒)

地図表示

地図表示には、地理的位置(大都市圏や都市)と Google Cloud リージョンが表示されます。

  • 特定のロケーションと Google Cloud リージョンのレイテンシの中央値を確認できます。
  • Google Cloud リージョンを選択して、選択したリージョンへのトラフィックがあるロケーションを表示できます。
  • サイドバーのレイテンシ グラフで、ロケーション固有の詳細を表示できます。
  • 地図上の検索ボックスを使用して場所を検索できます。
  • 各地点は、地図上でレイテンシの中央値の範囲を示すため、異なる濃い青色で色分けされています。次の画像では、世界地図上の特定の都市を示す円の色は青系統の色合いになります。青色が濃いほど、その都市の特定の Google Cloud リージョンからのレイテンシが高くなります。

    地図上のレイテンシの中央値の範囲。
    地図上のレイテンシの中央値の範囲(クリックして拡大)

タイムライン ビュー

タイムライン ビューには、選択した地理的領域と Google Cloud リージョン間の RTT の中央値が表示されます。現在のレイテンシの指標と 6 週間分の履歴データが表示されます。フィルタを使用して、トラフィックを都市、地域、国レベルでさらに集計できます。特定の地理的場所の位置情報ペアに対応するレイテンシの指標は、そのペアに十分な Google Cloud トラフィックがある場合にのみ表示できます。

権限

Google Cloud コンソールまたは Monitoring からパフォーマンス ダッシュボードのデータにアクセスするには、monitoring.timeSeries.list 権限を付与されている必要があります。この権限は、次の表の Monitoring のロールに含まれています。

ロール名 ロール ID
モニタリング閲覧者 roles/monitoring.viewer
モニタリング編集者 roles/monitoring.editor
モニタリング管理者 roles/monitoring.admin

monitoring.timeSeries.list 権限を含むその他のロールについては、ロールについてをご覧ください。

プロジェクトのスコープを変更する

既存の指標スコープを使用して、複数の Google Cloud プロジェクトを 1 つのビューでモニタリングするには、Google Cloud コンソールのプロジェクト選択ツールまたは [スコープを変更] ボタンを使用して、スコープ対象プロジェクトを選択します。これらのオプションを使用して、単一のモニタリング プロジェクトを選択することもできます。詳細については、パフォーマンス ダッシュボードの指標のリファレンスをご覧ください。

事前定義された条件に基づいて、高パケットロスのアラートを作成できます。パケットロスのアラート ポリシーは、リージョンペアで 5 分間のパケットロスが 5% を超えるとトリガーされます。

アラートによって、クラウド アプリケーションの問題をタイムリーに認識し、問題をすばやく解決できます。アラート ポリシーにアラートを受け取る状況と通知方法を記述します。アラート ポリシーの作成と管理の詳細については、アラートの概要をご覧ください。

次のステップ