パフォーマンス ダッシュボードの概要

パフォーマンス ダッシュボードを使用すると、Virtual Private Cloud(VPC)ネットワークのパフォーマンスを可視化できます。これは、VM が存在するゾーン間でのパケットロス(可用性)とレイテンシ(往復時間⦅RTT⦆)の指標を提供します。Performance Dashboard は、ゾーン間の集約された VM から VM へのパケットロスとレイテンシ(RTT)を一目で把握できる概要グラフとヒートマップの表示を提供します。過去 6 週間のデータの履歴を表示できます。Cloud Monitoring を使用してこれらの指標を照会することもできます。

これらのネットワーク パフォーマンス モニタリング機能を使用することで、アプリケーションの問題と基盤となる Google Cloud ネットワークの問題をすばやく見分け、ネットワーク パフォーマンスの過去の問題を簡単にデバッグすることが可能になります。

指標

Performance Dashboard には、パケットロス指標とレイテンシ指標の 2 種類の指標があります。どちらも指標も、内部 IP アドレスと外部 IP アドレスの両方について測定されます。内部 IP アドレスのパケットロスは UDP パケットを使用して測定され、外部 IP アドレスのパケットロスは TCP パケットを使用して測定されます。レイテンシ指標はすべて TCP ベースです。

VM があるプロジェクトのすべてのゾーンについて、Performance Dashboard の指標が自動的に収集されます。Performance Dashboard では、プローバーの手動でのセットアップや手動でのインストールは必要ありません。ただし、パケットロスの指標を取得するにはプロジェクトに十分な VM が必要であり、レイテンシの指標を取得するには十分なトラフィックが必要です。

GKE によって作成されたものを含むすべての VM は、プロジェクト内の VM の総数にカウントされます。

パケットロスの指標

特定の Virtual Private Cloud ネットワーク内の VM 間のアクティブなプローブの結果を表示します。Performance Dashboard は、VM を格納する物理ホスト上でワーカーを実行します。これらのワーカーは、トラフィックと同じネットワーク上で実行されるプローブ パケットを挿入や受信を行い、そのネットワーク上の問題を明らかにします。ワーカーは VM ではなく物理ホストで実行されるため、これらのワーカーは VM リソースを消費せず、トラフィックは VM に表示されません。パケットロスは、すべてのゾーンペアで集計されます。

プローブの数に応じて、パケットロスの測定には 3 段階の信頼性があります。プローブの数は VM の数に比例します。1 分間に十分な数のプローブの条件が満たされている場合、表示される値の信頼度は 90% 以上です。1 分あたりのプローブ数が 90% の信頼性には不十分でも、最小値を超えている場合、ヒートマップでは値の横にアスタリスク(*)が表示されます。プローブの最小数に満たない場合、ヒートマップには NA が表示されます。

同じネットワークで発生する可能性のあるパケットロスを推定するために、ネットワークのサブセットのプローブによってパケットロスが測定されます。プローブ率はゾーンごとの VM の数に依存し、データに対する信頼度はプローブ率に依存します。Performance Dashboard データの信頼性を 95% の信頼性(エラーのある可能性が最大 5%)にするには、プロジェクト内のゾーン数の 10 倍の数のVMが各プロジェクト内に必要です。(プロジェクトに 12 のゾーンがある場合、パケットロス指標の信頼性を 90% にするには、各ゾーンに 120 の VM が必要です。)90% の信頼性を得るのに必要なゾーン数は、プロジェクト内で実行されている VM の数の2.5 倍で十分です。(12 ゾーンの場合、各ゾーンに 30 の VM が必要です。)プローブ数が少ないために信頼性が低い場合、 Performance Dashboardに「*」が表示されます。プローブが少なすぎて信頼性がない場合は、NA が表示されます。

共有 VPC を使用する 2 つのプロジェクト間のパケットロスは、エクスポート先のサービス プロジェクトに対して測定されます。

プローブは、互いに通信できる VM のメッシュ全体をカバーします。これは、必ずしもトラフィック パターンと同じではありません。したがって、ダッシュボードにはパケットロスの兆候が表示されることがありますが、アプリケーションにパケットロスの証拠は表れません。

レイテンシの指標

実際の TCP VM トラフィックのサンプルに基づくと、この指標はVPC フローログで使用されるサンプリング方法と同じです。レイテンシは、TCP シーケンス番号(SEQ)を送信してから、対応する ACK を受信するまでの時間として計算され、ネットワークの RTT と TCP スタック関連の遅延が含まれます。UI では、関連するすべての測定結果の中央値としてレイテンシが表示されます。

レイテンシの指標は、TCP トラフィックが毎分約 1000 パケット以上の場合にのみ使用できます。

指標のサマリーテーブル

この表は、パケットロスとレイテンシの指標のレポートに使用されるプローブ方法とプロトコルをまとめたものです。

パケットロス レイテンシ
調査方法 アクティブ ブロービング(合成した VM トラフィック) パッシブ プロービング(実際の VM トラフィック)
プロトコル UDP(内部 IP)、TCP(外部 IP) TCP(内部 / 外部 IP)

使用例

現在のパフォーマンスの診断: ネットワークですか、アプリケーションですか?

Performance Dashboard を使用すると、VPC ネットワークのパフォーマンスをリアルタイムで確認でき、アプリケーションの問題の原因がソフトウェアの問題とネットワークの問題のどちらなのかを判断するのに役立ちます。大幅なパケットロスまたは高いレイテンシが見られる場合は、Google Cloud ネットワークの問題が少なくとも原因の一部となっている可能性があります。パケットロスとレイテンシの様子が正常な場合には、アプリケーションに問題がある可能性があります。

現在起こっている問題を調査する

シナリオ: Performance Dashboard を開いてみると、過去 1 時間以内のパケットロスの概要のグラフに大きな急上昇が見られました。このグラフはすべてのゾーンでのパケットロスの概要を示しているため、パケット損失が発生した場所はまだわかりません。

最新のパケットロス(クリックして拡大)
最新のパケットロス(クリックして拡大)

さらに調査するには、急増が発生した時間をクリックしてゾーンペアのヒートマップを表示します。サマリー チャートの時間軸のセレクタをドラッグすると、表示する時刻を正確に調整できます。

時間をクリックすると、その時間の詳細が表示されます(クリックして拡大)
時間をクリックすると、その時間の詳細が表示されます(クリックして拡大)

ヒートマップには、サマリー チャートで選択した時間のデータが表示されます。ヒートマップの四角は、ヒートマップの左側に表示される凡例に基づいて色分けされています。各色はそれぞれ、あるゾーンから別のゾーンへのパケットロスの割合を反映しています。

特定の時間におけるパケットロスのヒートマップ(クリックして拡大)
特定の時間におけるパケット損失のヒートマップ(クリックして拡大)

パケットロスは各ルートで測定されるため、パケットロスを示す四角は、ソース軸で示されるゾーンから宛先軸で示されるゾーンへのパケットロスを示します。ヒートマップのぞれぞれの四角には、パケットロスのパーセント値も表示されます。

ソースゾーン us-central1-a から宛先ゾーン us-east1-b の紫色の四角をクリックして、そのゾーンペアに特化したグラフを表示します。詳細なグラフでは、前のページからの時間選択が保持され、青いピンが表示されます。

選択した期間のパケットロス(クリックして拡大)
選択した期間のパケットロス(クリックして拡大)

グラフには、データフローの各方向に 1 つずつ、合計 2 本の線が表示されます。この例では、紫色の線はソースゾーン us-central1-a から宛先ゾーン us-east1-b へのトラフィックのパケットロスを示しています。赤い線はしの逆方向、ソース zone us-east1-b から宛先ゾーン us-central1-a を示しています。

グラフは、このパケットロスの急上昇が異常な値であることを示しています。必要に応じて、右上の時間セレクタをクリックして、このゾーンペアに表示されるデータの時間枠を変更できます。最大 6 週間のデータを表示できます。この例では、[7 日]をクリックして、選択したゾーンペアのパケットロスの傾向を確認します。

7 日間のパケットロス(クリックして拡大)
7 日間のパケットロス(クリックして拡大)

過去のパフォーマンスの診断

最近の問題を調査する

今週初めに発生したレイテンシの問題を調査するとします。Performance Dashboard のパフォーマンスの履歴データを使用して、問題のゾーンを調べます。

ビューを変更するには、[レイテンシ]タブをクリックします。 

レイテンシタブ(クリックして拡大)
レイテンシタブ(クリックして拡大)

右上の時間セレクタを使用して、レイテンシの概要チャートの時間軸を調整します。この例では、1 時間に設定されています。チャートの時間軸で時間をクリックすると、その時間のレイテンシのヒートマップが表示されます。

時間の選択(クリックして拡大)
時間の選択(クリックして拡大)

グラフの左側には常に高い値があるため、時間軸をクリックして、その時間のレイテンシのヒートマップを表示します。

レイテンシ ヒートマップ(クリックして拡大)
レイテンシ ヒートマップ(クリックして拡大)

ヒートマップは、ゾーンasia-east1-beurope-west2-cの間のレイテンシが 261 ミリ秒(明るい紫色の四角)であることを示しています。さらに調査するには、明るい紫色の四角をクリックします。表示されるレイテンシの詳細なチャートでは、前のページからの時間選択が維持され、青いピンが表示されています。

レイテンシの急上昇(クリックして拡大)
レイテンシの急上昇(クリックして拡大)

青い線は、europe-west2-c から asia-east1-b に移動するトラフィックのレイテンシの急上昇を示しています。

急上昇を拡大するには、マウスをクリックしてドラッグします。

ズームするには、クリック&ドラッグします(クリックして拡大)
クリック&ドラッグするとズームします(クリックして拡大します)

急上昇が 2〜3 分間続いて、午前 8 時 19 分にピークに達したことがわかります。

レイテンシ急上昇の詳細(クリックして拡大)
レイテンシ急上昇の詳細(クリックして拡大)

履歴データを表示するときのデータの視覚化

1 日以上の期間のデータを表示する場合、グラフでは、プライマリ データの周りに明るい色(ハロー)の追加データが表示されます。期間が長いため、データはより長い間隔で集計されます。たとえば、1 時間のデータは 1 分間隔で集計され、24 時間のデータは 5 分間隔で集計されます。線を囲む明るい色は、最初の線を描くために集計された値の範囲を示します(最低から最高まで)。

過去の集計データ(クリックして拡大)
過去の集計データ(クリックして拡大)

次のステップ