Kubernetes クラスタの観察

Stackdriver で、単一のダッシュボードを使用して、Google Kubernetes Engine クラスタやアプリケーション コンテナのモニタリング情報とログ情報を探索できます。

使ってみる

  1. GCP Console で、[Stackdriver] > [Monitoring] の順に選択し、Stackdriver Monitoring のホームページに移動します。次のボタンをクリックすると移動できます。

    Stackdriver Monitoring Console に移動

  2. 使用している Google Kubernetes Engine クラスタを含むワークスペースを選択します。

    • ほとんどの場合、Google Kubernetes Engine クラスタを含む Google Cloud Platform プロジェクトがワークスペースになります。
    • ワークスペースの作成を求めるプロンプトが表示されることがあります。また、アカウントのリストに必要な GCP プロジェクトが表示されないことがあります。このような場合は、GCP プロジェクトに新しいワークスペースを作成する必要があります。詳細については、Stackdriver アカウントを作成するをご覧ください。
    • 同じダッシュボードで複数のプロジェクトのクラスタをモニタリングするには、GCP プロジェクトとは異なるワークスペースを作成する必要があります。詳細については、複数のプロジェクトをモニタリングするをご覧ください。
  3. Kubernetes Monitoring Console に移動します。

    1. 従来の Stackdriver を使用している場合は、[Resources] > [Kubernetes Engine] の順に選択します。

    2. Stackdriver Kubernetes Engine Monitoring を使用している場合は、[Resources] > [Kubernetes Engine NEW] の順に選択します。

      このメニュー項目が表示されるのは、Stackdriver を使用したクラスタが存在する場合だけです。

    Stackdriver Kubernetes Monitoring Console に移動

    このコンソールには、Stackdriver Kubernetes Monitoring を使用するクラスタのみが表示されます。クラスタが表示されない場合や、クラスタ内のすべてのリソースが表示されない場合は、このページのトラブルシューティングをご覧ください。

Stackdriver Kubernetes Engine Monitoring ダッシュボード インターフェース

Stackdriver Kubernetes Engine Monitoring ダッシュボードは、次のスクリーンショットの赤い数字で示されているように、いくつかの部分に分かれています。

Kubernetes の表形式ビュー

  1. ダッシュボード ツールバーには、ダッシュボードの設定、フィルタリング、およびその下に表示されているタイムラインのコントロールがあります。

  2. タイムライン イベント セレクタを使用すると、タイムライン上にカーソルを合わせて、アラート違反の概要を表示できます。後述のタイムライン イベントをご覧ください。

  3. 詳細には、[Infrastructure]、[Workloads]、[Services] の 3 つの表示タブがあります。これらの表示タブについては、以下の表示タブで説明します。

表示タブ

ダッシュボードには複数の表示タブがあり、クラスタ情報をさまざまな方法で編成できます。次の表示タブがあります。

  • Infrastructure。Kubernetes リソースを [Cluster] > [Node] > [Pod] > [Container] の階層別に集約します。

  • Workloads。Kubernetes リソースを [Cluster] > [Namespace] > [Workload] > [Pod] > [Container] の階層別に集約します。

  • サービス。Kubernetes リソースを [Cluster] > [Namespace] > [Service] > [Pod] > [Container] の階層別に集約します。

表示モードは、詳細セクションの上にあるタブから選択できます。

Kubernetes イベントの詳細

この表では、対応待ちのインシデントがある Kubernetes リソースが最初に表示されるように並べ替えられています。各 Kubernetes リソースの前にある展開矢印(▸)をクリックすると、そのリソースのすべてのサブコンポーネントが表示されます。次のスクリーンショットは、Kubernetes リソースの展開された階層を示しています。

Kubernetes イベントの詳細

各リソース名の前にはインジケータがあり、そのインジケータが赤色の場合は、そのリソースまたは階層内の下位のリソースでインシデントが発生していることを示します。アラートの詳細を表示するには、[Name] をクリックします。詳細については、後述のアラートの詳細をご覧ください。

列の定義

3 つのタブで表示される列の説明を次に示します。表示される値は、選択した期間に基づいています。

  • Name: ユーザーが Kubernetes リソースに割り当てたラベル。
  • Resource Type: この値は、ClusterContainerNamespaceNodePodWorkspace になります。
  • Ready: 使用可能なノード インスタンスの数。
  • Incidents: アラート違反の数。
  • CPU Utilization: リクエストされた CPU リソースと比較した使用率。
  • Memory Utilization: リクエストされたメモリの使用率(パーセント)。
  • Total Memory Usage: 割り当てられているメモリの量。

アラートの詳細

Kubernetes Monitoring ダッシュボードには、デフォルトでは各 Kubernetes リソースの要約行が表示されます。リソースの詳細を表示するには、Kubernetes リソースの前にある展開矢印(▸)をクリックします。

エントリの前にある赤色または緑色のボタンをクリックすると、アラートの詳細を示すパネルが表示されます。

Kubernetes イベントの詳細

この詳細ビューでは、インシデント、システム指標、ログが 1 つのビューに集約されています。

タイムライン イベント

ダッシュボードの上部にあるタイムライン イベント セレクタから、アラート詳細パネルにアクセスすることもできます。インシデントのタイムラインには、選択した期間内に発生したアラート違反が表示されます。タイムラインの赤い領域にカーソルを置くと、次のようにイベントカードが表示されます。

Kubernetes タイムライン ビュー

イベントカードでは、タイムラインに表示されている各インシデントの詳細情報が提供されます。個々のイベントカードをクリックすると、そのインシデントのアラートの詳細が新しいパネルに表示されます。

バブルチャート

Kubernetes Monitoring ダッシュボードでは、指標の傾向とパターンをバブルで表現できます。また、クラスタ内のノードの正常性を一目で確認できます。

バブルチャートの例

グラフを表示する場合は、次の点に注意してください。

  • 各バブルはノードを表します。サイズ(プロットサイズ)はノード内のポッドの数を表します。

  • 灰色のプロットは正常なノードを表します。赤いプロットは、対応待ちのインシデントのあるノードを表します。

  • ベータ版リリースでは、グラフの軸に CPU 使用率メモリ使用量を選択できます。ノードが GPU を使用している場合は、GPU 使用率を選択することもできます。

トラブルシューティング

ダッシュボードに Kubernetes リソースが表示されない場合は、以下の点を確認します。

  • 正しい GCP プロジェクトがページの上部で選択されているかどうか。 選択されていない場合は、ページの上部にあるプルダウン メニューを使用してプロジェクトを選択します。データを表示するプロジェクトを選択する必要があります。

  • プロジェクトにアクティビティがあるかどうか。 クラスタを作成したばかりの場合は、データが入力されるまで数分間かかります。詳細については、Stackdriver サポートのインストールをご覧ください。

  • 期間が短すぎるかどうか。 ページの上部にあるダッシュボード ツールバーの [Time] メニューを使用して、他の期間を選択するか、またはカスタム範囲を定義できます。

  • ダッシュボードの表示に必要な権限があるかどうか。 サービスのデプロイメントの詳細または GCP プロジェクトの指標を表示するときに、次のいずれかのアクセス拒否エラー メッセージが表示された場合は、Cloud Identity and Access Management 役割を更新し、roles/monitoring.viewer または roles/viewer を含める必要があります。

    • You do not have sufficient permissions to view this page
    • You don't have permissions to perform the action on the selected resources

    詳しくは、事前定義の役割をご覧ください。

  • クラスタのサービス アカウントに Stackdriver へのデータ書き込み権限があるかどうか。 API ダッシュボードでエラー率が高い場合は、サービス アカウントに次の役割がない可能性があります。

    • metricWriter
    • logWriter
    • Stackdriver リソース メタデータ書き込み
このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

ご不明な点がありましたら、Google のサポートページをご覧ください。