GKE クラスタの観察

このページでは、Kubernetes Engine Operations ダッシュボードと従来の Logging Monitoring のモニタリング ダッシュボードへのアクセス方法、および Kubernetes Engine Operations のモニタリング ダッシュボードの使用方法について説明します。

モニタリング ダッシュボードへのアクセス

  1. Cloud Console から、[モニタリング] に移動します。

    [モニタリング] に移動

    Google Cloud プロジェクトがすでにワークスペースと関連付けられている場合は、Cloud Monitoring のホームページが表示されます。それ以外の場合は、ワークスペースが自動的に作成されます。通常、お客様による操作は必要ありませんが、完了までに数分かかる場合があります。[Add your project to a Workspace] ダイアログが表示される場合があります。この場合、新しいワークスペースを作成することが最も簡単な操作です。

  2. [ダッシュボード] を選択します。

    • クラスタで Kubernetes Engine Operations を使用している場合は、[Kubernetes Engine New] というダッシュボードを選択します。

    • クラスタで従来の Logging と Monitoring を使用している場合は、[Kubernetes Engine] というダッシュボードを選択します。

      クラスタが表示されない場合や、クラスタ内のすべてのリソースが表示されない場合は、GKE ダッシュボードのトラブルシューティングをご覧ください。

指標の表示

Kubernetes Engine Operations で構成されたクラスタでは、次のモニタリング対象リソースタイプを使用できます。

たとえば、Metrics Explorer を使用して Kubernetes Engine Operations で構成されたクラスタの CPU 使用率のグラフを作成するには、次のようにします。

  1. Google Cloud Console で [Monitoring] を選択するか、次のボタンを使用します。
    [Monitoring] に移動
  2. [Monitoring] のナビゲーション パネルで、 [Metrics Explorer] をクリックします。
  3. [指標] タブが選択されていることを確認します。
  4. [Find resource type and metric] のボックスをクリックして、リソースと指標をメニューから選択するか、リソースと指標の名前を入力します。次の情報を使用して、このテキスト ボックスのフィールドに入力します。
    1. [Resource] には [Kubernetes Container] を選択または入力します。
    2. [Metric] には [CPU usage time] を選択または入力します。
    フィルタとして表示された場合、次の記述に対応します: metric.type="kubernetes.io/container/cpu/core_usage_time" resource.type="k8s_container"

  5. [Filter]、[Group By]、[Aggregation] の各メニューを使用して、データの表示方法を変更します。名前空間別にデータを表示するには、[Group By] で [namespace_name] を選択します。この選択により、集計が自動的に更新されます。これにより、複数の時系列の組み合わせが決まります。詳しくは、指標の選択をご覧ください。

Kubernetes Engine Operations のダッシュボード インターフェース

Kubernetes Engine Operations のダッシュボードは、次の 3 つの部分に分かれています。

Kubernetes Engine Operations ダッシュボードの表形式ビューを表示します。

  1. ダッシュボードのツールバーでは、観測の時間枠をコントロールでき、ダッシュボードの設定やフィルタを提供します。

  2. タイムライン イベント セレクタを使用すると、特定の時刻の選択やアラートの概要の表示ができます。詳細については、タイムライン イベントのセクションをご覧ください。

  3. 詳細セクションでは、クラスタ情報の表示方法を選択できます。次のセクションでは、選択する情報の表示方法について詳しく説明します。

表示タブ

Kubernetes Engine Operations ダッシュボードの表示タブでは、クラスタ情報をさまざまな階層で編成できます。

  • インフラストラクチャ: リソースをクラスタノードポッドコンテナ別の順に集計します。

  • ワークロード: リソースをクラスタ名前空間ワークロードポッドコンテナ別の順に集計します。

  • サービス: リソースをクラスタ名前空間サービスポッドコンテナの順に集計します。

Kubernetes Engine Operations の表示モードを選択します。

このテーブルでは、対応待ちのインシデントがあるリソースが最初に表示されるように並べ替えられています。リソースのサブコンポーネントを表示するには、そのリソースの を展開します。次のスクリーンショットは、Kubernetes リソースの展開された階層を示しています。

Kubernetes リソースの展開された階層の表示。

各リソース名の前には、赤または緑のインジケーターがあります。赤色のインジケーターは、リソースまたはリソースのサブコンポーネントに対応待ちのインシデントがあることを示します。緑色のインジケーターは、対応待ちのインシデントがないことを示します。リソースのアラートの詳細、指標、ログを表示するには、その行をクリックします。詳細については、アラート、指標、ログ、詳細の表示のセクションをご覧ください。

列の定義

Kubernetes Engine Operations ダッシュボードには、選択した期間に基づいて列にデータが表示されます。

  • 名前: ユーザーが Kubernetes リソースに割り当てたラベル。
  • Resource Type: この値は、ClusterContainerNamespaceNodePodWorkspace になります。
  • Ready: 指定したエンティティで集計された実行中の Pod の数。チェックマークは、エンティティに少なくとも 1 つの Pod が用意され、実行中であることを示します。この Ready インジケーターは、GKE コンソールの Pod status とは異なります。Ready は、Pod がトラフィックを処理できる状態であることのみを示し、Pod statusPendingRunningCrashlooping などの他の状態を表示します。
  • Incidents: アラート違反の数。
  • CPU Utilization: リクエストされた CPU リソースと比較した使用率。
  • Memory Utilization: リクエストされたメモリの使用率(パーセント)。
  • Total Memory Usage: 割り当てられているメモリの量。

アラート、指標、ログ、詳細の表示

Kubernetes Engine Operations ダッシュボードには、デフォルトで各 Kubernetes リソースの概要行が表示されます。サブコンポーネントを持つ各リソースは、展開 ボタンでリスト表示され、すべてのリソースは赤または緑のインジケーターでリスト表示されます。赤色のインジケーターは、リソースまたはリソースのサブコンポーネントに対応待ちのインシデントがあることを示します。緑色のインジケータは、対応待ちのインシデントがないことを示します。

  • リソースのサブコンポーネントを表示するには、そのリソースの を展開します。
  • リソースのインシデント概要、システム指標、ログ、詳細を表示するペインを開くには、リソースの行をクリックします。行をクリックすると表示される情報は、リソースタイプによって異なります。たとえば、クラスタの行をクリックしても、指標やログ情報は表示されませんが、ポッドの行をクリックするとこの情報が表示されます。

    次の例では、ノードに対応待ちのインシデントはありません。

    Kubernetes アラート詳細の表示。

    Cloud Console の Kubernetes ページに移動するには、[Manage] をクリックします。

タイムライン イベント

Kubernetes Engine Operations ダッシュボードのタイムライン イベント セレクタからアラート詳細パネルにアクセスすることもできます。インシデントのタイムラインには、選択した期間内に発生したアラート違反が表示されます。タイムラインの赤い領域にポインタを置くと、次のようにイベントカードが表示されます。

Kubernetes アラートのタイムライン ビューの使用。

各イベントカードには、タイムラインに表示される 1 件のインシデントに関する詳細情報が表示されます。イベントのアラートの詳細を表示するには、イベントカードをクリックします。

トラブルシューティング

トラブルシューティング情報については、GKE ダッシュボードのトラブルシューティングをご覧ください。