觀察 Kubernetes 叢集

Stackdriver 可以讓您使用單一資訊主頁,在 Google Kubernetes Engine 叢集與應用程式容器中探索監控與記錄資訊。

入門指南

  1. 從 GCP 主控台依序選取「Stackdriver」>「Monitoring」(監控) 以前往 Stackdriver Monitoring 首頁。您可以點選以下按鈕前往主控台:

    前往 Stackdriver Monitoring 主控台

  2. 選取包含 Google Kubernetes Engine 叢集的工作區

    • 在大多數情況下,Workspace 是包含 Google Kubernetes Engine 叢集的 Google Cloud Platform 專案。
    • 系統可能會提示您建立工作區,否則您可能無法在帳戶清單中看到 GCP 專案。在這些情況下,您應使用 GCP 專案建立新工作區。詳情請參閱建立 Stackdriver 帳戶一文。
    • 如要在相同資訊主頁上監控多個專案的叢集,您必須建立與 GCP 專案不同的工作區。詳情請參閱監控多個專案
  3. 瀏覽至 Kubernetes 監控主控台:

    1. 如果您使用的是舊版 Stackdriver,請依序選取 [Resources] (資源) > [Kubernetes Engine]

    2. 如果您使用的是 Stackdriver Kubernetes Engine Monitoring,請依序選取 [Resources] (資源) > [Kubernetes Engine NEW] (Kubernetes Engine (新版))

      只有在您具有使用 Stackdriver 的叢集時,才會看到這些選單項目。

    前往 Stackdriver Kubernetes Monitoring 主控台

    這個主控台只會顯示使用 Stackdriver Kubernetes Monitoring 的叢集。如果您沒有看見任何叢集,或者沒有看見叢集中的所有資源,請參閱本頁面中的疑難排解一節。

Stackdriver Kubernetes Engine Monitoring 資訊主頁介面

Stackdriver Kubernetes Engine Monitoring 資訊主頁分成幾個部分,如以下螢幕擷圖中的紅色數字所指示:

Kubernetes 表格檢視

  1. 「資訊主頁工具列」透過下方的時間軸提供資訊主頁設定、篩選與控管功能。

  2. 「時間軸事件選取器」可以讓您將滑鼠游標懸停在時間軸上,以顯示快訊違規情況的匯總。請參閱下方的時間軸事件一節。

  3. 「詳細資料」區段可以讓您從三個檢視分頁中選擇其中一個分頁:「Infrastructure」(基礎架構)、「Workloads」(工作負載) 和「Services」(服務)。我們會在下方的檢視分頁一節討論這些檢視分頁。

檢視分頁

資訊主頁提供多個檢視分頁,其可透過不同的方式整理您的叢集資訊。可能的檢視分頁如下:

  • 「基礎架構」(Infrastructure)。點選以下階層匯總 Kubernetes 資源:「Cluster」(叢集) >「Node」(節點) >「Pod」>「Container」(容器)

  • 「工作負載」(Workloads)。點選以下階層匯總 Kubernetes 資源:「Cluster」(叢集) >「Namespace」(命名空間) >「Workload」(工作負載) >「Pod」>「Container」(容器)

  • 「Services」(服務)。點選以下階層匯總 Kubernetes 資源:「Cluster」(叢集) >「Namespace」(命名空間) >「Service」(服務) >「Pod」>「Container」(容器)

您可從詳細資料區段上方的分頁中選取檢視模式:

Kubernetes 事件詳細資料

表格經過排序,會先顯示具有開啟事件的 Kubernetes 資源。您可以按一下每個 Kubernetes 資源前方的展開箭頭 (▸),查看資源的任何子元件。以下螢幕擷取畫面顯示了 Kubernetes 資源的展開階層:

Kubernetes 事件詳細資料

每個資源名稱前面都有一個指標,如果指標是紅色的,即表示事件在該資源中發生,或在階層中較低的資源中發生。如要查看快訊詳細資料,請按一下 [名稱]。詳情請參閱以下的快訊詳細資料部分。

欄定義

以下說明顯示在三個分頁中的欄。顯示的值以所選時間範圍為基礎:

  • 「Name」(名稱):您指派給 Kubernetes 資源的標籤。
  • 「Resource Type」(資源類型):可能的值有「Cluster」(叢集)、「Container」(容器)、「Namespace」(命名空間)、「Node」(節點)、「Pod」與「Workspace」(工作區)
  • 「Ready」(已就緒):可用節點執行個體數。
  • 「Incidents」(事件):快訊違規數。
  • 「CPU Utilization」(CPU 使用率):相較於已要求 CPU 資源的使用率百分比。
  • 「Memory Utilization」(記憶體使用率):已要求記憶體的使用率百分比。
  • 「Total Memory Usage」(總記憶體使用率):分配的記憶體量。

快訊詳細資料

預設情況下,Kubernetes Monitoring 資訊主頁為每個 Kubernetes 資源都顯示了一個匯總行。如要查看資源的詳細資料,請按一下 Kubernetes 資源前方的展開箭頭 (▸)。

如果您按一下項目前方的紅色或綠色按鈕,就會顯示含有快訊詳細資料的面板:

Kubernetes 事件詳細資料

此詳細資料檢視在一個檢視內匯總了事件、系統指標與記錄。

時間軸事件

您也可從資訊主頁頂端的時間軸事件選取器存取快訊詳細資料面板。事件的時間軸可以讓您查看在所選時間範圍內發生的快訊違規情況。如果您將游標懸停在時間軸上的紅色區域,就會顯示事件卡:

Kubernetes 時間軸視圖

事件卡提供了有關在時間軸中顯示的每個事件的詳細資訊。如果您按一下個別事件卡,您會在新面板中看見事件的快訊詳細資料。

泡泡圖

Kubernetes Monitoring 資訊主頁提供以泡泡呈現的視覺化效果,讓您可以探索出現在指標中的趨勢和模式,此外也提供叢集裡關於節點的健康資訊概覽。

泡泡圖範例

查看圖表時,請注意下列資訊:

  • 每個泡泡代表一個節點;節點大小,即泡泡繪製的大小,則代表節點中的 pod 數量。

  • 灰色泡泡代表健康的節點,紅色泡泡表示節點中有開啟的事件。

  • 在 Beta 版中,您可以選取 CPU 用量記憶體用量做為圖表的軸。如果節點使用的是 GPU,您也可以選取 GPU 用量

疑難排解

如果您沒有在資訊主頁中看見任何 Kubernetes 資源,請確認以下幾點:

  • 是否在頁面頂端選取了正確的 GCP 專案? 如否,請使用頁面頂端的下拉式選單選取專案。您必須選取您要查看其資料的專案。

  • 您的專案是否有任何活動? 如果您剛剛建立叢集,請等待幾分鐘,讓其填入資料。詳情請參閱安裝 Stackdriver 支援

  • 時間範圍是否太小? 您可以使用頁面頂端資訊主頁工具列中的「Time」(時間) 選單來選取其他時間範圍,或定義「Custom」(自訂) 範圍。

  • 您是否有查看資訊主頁的適當權限? 如果您在查看服務的部署詳細資料或 GCP 專案指標時,看到下列其中一個權限遭拒的錯誤訊息,則需要更新 Cloud Identity and Access Management 角色,以便納入 roles/monitoring.viewerroles/viewer

    • You do not have sufficient permissions to view this page
    • You don't have permissions to perform the action on the selected resources

    詳情請參閱預先定義的角色

  • 您的叢集服務帳戶是否具備將資料寫入 Stackdriver 的權限? 如果 API 資料主頁中呈現的錯誤率較高,則表示您的服務帳戶可能缺少以下角色:

    • metricWriter
    • logWriter
    • Stackdriver 資源中繼資料寫入者
本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Stackdriver Monitoring
需要協助嗎?請前往我們的支援網頁