Beta 版指南

Stackdriver Kubernetes Engine Monitoring 現已正式推出。雖然我們建議您升級至正式發行版 GKE 1.12.7 版,但您可以繼續使用 Stackdriver Kubernetes Engine Monitoring Beta 版。

本指南提供 Stackdriver Kubernetes Engine Monitoring Beta 版的詳細說明。

發行版本

由於 Stackdriver Kubernetes Engine Monitoring 的安裝現在由 GKE 代管,因此不會再記錄手動安裝。

以下列出 Stackdriver Kubernetes Engine Monitoring 的目前 Beta 版與更新,最終穩定 Beta 版列在最前面:

  • Beta 版更新 (Kubernetes 1.12.5):強烈建議所有使用者安裝此更新。如要升級為此版本,請前往:安裝 Kubernetes Monitoring

  • 其他支援的 Beta 版本 (Kubernetes 1.10.12 / 1.11.6 / 1.11.7 / 1.11.8):如要升級為以上任一版本,請參閱安裝 Kubernetes Monitoring

    升級為上述任一版本前,請務必查看這個頁面中的已知問題。

  • 原始 Beta 版 (Kubernetes 1.10.2):基於一些已知問題不建議為任何目的而安裝這個版本。

功能與已知問題

本節列出目前 Beta 版的已知問題。截至 2019 年 5 月 20 日為止,以下問題仍然存在:

Beta 版更新 1.12.6

  1. LogEntry 中繼資料標籤欄位有所變動

    將 Google Kubernetes Engine 叢集升級至 GKE 1.12.6 以上版本時,中繼資料標籤欄位會有所變動:

    • 目前位於 metadata.userLabels 欄位的 Kubernetes Pod 標籤會移至 LogEntry 的 labels 欄位,標籤鍵的前置字串為 k8s-pod/接收器記錄指標排除或查詢中的篩選器運算式可能必須變更。

    • 無法再使用 metadata.systemLabels 欄位中的 Stackdriver 系統標籤。

  2. 中繼資料代理程式會產生垃圾記錄檔

    中繼資料代理程式有一個已知錯誤,該錯誤會產生垃圾記錄檔,並顯示 400 Bad Request 錯誤。系統仍會正確收集所有中繼資料,且不會影響到功能。不過垃圾記錄檔會耗用非必要的記錄檔儲存空間,且可能會產生額外需計費的記錄檔。

    在我們修正這項錯誤前,請使用者不要升級為此版本。

    於 1.12.7-gke.10 已修正

Beta 版更新 1.11.6

如要升級為此版本,請參閱安裝 Kubernetes Monitoring

  • 包含 Stackdriver Kubernetes Engine Monitoring 表格 UI 的載入與顯示延遲的重大改進。
  • 修正 1.10.2 版的大多數已知問題。
  • 恢復針對 Stackdriver Kubernetes Engine Monitoring 安裝代管支援的能力。
  • 您可以使用 Stackdriver Kubernetes Engine Monitoring 升級現有叢集。
  • 免除在 GKE 上進行任何手動安裝的需求。
  1. Stackdriver 中繼資料代理程式重新啟動

    在 Beta 版中,正常作業下的中繼資料代理程式可能會每小時重新啟動一次,並可能連續重新啟動數次。

    於 1.12.6-gke.7 已修正

    解決方法:不用擔心中繼資料代理程式的重新啟動次數。

Beta 版 1.11.4

  1. 自 Kubernetes 1.11.4 版起,對結構化 JSON 記錄檔的解析不正確

    自 Kubernetes 1.11.4 版起,系統便無法正確解析結構化的 JSON 記錄檔。其中一項影響是,設定為依據結構化記錄檔的內容來觸發的快訊無法正確觸發。這可能造成快訊觸發失敗,或是在不該觸發時卻觸發。此外,依賴結構化記錄檔內容的記錄指標會變得無效。

    解決方法:降級至 GKE 版本 1.11.3:

    gcloud container clusters upgrade [CLUSTER_NAME] --zone [ZONE] --project [PROJECT] --master --cluster-version=1.11.3
    

    此問題已在 1.11.6-gke.2 和 1.12.4-gke.2 中修正

Beta 版 1.10.2

  1. 遺漏資源項目

    您可能不會在 Stackdriver Kubernetes Engine Monitoring 中看到您的所有命名空間、工作負載、Pod 或其他實體,這是因為收集中繼資料方面的問題。 可能需要 30 分鐘的時間才能找到遺漏的實體。 這些實體會在重新整理顯示畫面之後出現。

    此問題已在 Kubernetes 1.10.6 與 1.11.2 版中修正。您也可以使用手動安裝步驟,在新叢集中安裝較新版本的 Heapster 與 Stackdriver 代理程式。

  2. 地區與多區域叢集

    屬於地區與多區域叢集的實體無法正確顯示。這些叢集的「Infrastructure」(基礎架構)、「Workload」(工作負載) 與「Service」(服務) 分頁不會展開至節點/Pod 層級。

    此問題已在 Kubernetes 1.10.6 與 1.11.2 版中修正。您也可以使用手動安裝步驟,在新叢集中安裝較新版本的 Heapster 與 Stackdriver 代理程式。

  3. 記錄項目中遺漏嚴重性

    記錄代理程式擷取的記錄項目遺失嚴重性欄位,這會導致所有記錄項目顯示預設嚴重性 (灰色星號),從而破壞了 Error Reporting 的整合性。

    此問題已在 Kubernetes 1.10.6 與 1.11.2 版中修正。您也可以使用手動安裝步驟,在新叢集中安裝較新版本的 Heapster 與 Stackdriver 代理程式。

  4. 例外狀況堆疊追蹤偵測損毀

    多行例外狀況堆疊追蹤分成了多個單獨的記錄項目,從而破壞了 Error Reporting 的整合性。

    此問題已在 Kubernetes 1.10.6 與 1.11.2 版中修正。您也可以使用手動安裝步驟,在新叢集中安裝較新版本的 Heapster 與 Stackdriver 代理程式。

  5. 代理程式的不相關錯誤訊息

    中繼資料代理程式可能在之前的代理程式執行個體錯誤關閉之後寫入不相關的錯誤記錄訊息。 此訊息為:

    terminate called after throwing an instance of 'boost::exception_ ...'
    what():  Error listening on provided port.
    terminate called recursively
    Aborted (core dumped)
    

    此外,記錄代理程式會在中繼資料代理程式終止之後記錄 Error calling Metadata Agent

    此問題已在 Kubernetes 1.10.6 與 1.11.2 版中修正。您也可以使用手動安裝步驟,在新叢集中安裝較新版本的 Heapster 與 Stackdriver 代理程式。

  6. Stackdriver 代理程式在 Compute Engine 防火牆背後無法正常運作

    Stackdriver Kubernetes Engine Monitoring 無法與某些 Compute Engine 防火牆背後的叢集搭配使用。在這些情況下,您的中繼資料代理程式會發出下列錯誤訊息:

    Metadata request unsuccessful: Address family not supported by protocol.
    

    此問題已在 Kubernetes 1.10.6 與 1.11.2 版中修正。您也可以使用手動安裝步驟,在新叢集中安裝較新版本的 Heapster 與 Stackdriver 代理程式。

  7. Stackdriver 中繼資料代理程式重新啟動

    在 Beta 版中,正常作業下的中繼資料代理程式可能會每小時重新啟動一次,並可能連續重新啟動數次。

    於 1.12.6-gke.7 已修正

    解決方法:不用擔心中繼資料代理程式的重新啟動次數。

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Stackdriver Monitoring
需要協助嗎?請前往我們的支援網頁