GKE on AWS 已知問題

本頁列出 GKE on AWS 的已知問題,以及可採取哪些步驟來減少影響。

如要依產品版本或類別篩選已知問題,請從下列下拉式選單中選取篩選條件。

如果您是 Google 開發人員計畫成員,請儲存這個頁面,以便在發布與這個頁面相關的版本說明時收到通知。詳情請參閱「已儲存的頁面」。

選取 GKE on AWS 版本:

選取問題類別:

或者,搜尋您的問題:

類別 已識別版本 問題和解決方法
作業

1.28.0-gke.0 以上,但不包括 1.28.8-gke.800,

1.27.0-gke.0 以上版本,但不包括 1.27.12-gke.800,

1.26、1.25、1.24、1.23、1.22

如果節點集區含有自訂標籤或汙點,叢集自動配置器無法從零個節點正確擴充。

發生這個問題的原因是,GKE on AWS 叢集自動配置器在佈建節點集區時,未在對應的節點集區 Auto Scaling Group 中設定節點集區標籤和汙點標籤。如果節點集區沒有節點,叢集自動配置器就無法正確建立節點範本,因為缺少這些標記。這可能會導致錯誤的調整規模決策,例如 Pod 未排定至適用的節點,或佈建了實際不需要的節點。

詳情請參閱「自動探索設定」。

網路

1.26.0-gke.0 以上,但不包括 1.26.4-gke.220,

1.25.0-gke.0 以上,但不包括 1.25.10-gke.1200,

1.24 (1.24.0-gke.0 以上版本)

1.23 (1.23.8-gke.1700 以上版本)

如果叢集在 Ubuntu OS 上執行,且使用 5.15 以上版本的核心,就可能發生 netfilter 連線追蹤 (conntrack) 表格插入失敗的問題。即使 conntrack 資料表有空間可容納新項目,仍可能發生插入失敗的情況。失敗的原因是核心 5.15 以上版本有所變更,會根據鏈結長度限制表格插入作業。

如要確認是否受到這個問題影響,請使用下列指令檢查核心內連線追蹤系統統計資料:

    sudo conntrack -S
    

回應的形式如下所示:

cpu=0       found=0 invalid=4 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=1       found=0 invalid=0 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=2       found=0 invalid=16 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=3       found=0 invalid=13 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=4       found=0 invalid=9 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=5       found=0 invalid=1 insert=0 insert_failed=0 drop=0 early_drop=0
error=519 search_restart=0 clash_resolve=126 chaintoolong=0
    

如果回應中的 chaintoolong 值為非零數字,表示您受到這個問題影響。

解決方法:

如果目前執行的是 1.26.2-gke.1001 版,請升級至 1.26.4-gke.2200 以上版本。

可用性 1.25.5-gke.1500、1.25.4-gke.1300

Google Cloud 控制台中的部分 UI 介面無法授權給叢集,可能會將叢集顯示為無法連線。

解決方法:

將叢集升級至 1.25 版的最新可用修補程式。這個問題已在 1.25.5-gke.2000 版中修正。

可用性 1.22

Kubernetes 1.22 會淘汰並取代多個 API。如果叢集已升級至 1.22 以上版本,應用程式對已淘汰 API 的任何呼叫都會失敗。

解決方法:

升級應用程式,以較新的對應項目取代已淘汰的 API 呼叫

如需其他協助,請與 Cloud Customer Care 聯絡。