瞭解自動配置器所做的決定

自動調度資源功能可代替您自動調度代管執行個體群組的資源。本文件可帶您瞭解自動配置器在調度代管執行個體群組的資源時,可能會做出的一些決策。

目標與實際使用率之間的差距

執行自動調度資源程序的期間,您可能會發現到,若執行個體群組越小,執行個體群組的實際使用率與目標使用率之間的差距似乎就越大。這是因為自動配置器在轉譯使用率資料,並判斷所要新增或移除的執行個體數量時,會一律四捨五入,以保守方式執行動作。這種作法可避免自動配置器新增的資源量不足,或是移除過多的資源。

例如,若您將使用率目標設為 0.7,而應用程式超過了使用率目標,則自動配置器可能會判斷若新增 1.5 個虛擬機器,即可將使用率降低至接近 0.7。由於無法新增 1.5 個虛擬機器,因此自動配置器會四捨五入,而新增兩個虛擬機器。如此可能會使平均 CPU 使用率降到低於 0.7,但可確保有充足的資源可支撐應用程式。

同樣地,若自動配置器判斷移除 1.5 個虛擬機器會讓使用率增加至接近 0.7,就僅會移除一個虛擬機器。

若是具有更多虛擬機器的大型群組,使用率會分配到大量的執行個體上,而新增或移除虛擬機器可減少實際使用率和目標使用率之間的差距。

縮減資源時的延遲

為了縮小規模,自動配置器會根據過去 10 分鐘的尖峰負載來計算群組的建議目標大小。過去 10 分鐘稱為穩定期

觀察 10 分鐘內的使用狀況資訊,可對自動配置器提供以下協助:

  • 確保自執行個體群組收集到的是穩定的資訊。
  • 避免自動配置器不斷過度新增或移除執行個體。
  • 判斷是否只需使用較小規模的群組即可支撐過去 10 分鐘的負載,藉此安全地移除執行個體。

這個 10 分鐘的穩定期看似是縮減規模時發生延遲,但實際上是自動調度資源的內建功能。如果代管執行個體群組中新增了執行個體,這樣的延遲可確保執行個體至少會執行 10 分鐘,之後方可將執行個體終止。

判斷是否要縮減群組資源時,會有一段忽略新執行個體的等待期

連線排除導致延遲

如果群組屬於後端服務的一部分,且該服務已啟用連線排除,在連線排除持續時間過後,最長可能需要等待 60 秒才能移除或刪除 VM 執行個體。

準備終止執行個體

自動配置器縮減資源時,會判定需要關閉的虛擬機器數量,並從執行個體群組中選出並終止低使用率的虛擬機器執行個體。終止執行個體前,請先確認這些執行個體是否有執行特定工作,例如關閉所有現有的連線、順利關閉所有應用程式或應用程式伺服器、上傳記錄檔等等。您可使用關閉指令碼,指示執行個體來執行這些工作。

系統會在發出終止要求直到實際終止執行個體前的短暫期間內,盡可能執行關閉指令碼。Compute Engine 於這段期間會嘗試執行關閉指令碼,以執行您在指令碼中指定的所有工作。

若您是對代管執行個體群組使用負載平衡,這種作法尤其實用。若執行個體健康狀態不良,則負載平衡器可能需要花點時間才會辨識出執行個體處於不良健康狀態,因此負載平衡器會持續向執行個體傳送新要求。而透過關閉指令碼,執行個體就能在關閉時回報其處於不良的健康狀態,如此一來負載平衡器即可停止傳送流量至執行個體。如需更多資訊,請參閱負載平衡說明文件中的處理健康狀態不良的執行個體

如要進一步瞭解關閉指令碼,請參閱關閉指令碼

如要進一步瞭解執行個體的關閉,請參閱文件中關於停止刪除執行個體的說明。

檢視自動調度資源圖表中的使用率

如果您有代管的執行個體群組目前為自動調度資源,Compute Engine 會提供自動調度資源圖表,可追蹤任何時刻的總使用率及自動調度資源執行個體數量。可至 Google Cloud Platform 主控台取得這份圖表。

  1. 前往 GCP 主控台的「執行個體群組」頁面。

    前往「執行個體群組」頁面

  2. 找到要查看的自動調度過資源的代管執行個體群組,按一下其名稱。此群組一定是按 CPU 使用率進行自動調度資源 (尚未支援其他自動調度資源指標)。
  3. 在代管執行個體群組詳細資料的頁面上,選取 [Monitoring] (監控) 分頁標籤 (若尚未選取)。

    監控分頁的螢幕擷取畫面

  4. 請務必在下拉式選單中,選取 [Autoscaled size] (自動配置大小)

此圖表會針對 CPU 用量追蹤執行個體的數量。請透過下列資訊來瞭解圖表:

  • 位於上方圖形中的藍線表示代管執行個體群組中的執行個體數量。
  • 位於下方圖表的藍線代表該群組的 CPU 總使用率。
  • 下方圖表中的綠線代表的是代管執行個體群組可用的剩餘容量
    • 如果綠線的的位置高於藍線,表示具有大量的可用容量,且 VM 執行個體的使用量可能過低。
    • 如果綠線的的位置低於藍線,表示剩餘的容量極少,甚至無可用容量,請新增更多執行個體至執行個體群組。
  • 若容量降低,可能表示執行個體群組的規模縮減,因此上方圖表中的藍線亦會下降。同樣地,若容量增加,表示執行個體的群組規模可能也已增加。

舉例而言,下圖擷取的是某個自動調度過資源的代管執行個體群組,該群組已達到容量,導致自動配置器新增了更多 VM 執行個體群組,以便增加群組容量:

自動調度資源圖表螢幕擷取畫面

檢視狀態訊息

若自動配置器在執行資源調度時遇到問題,會傳回警告或錯誤訊息。您可使用以下兩種方式之一來查看這些狀態訊息。

在「執行個體群組」頁面上檢視狀態訊息

可直接在 Google Cloud Platform 主控台中的「執行個體群組」頁面上檢視狀態訊息。

  1. 前往 Google Cloud Platform 主控台的「執行個體群組」頁面。

    前往「執行個體群組」頁面

  2. 請尋找具有警告 ! 圖示的執行個體群組。 此圖示如下:

    「執行個體群組」頁面上狀態訊息的螢幕擷取畫面

  3. 將游標移至狀態圖示上,即可查看狀態訊息的詳細資料。

在「執行個體群組詳細資料」頁面上檢視狀態訊息

直接前往特定執行個體群組的詳細資料頁面,即可檢視相關狀態訊息。

  1. 前往 Google Cloud Platform 主控台的「執行個體群組」頁面。

    前往「執行個體群組」頁面

  2. 按一下想要檢視狀態訊息的執行個體群組。
  3. 在詳細資料頁面的「Members」(成員) 分頁標籤上,即可檢視狀態訊息。例如:

    「執行個體群組詳細資料」頁面上狀態訊息的螢幕擷取畫面

常見的傳回狀態訊息

若自動配置器在執行資源調度時遇到問題,會傳回警告或錯誤訊息。以下是一些常見的傳回訊息及其含意。

All instances in the instance group are unhealthy (not in RUNNING state). If this is an error, check the instances.
這個執行個體群組中的所有執行個體,皆處於非 RUNNING 狀態。如果是特意這樣做,您可忽略此訊息。若並非特意,請對執行個體群組進行疑難排解。
The number of instances has reached the maxNumReplicas. The autoscaler cannot add more instances.
您在建立自動配置器時,指定了執行個體群組所能擁有的執行個體數量上限。自動配置器正在嘗試將執行個體群組的規模向上調整,以符合需求,但已達到 maxNumReplicas。如要將 maxNumReplicas 更新為較大的數字,請參閱更新自動配置器
The monitoring metric that was specified does not exist or does not have the required labels. Check the metric.
您目前在使用 Stackdriver 指標自動調度資源,但您提供的指標不存在,或缺少必要的標籤。端看您使用的是標準指標還是自訂指標,所需的標籤也會不同。詳情請參閱根據 Stackdriver Monitoring 指標執行資源調度說明文件。
Quota for some resources is exceeded. Increase the quota or delete resources to free up more quota.
您可在 Google Cloud Platform 主控台的「配額」頁面上,取得可用配額的相關資訊。
Autoscaling does not work with an HTTP/S load balancer configured for maxRate.
執行個體群組正以 maxRate 設定在執行負載平衡作業,但自動配置器不支援這種模式。請變更設定或停用自動調度資源功能。如要進一步瞭解 maxRate,請參閱負載平衡說明文件中的限制與規範
The autoscaler is configured to scale based on a load balancing signal but the instance group has not received any queries from the load balancer. Check that the load balancing configuration is working.
執行個體群組處於達到負載平衡的狀態,但沒有查詢流入該群組。此服務可能正處於閒置期,所以不須擔憂。不過,這項訊息也可能是由於錯誤設定所造成;舉例來說,自動調度資源的執行個體群組可能是多個負載平衡器的目標,而此設定並未受到支援。如須完整的規範清單,請參閱負載平衡說明文件中的限制與規範
本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Compute Engine 說明文件