代管執行個體群組疑難排解

有幾種問題會導致代管執行個體群組 (MIG) 無法順利建立或重建 VM 執行個體。

如果系統為已刪除的 MIG 產生記錄

問題可能與下列情況有關。

附加的自動調度器仍存在

如果您使用 Compute Engine API 刪除 MIG,但未另外發出要求刪除附加的自動配置器,記錄檔總管可能會顯示含有下列訊息的記錄。

The resource 'projects/PROJECT/zones/ZONE/instanceGroupManagers/DELETED_INSTANCE_GROUP_NAME' was not found.

解決方法

如要解決這個問題,請使用 Compute Engine API 方法刪除附加的自動配置器:

如果 MIG 無法建立或重新建立執行個體

問題可能與下列情況有關。

開機磁碟已存在

根據預設,建立執行個體時,系統會建立新的開機永久磁碟。開機磁碟的名稱與 VM 的名稱相符。如果將 VM 命名為 my-instance,磁碟也會命名為 my-instance。如果已有永久磁碟使用這個名稱,要求就會失敗。如要解決這個問題,您可以選擇拍攝快照,然後刪除現有永久磁碟。

執行個體範本無效

如果您最近更新了執行個體範本,可能會出現無效的屬性,導致 MIG 無法建立 VM。檢查屬性是否有下列常見錯誤:

  • 您指定了不存在的資源,例如來源映像檔。
  • 資源名稱拼字有誤。
  • 您嘗試在讀寫模式下連結現有的非開機永久磁碟,但群組包含多個 VM。如果群組有多個 VM,如要連結其他任何磁碟,讓群組中的所有 VM 共用,就必須使用唯讀模式。

資源類型超出上限

嘗試在區域 MIG 中建立超過 2,000 個 VM,或在可用區 MIG 中建立超過 1,000 個 VM 時,會發生下列錯誤。執行個體群組大小已達上限。

錯誤訊息:

ERROR: (gcloud.compute.<INSTANCE_GROUP_TYPE>.<METHOD>) Could not
fetch resource:

 - Exceeded limit 'MAX_INSTANCES_IN_INSTANCE_GROUP' on resource 'PROJECT_ID'.
 Limit: NUMBER

解決方法

如要解決這個問題,請嘗試下列其中一種方法:

如果無法刪除 MIG 或其執行個體

這個問題可能與下列情況有關。

在區域或地區中找不到資源

嘗試刪除區域 MIG 時,如果指定 --zone 旗標、未指定區域或指定錯誤區域,就會發生下列錯誤。如果您嘗試刪除區域 MIG,並指定 --region 旗標,也可能會發生類似錯誤。

錯誤訊息:

  • ERROR: (gcloud.compute.instance-groups.managed.delete) Some requests did not succeed:
    ‐ The resource 'projects/PROJECT/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME' was not found
    
  • ERROR: (gcloud.compute.instance-groups.managed.delete) Some requests did not succeed:
    ‐ The resource 'projects/PROJECT/regions/REGION/instanceGroupManagers/INSTANCE_GROUP_NAME' was not found
    

解決方法

如要解決這個問題,請嘗試下列其中一種方法:

後端服務使用資源

如果負載平衡器的後端服務正在使用執行個體群組,您就無法移除該群組。您必須先從後端服務中移除執行個體,才能刪除執行個體群組。

錯誤訊息:

  • ERROR: (gcloud.compute.instance-groups.managed.delete) Some requests did not succeed:
    ‐ The instance_group_manager resource 'projects/PROJECT/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME is already being used by 'projects/PROJECT/global/backendServices/BACKEND_SERVICE
  • ERROR: (gcloud.compute.instance-groups.managed.delete) Some requests did not succeed:
    ‐ The instance_group_manager resource 'projects/PROJECT/regions/REGION/instanceGroupManagers/INSTANCE_GROUP_NAME is already being used by 'projects/PROJECT/global/backendServices/BACKEND_SERVICE

解決方法

  1. 選用:排空後端執行個體群組。

  2. 從區域或全域後端服務中移除 MIG。

    • 如果是區域 MIG,請執行下列指令:

      gcloud compute backend-services remove-backend BACKEND_SERVICE \
          --instance-group=INSTANCE_GROUP_NAME \
          --instance-group-zone=ZONE \
          [--region=REGION | --global]
      
    • 如為地區 MIG,請執行下列指令:

      gcloud compute backend-services remove-backend BACKEND_SERVICE  \
          --instance-group=INSTANCE_GROUP_NAME \
          --instance-group-region=REGION \
          [--region=REGION | --global]
      
  3. 刪除 MIG:

    gcloud compute instance-groups managed delete INSTANCE_GROUP_NAME
    

如果 MIG 持續嘗試重新建立執行個體

這個問題可能與下列情況有關。

健康狀態檢查探測器無法連線至執行個體

如果您已設定自動修復政策,但未設定或誤設防火牆規則,導致健康狀態檢查探測無法連上應用程式,則 VM 會顯示健康狀態不良,且 MIG 會持續嘗試重新建立 VM。如要瞭解如何設定健康狀態檢查防火牆規則,請參閱健康狀態檢查設定範例