為高復原力環境執行容錯移轉測試

Cloud Composer 3 | Cloud Composer 2 | Cloud Composer 1

本頁說明如何對高復原力 (高可用性) 環境執行資料庫容錯移轉測試。

環境的容錯移轉測試會模擬資料中心可用區完全中斷的情況。在這種情況下,資料庫可能會發生區域性中斷。執行容錯移轉測試時,您可以監控高復原力環境如何執行容錯移轉,並檢查這對 DAG 和工作有何影響。

事前準備

  • 如要執行容錯移轉測試,您的 Google 帳戶必須具備下列角色和權限:

    • composer.environments.update權限。如要查看具有這項權限的角色清單,請參閱「使用 IAM 控管存取權」。

  • 在 Cloud Composer 3 中,環境的叢集位於環境的租戶專案中,因此無法模擬區域中斷。

確認環境健康狀態良好

請務必只在運作正常的環境中執行容錯移轉測試。如要檢查環境是否正常運作,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Environments」頁面。

    前往「環境」

  2. 在環境清單中,按一下環境名稱。 「環境詳細資料」頁面隨即開啟。

  3. 前往「監控」分頁。

  4. 確認所有健康指標都呈現綠色。

執行資料庫容錯移轉測試

您可以執行資料庫容錯移轉測試 (模擬區域中斷),方法是使用 Google Cloud CLI 指令觸發測試。舉例來說,您可能想藉此評估環境資料庫切換至其他區域所需的時間。

如要為環境執行資料庫容錯移轉測試,請按照下列步驟操作:

  1. 確認環境狀態良好

  2. 取得環境資料庫的主要區域:

    gcloud composer environments fetch-database-properties \
        ENVIRONMENT_NAME \
        --location LOCATION
    

    更改下列內容:

    • ENVIRONMENT_NAME:Cloud Composer 環境的名稱。
    • LOCATION:環境所在的區域。

    範例:

    gcloud composer environments fetch-database-properties \
        example-environment \
        --location us-central1
    
  3. 啟動資料庫容錯移轉測試:

    gcloud composer environments database-failover \
        ENVIRONMENT_NAME \
        --location LOCATION
    

    更改下列內容:

    • ENVIRONMENT_NAME:Cloud Composer 環境的名稱。
    • LOCATION:環境所在的區域。

    範例:

    gcloud composer environments database-failover \
        example-environment \
        --location us-central1
    
  4. 等待資料庫容錯移轉測試完成。這項程序最多可能需要 3 分鐘的時間。

  5. 確認環境資料庫的主要區域已變更:

    gcloud composer environments fetch-database-properties \
        ENVIRONMENT_NAME \
        --location LOCATION
    
  6. 檢查環境的健康指標,確保環境運作正常

  7. 當「Database available for failover」(可供容錯移轉的資料庫) 環境指標 (composer.googleapis.com/environment/database/available_for_failover) 變成 True 時,環境的資料庫即可進行另一次容錯移轉。如要進一步瞭解如何在 Cloud Monitoring 中查看環境指標,請參閱「監控環境」一文。

後續步驟