關於非同步複製

非同步複製功能提供低復原點目標 (RPO) 和低復原時間目標 (RTO) 的區塊儲存空間複製能力,可以進行跨區域主動-被動式災難復原 (DR)。

非同步複製是一種儲存空間選項,可在兩個區域之間非同步複製資料。萬一發生區域性服務中斷情形,非同步複製功能可讓您將資料容錯移轉至次要區域,並在該區域重新啟動工作負載。

您可以使用非同步複製功能,在基礎架構層級管理 Compute Engine 工作負載的複製作業,而非工作負載層級。

總覽

非同步複製功能會將附加至執行中工作負載的磁碟 (即主要磁碟) 資料,複製到其他區域的獨立磁碟。接收複製資料的磁碟稱為「次要磁碟」

主要磁碟所在的地區稱為主要地區,次要磁碟所在的地區則稱為次要地區。主要和次要區域稱為「區域配對」

只要符合磁碟需求,任何磁碟都可以做為主要磁碟。建立主要磁碟後,您可以建立次要磁碟,參照主要磁碟並開始複製主要磁碟的內容到次要磁碟。

如果您在任何時間點停止從主要磁碟複製資料,並想在稍後重新開始複製,則必須建立新的次要磁碟,才能重新開始複製。

一致性群組

一致性群組可讓您跨多個磁碟執行 DR 和 DR 測試。一致性群組是一種資源政策,可執行下列操作:

  • 對齊主要磁碟的複製作業,確保所有磁碟都含有相同時間點的複製資料,以用於 DR。
  • 對齊次要磁碟的磁碟副本,確保所有磁碟副本都含有相同時間點的資料,用於 DR 演練。

如要讓多個磁碟的複製時間保持一致,請將主要磁碟加入一致性群組。如要複製多個磁碟,並確保複製的磁碟含有相同時間點的資料,請將次要磁碟新增至一致性群組。一致性群組可用於複製或複製,但不能同時用於這兩項作業。

如要將主要磁碟新增至一致性群組,您必須將磁碟新增至一致性群組,然後再開始複製作業。您可以隨時將次要磁碟加入一致性群組。

容錯移轉和容錯回復

如果主要區域發生服務中斷情形,您有責任找出服務中斷問題,並使用次要區域的次要磁碟,容錯移轉並重新啟動工作負載。非同步複製功能不會監控中斷情形。您可以透過復原點目標 (RPO) 指標健康狀態檢查、應用程式專屬指標,以及聯絡 Cloud 客戶服務,判斷是否發生中斷。

容錯移轉程序包含下列工作:

  1. 停止複製。
  2. 將次要磁碟連接至次要區域中的 VM。

磁碟容錯移轉後,您有責任驗證並重新啟動次要區域中的應用程式工作負載,以及重新設定用於存取應用程式的網路位址,使其指向次要區域。

從主要區域容錯移轉至次要區域後,次要區域會成為實際的主要區域。服務中斷或發生災害的問題解決後,您可以啟動容錯回復,從原始次要區域 (即實際的主要區域) 開始複製資料到原始主要區域。您可以視需要重複執行上述程序,將工作負載移回原始主要區域。

回復程序包含下列工作:

  1. 在新主要區域與原始主要區域之間設定複製作業。

    • 原先的次要磁碟現在是新的主要磁碟,您可以設定該磁碟,將資料複製到原先主要區域中的新次要磁碟。
    • 您可以在新的主要區域中建立新的資源政策,讓新的主要磁碟 (原始次要磁碟) 能一致地複製到原始主要區域中的一組新次要磁碟。
  2. (選用) 初始複製作業完成後,您可以重複執行容錯移轉程序,將工作負載還原至原始主要區域。

磁碟加密

主要和次要磁碟不支援客戶提供的加密金鑰 (CSEK)。請改用Google-owned and Google-managed encryption keys客戶自行管理的加密金鑰 (CMEK)。如果您在主要磁碟上使用 CMEK,也必須在次要磁碟上使用 CMEK。您可以在兩個磁碟上使用不同的 CMEK。

自訂次要磁碟

建立次要磁碟時,Compute Engine 會自動將主要磁碟的屬性複製到次要磁碟。您可以變更次要磁碟的特定屬性,使其與主要磁碟不同。舉例來說,主要和次要磁碟的大小和加密金鑰必須相同,但您可以為次要磁碟指派其他標籤。

如果主要磁碟是開機磁碟,系統會使用主要磁碟的開機設定建立次要磁碟。啟動設定包含 OS 架構、OS 授權和客體 OS 功能的相關資訊。

如果是開機磁碟,您可以指定其他客體 OS 功能,在次要磁碟上啟用其他安全性或網路選項。不過,您無法移除主要磁碟的任何客體 OS 功能。Compute Engine 會將您指定的新功能與主要磁碟現有的客體作業系統功能合併。

如要進一步瞭解如何自訂次要磁碟,請參閱「建立自訂次要磁碟」一文。

範例

假設您有名為 disk-1 的開機磁碟,且具有下列客體 OS 功能:[GVNIC, UEFI_COMPATIBLE]

如果您從 disk-1 建立次要磁碟,只能指定其他功能。你無法移除 UEFI_COMPATIBLEGVNIC 功能。 因此,如果您在建立次要磁碟時指定 MULTI_IP_SUBNET,新功能會與主要磁碟的功能合併,因此次要磁碟的客體 OS 功能會是 [GVNIC,UEFI_COMPATIBLE, and MULTI_IP_SUBNET]

修改主要磁碟

建立次要磁碟後,您可能需要修改主要磁碟的屬性。對於某些屬性,如果您在主要磁碟上進行變更,Compute Engine 會自動更新次要磁碟上的屬性。

Compute Engine 會監控並自動更新下列屬性:

  • 存取模式 (僅限 Hyperdisk)
  • 磁碟大小
  • 佈建的 IOPS 和總處理量 (僅限 Hyperdisk)
  • 複製狀態

如果修改主要磁碟的其他屬性,則必須手動更新次要磁碟。

  • 如要瞭解如何修改 Hyperdisk 磁碟區的屬性,請參閱「修改 Hyperdisk」。
  • 如要瞭解如何修改永久磁碟的屬性,請參閱修改永久磁碟

非同步複製和區域磁碟

您可以搭配區域磁碟使用非同步複製功能,達到高可用性 (HA) 和災難復原 (DR) 的目標。

地區永久磁碟可用於非同步複製磁碟配對中的主要或次要磁碟。磁碟配對是指複製到次要磁碟的主要磁碟。

使用地區磁碟做為主要磁碟時,即使其中一個區域發生中斷,複製作業也不會受到影響。區域主要磁碟會繼續將資料從正常運作的區域複製到次要磁碟。同樣地,當區域磁碟做為次要磁碟時,即使其中一個可用區發生服務中斷,複製作業仍會持續進行。使用地區磁碟做為次要磁碟,可讓工作負載在容錯移轉時,跨區域維持高可用性,次要磁碟也會轉換為新的主要磁碟。

限制

  • 非同步複製功能僅支援下列磁碟類型
    • 平衡型永久磁碟
    • 效能型 (SSD) 永久磁碟
    • Hyperdisk Balanced
    • Hyperdisk Balanced High Availability
    • Hyperdisk Extreme
  • 不支援唯讀磁碟。
  • 多重寫入器磁碟僅支援 Hyperdisk Balanced 和 Hyperdisk Balanced High Availability。
  • 並非所有 Hyperdisk 屬性變更都會自動套用至次要磁碟。如要進一步瞭解哪些屬性會自動套用至次要磁碟,請參閱「次要磁碟自訂」。
  • 每個磁碟的大小上限為 64 TiB。
  • 如要刪除主要或次要磁碟,必須先停止複製作業。
  • 如果 VM 的開機磁碟正在進行複製作業,您必須先停止複製作業,才能刪除 VM。
  • 如果主要磁碟以非開機磁碟的形式連結至 VM,且磁碟已設定為隨 VM 一併刪除,您就無法刪除 VM 或磁碟,除非停止複製或從 VM 卸離主要磁碟。您必須先停止複製作業,才能刪除 VM。
  • 每個專案在每個區域配對中,最多可有 1000 個磁碟配對。

    舉例來說,特定專案 project-1 在愛荷華州和奧勒岡州區域配對中,最多可有 1000 個磁碟配對。project-1 在比利時和法蘭克福地區配對中,最多可有 1000 個磁碟配對。

支援的地區

非同步複製功能適用於下列各大洲的所有區域:

  • 亞洲 (印尼除外)
  • 歐洲
  • 北美洲
  • 大洋洲
  • 南美洲

您可以將特定區域中的主要磁碟複製到同一洲內任何可用的區域,也就是說,您可以在同一洲內任兩個區域建立區域配對。

舉例來說,假設您在法蘭克福 (europe-west3) 有一個主要磁碟,您可以將該磁碟複製到歐洲任何位置的次要磁碟,但無法複製到北美的區域。

如需 Compute Engine 所有區域的完整清單,請參閱「可用區域和地區」。

效能

復原點目標 (RPO) 或資料在次要網站上可用的時間延遲取決於磁碟變更率。非同步複製功能通常會以一分鐘的目標 RPO 複製資料,每分鐘最多可複製 12.5 GB 的壓縮變更區塊,且磁碟區塊的複製粒度為 4 KB。如果特定區塊在複製事件之間多次變更,只有最近一次的變更會複製到次要磁碟。如果磁碟變更率較高,RPO 可能會超過一分鐘,且通常會隨著磁碟變更率增加而提高。RPO 無法設定。

在下列情況中,RPO 可能會超過一分鐘:

  • 磁碟複製作業的開始時間。在初始複製期間,非同步複製會將主要磁碟上的所有已用區塊複製到次要磁碟。當 Cloud Monitoring 中顯示 disk/async_replication/time_since_last_replication 指標時,表示初始複製作業已完成。
  • 如果磁碟變更率大於每分鐘 12.5 GB 的壓縮變更區塊。磁碟變更量突然增加後,後續複製週期的 RPO 可能會超過一分鐘,因為複製作業需要趕上進度。
  • 如果卸離 VM 的磁碟,或在磁碟複製期間重新啟動 VM。如果正在複製的磁碟與 VM 分離,RPO 可能會在短時間內增加最多五分鐘。

如要瞭解如何查看磁碟的 RPO,請參閱「非同步複製效能指標」。

容錯移轉期間的復原時間目標 (RTO) 取決於完成各項工作所需的時間,這些工作包括將工作負載容錯移轉至新區域。停止複製資料和將磁碟連接至次要區域中的 VM 等工作,應該只需要幾分鐘即可完成。您可以確保在次要區域執行 VM,這樣一來,如果發生容錯移轉,就不必等待 VM 啟動,進而縮短 RTO。

後續步驟