地區永久磁碟和 Hyperdisk Balanced 高可用性是儲存空間選項,可讓您在 Compute Engine 中實作高可用性 (HA) 服務。 區域永久磁碟和 Hyperdisk 平衡高可用性磁碟可在同一區域內的兩個可用區之間同步複製資料,並確保磁碟資料的高可用性,最多可容許一個可用區發生故障。
地區永久磁碟和 Hyperdisk 平衡高可用性磁碟區適用於需要較低復原點目標 (RPO) 和復原時間目標 (RTO) 的工作負載。如要進一步瞭解 RPO 和 RTO,請參閱「災難復原規劃基本概念」。
地區永久磁碟和 Hyperdisk 平衡高可用性磁碟區,在設計上可搭配地區性代管執行個體群組使用。本文將概述如何使用 地區永久磁碟和 Hyperdisk 已平衡的高可用性磁碟區,建構高可用性服務。
決定使用 地區永久磁碟或 Hyperdisk Balanced High Availability 時,請務必比較各種提高服務可用性的選項,以及不同服務架構的費用、效能和彈性。
關於同步磁碟複製
區域性永久磁碟或 Hyperdisk Balanced 高可用性磁碟區 (也稱為區域性磁碟或同步複製磁碟) 在其區域內有主要和次要可用區,可儲存磁碟資料:
- 主要區域與您要將磁碟連結至的運算執行個體位於同一區域。
- 次要區域是您在同一區域內選擇的替代區域。
Compute Engine 會在這兩個可用區中維護磁碟副本。當您將資料寫入磁碟時,Compute Engine 會將資料同步複製到兩個區域的磁碟副本,確保高可用性。各區域副本的資料分佈於區域中的多台實體機器,以確保耐久性。區域備份可確保磁碟資料保持可用狀態,並防範磁碟區域發生暫時性服務中斷。
區域備用資源的備用資源狀態
區域永久磁碟或 Hyperdisk Balanced High Availability 的磁碟副本狀態 會顯示可用區副本與磁碟內容的比較狀態。磁碟的可用區副本一律處於下列其中一種磁碟副本狀態:
- 已同步:備用資源可用,會同步接收對磁碟執行的所有寫入作業,且磁碟上的所有資料都處於最新狀態。
- 趕上進度:副本可用,但仍要趕上其他副本磁碟上的資料。
- 不同步:備用資源暫時無法使用,且與磁碟上的資料不同步。
如要瞭解如何檢查及追蹤區域副本的副本狀態,請參閱「監控磁碟副本狀態」。
區域磁碟的複製狀態
視個別區域複本的狀態而定,您的區域性永久磁碟或 Hyperdisk Balanced 高可用性磁碟區可能處於下列其中一種複寫狀態:
- 完全複製:兩個可用區中的副本都可用,且已與最新的磁碟資料同步。
- 趕上進度:可用區副本可用,但其中一個可用區副本正在趕上最新的磁碟資料。
- 降級:其中一個區域副本的狀態為
out of sync
, 原因是發生故障或服務中斷。
如果磁碟複製狀態為 catching up
或 degraded
,表示其中一個可用區備用資源未更新所有資料。如果健康狀態良好的副本所在區域在這段期間發生任何中斷情形,磁碟就會無法使用,直到該區域恢復正常為止。
當 區域性永久磁碟或 Hyperdisk Balanced High Availability 磁碟區正在趕上進度時,Google Cloud 會開始修復正在趕上進度的區域副本。Google 建議您等待受影響的區域副本趕上磁碟上的資料,此時副本的狀態會變更為 Synced
。區域副本進入同步狀態後,區域磁碟狀態會變回 Fully replicated
狀態。
如果區域磁碟長時間處於 catching up
或 degraded
狀態,且不符合貴機構的 RPO 需求,建議您透過下列任一方式建立主要副本的快照:
- 啟用排定的快照。
- 手動建立 地區永久磁碟或 Hyperdisk Balanced 高可用性磁碟的快照。
建立快照後,您可以使用該快照做為來源,建立新的地區永久磁碟或 Hyperdisk 平衡高可用性磁碟。這會將快照還原至新磁碟。新磁碟也會以完全複製的狀態啟動,並順利複製資料。
如要瞭解如何檢查地區永久磁碟 或 Hyperdisk Balanced 高可用性磁碟的複寫狀態,請參閱「判斷磁碟的複寫狀態」。
副本復原檢查點
副本復原檢查點是磁碟屬性,代表完全複製磁碟的最近一次當機一致時間點。Compute Engine 會自動為每個區域磁碟建立及維護單一副本復原檢查點。磁碟完全複製後,Compute Engine 會大約每 15 分鐘重新整理檢查點,確保檢查點保持在最新狀態。當磁碟複製狀態為 degraded
時,Compute Engine 可讓您從該磁碟的副本復原檢查點建立標準快照。產生的標準快照會擷取完全複製磁碟的最新當機一致性版本資料。
在極少數情況下,如果磁碟效能降低,與最新磁碟資料同步的區域副本也可能在不同步的副本趕上進度前發生故障。您無法將磁碟強制連結至任一區域中的運算執行個體。複製的磁碟會無法使用,您必須將資料遷移至新磁碟。在這種情況下,如果磁碟沒有任何現有的標準快照,您或許仍可使用從副本復原檢查點建立的標準快照,從不完整的副本復原磁碟資料。
Compute Engine 會為每個已掛接的 地區永久磁碟或 Hyperdisk Balanced 高可用性磁碟,自動建立副本復原檢查點。建立這些檢查點不會產生任何額外費用。不過,當您使用這些檢查點將區域磁碟遷移至正常運作的可用區時,建立快照和 Compute 執行個體會產生適用的儲存空間費用。
進一步瞭解如何使用副本復原檢查點復原區域性磁碟資料。
區域性磁碟容錯移轉
如果可用區發生服務中斷,該可用區就會無法存取,且該可用區中的運算執行個體無法對磁碟執行讀取或寫入作業。為確保執行個體能繼續對區域磁碟執行讀取和寫入作業,Compute Engine 允許將磁碟資料遷移至磁碟有副本的其他可用區。這項程序稱為「容錯移轉」。
容錯移轉程序包括從受影響區域的執行個體卸離區域副本,然後將區域副本附加至次要區域的新執行個體。Compute Engine 會將磁碟上的資料同步複製到次要可用區,確保單一副本發生故障時,能夠快速容錯移轉。
應用程式專用地區控制層的容錯移轉
應用程式專用區域控制層並非 Google Cloud 服務。設計 HA 服務架構時,您必須建構專屬應用程式的區域控制層。這個應用程式控制平面會決定哪個執行個體必須附加區域磁碟,以及哪個執行個體是目前的主要執行個體。
如果系統在區域磁碟的主要執行個體或資料庫中偵測到故障,高可用性服務架構的應用程式專用區域控制層,可以自動啟動容錯移轉至次要區域的待命執行個體。在容錯移轉期間,應用程式專屬的地區控制層會將地區磁碟重新附加至次要區域的待命執行個體。接著,Compute Engine 會根據健康狀態檢查訊號,將所有流量導向該執行個體。
整體容錯移轉延遲 (排除故障偵測時間) 是下列延遲的總和:
- 將地區磁碟連接至待命執行個體的時間不到 1 分鐘
- 應用程式初始化和當機救援所需的時間
詳情請參閱「瞭解應用程式專屬的區域控制層」。
災難復原的構成要素頁面說明 Compute Engine 可用的構成要素。
透過強制連接進行容錯移轉
地區永久磁碟 和 Hyperdisk 平衡高可用性磁碟的優點之一是,萬一發生區域服務中斷情形,您可以手動將工作負載容錯移轉至其他區域。如果原始區域發生中斷,您必須等到該區域副本還原後,才能完成磁碟分離作業。在這種情況下,您可能需要將次要區域副本掛接至新的運算執行個體,但不必從主要執行個體卸載主要區域副本。這個程序稱為「強制附加」。
當主要區域中的運算執行個體無法使用時,您可以將磁碟強制連接至次要區域中的執行個體。如要執行這項工作,您必須採取下列任一做法:
- 在與要強制附加的地區磁碟副本相同的區域中,啟動另一個運算執行個體。
- 在該可用區中維護熱待命運算執行個體。「熱待命」是執行中的執行個體,與主要區域中的執行個體完全相同。這兩個執行個體具有相同的資料。
Compute Engine 會在一分鐘內執行強制連接作業。總復原時間目標 (RTO)不僅取決於儲存空間容錯移轉 (強制附加區域磁碟),也取決於其他因素,包括:
- 是否必須先建立次要執行個體
- 基礎檔案系統偵測熱插拔磁碟所需的時間長度
- 對應應用程式的復原時間
如要進一步瞭解如何使用強制連接功能,讓運算執行個體容錯移轉,請參閱「使用 force-attach
容錯移轉區域性磁碟」。
限制
以下各節列出適用於區域永久磁碟和 Hyperdisk Balanced High Availability 的限制。
區域性磁碟的一般限制
- 區域性永久磁碟只能連接至採用 E2、N1、N2 和 N2D 機型的 VM。
- 您只能將 Hyperdisk Balanced High Availability 附加至支援的機器類型。
- 您無法從作業系統映像檔建立區域永久磁碟,也無法從作業系統映像檔建立的磁碟建立。
- 您無法透過複製區域磁碟來建立 Hyperdisk Balanced High Availability 磁碟。如要從區域磁碟建立 Hyperdisk Balanced High Availability 磁碟,請完成「將區域磁碟變更為 Hyperdisk Balanced High Availability 磁碟」一節中的步驟。
- 使用唯讀模式時,最多可將地區平衡永久磁碟連接至 10 個 VM 執行個體。
- 地區標準永久磁碟的大小下限為 200 GiB。
- 您只能增加 區域永久磁碟或Hyperdisk Balanced High Availability 磁碟區的大小,無法縮減。
- 區域性永久磁碟和 Hyperdisk 平衡高可用性磁碟區的效能特性,與對應的區域磁碟不同。詳情請參閱「 關於永久磁碟效能」和「 Hyperdisk Balanced 高可用性效能限制」。
- 您無法使用多寫入端模式的 Hyperdisk Balanced High Availability 磁碟區做為開機磁碟。
- 如果您透過複製區域磁碟建立複製磁碟,則建立時兩個區域備用資源不會完全同步。建立完成後,您平均可在 3 分鐘內使用區域磁碟副本。不過,磁碟可能需要數十分鐘才能完全複製, 復原點目標 (RPO) 才會接近零。瞭解如何 檢查複製的磁碟是否已完全複製。
副本復原檢查點的限制
- 副本復原檢查點是裝置中繼資料的一部分,本身不會顯示任何磁碟資料。您只能使用檢查點做為機制,為效能降低的磁碟建立快照。使用檢查點建立快照後,即可使用該快照還原資料。
- 只有在磁碟效能降低時,才能從副本復原檢查點建立快照。
- 只有在磁碟完全複製後,Compute Engine 才會重新整理磁碟的副本復原檢查點。
- Compute Engine 只會為磁碟維護一個副本復原檢查點,且只會維護該檢查點的最新版本。
- 您無法查看備用資源復原檢查點的確切建立和重新整理時間戳記。
- 您只能使用 Compute Engine API,從副本復原檢查點建立快照。
後續步驟
- 瞭解如何使用地區磁碟建構高可用性服務。
- 參閱災難復原規劃指南。
- 瞭解磁碟定價。
- 瞭解如何建立及管理地區磁碟。
- 瞭解如何監控磁碟的副本狀態。
- 瞭解如何判斷磁碟的複製狀態。
- 瞭解如何管理區域磁碟的故障情形。