Regionaler nichtflüchtiger Speicher


Regionaler nichtflüchtiger Speicher ist eine Speicheroption, mit der Sie Hochverfügbarkeitsdienste in Compute Engine implementieren können. Regionaler nichtflüchtiger Speicher repliziert Daten synchron zwischen zwei Zonen in derselben Region und sorgt für Hochverfügbarkeit (HA) bei Laufwerksdaten für bis zu einen Zonenausfall.

Regionale nichtflüchtige Speicher-Volumes wurden für Arbeitslasten entwickelt, die ein niedrigeres Recovery Point Objective (RPO) und Recovery Time Objective (RTO) erfordern. Weitere Informationen zu RPO und RTO finden Sie unter Grundlagen der Planung der Notfallwiederherstellung.

Regionale nichtflüchtige Speicher-Volumes funktionieren auch mit regionalen verwalteten Instanzgruppen.

In diesem Dokument erhalten Sie einen Überblick über regionalen nichtflüchtigen Speicher und erfahren, wie Sie mithilfe eines regionalen nichtflüchtigen Speicher-Volumes Hochverfügbarkeitsdienste erstellen können.

Wenn Sie regionalen nichtflüchtigen Speicher verwenden, müssen Sie die verschiedenen Optionen zur Erhöhung der Dienstverfügbarkeit sowie Kosten, Leistung und Ausfallsicherheit für verschiedene Dienstarchitekturen vergleichen.

Replikation von zonalen Laufwerken für regionalen nichtflüchtigen Speicher

Ein regionales nichtflüchtiges Speicher-Volume hat eine primäre und eine sekundäre Zone innerhalb seiner Region, in der Laufwerksdaten gespeichert werden:

  • Die primäre Zone ist dieselbe Zone wie die der VM-Instanz, an die Sie das Laufwerk anhängen.
  • Die sekundäre Zone ist eine alternative Zone Ihrer Wahl innerhalb derselben Region.

Compute Engine verwaltet Replikate Ihres regionalen nichtflüchtigen Speicher-Volumes in beiden Zonen. Wenn Sie Daten auf das Laufwerk schreiben, repliziert Compute Engine diese Daten synchron auf den Laufwerkreplikaten in beiden Zonen, um HA zu gewährleisten. Die Daten jedes zonalen Replikats sind auf mehrere physische Maschinen innerhalb der Zone verteilt, um Langlebigkeit zu gewährleisten. Zonale Replikate gewährleisten, dass die Daten des nichtflüchtigen Speicher-Volumes verfügbar bleiben, und bieten Schutz vor temporären Ausfällen in einer der Laufwerkszonen.

Replikatstatus für zonale Replikate

Der Status des Laufwerkreplikats für einen regionalen nichtflüchtigen Speicher zeigt den Status eines zonalen Replikats im Vergleich zum Inhalt des Laufwerks. Zonale Replikate für Ihren regionalen nichtflüchtigen Speicher haben immer einen der folgenden Status für das Laufwerkreplikat:

  • Synchronisiert: Das Replikat ist verfügbar, empfängt synchron alle auf dem Laufwerk ausgeführten Schreibvorgänge und ist mit allen Daten auf dem Laufwerk auf dem neuesten Stand.
  • Wird aktualisiert: Das Replikat ist verfügbar, erfasst jedoch weiterhin die Daten auf dem Laufwerk vom anderen Replikat.
  • Nicht synchronisiert: Das Replikat ist vorübergehend nicht verfügbar und ist nicht mit den Daten auf dem Laufwerk synchronisiert.

Informationen zum Prüfen und Verfolgen des Replikatstatus Ihrer zonalen Replikate finden Sie unter Laufwerkreplikatstatus des regionalen nichtflüchtigen Speicher-Volumes überwachen.

Replikationsstatus des regionalen nichtflüchtigen Speichers

Je nach Status der einzelnen zonalen Replikate kann das regionale nichtflüchtige Speicher-Volume einen der folgenden Replikationsstatus haben:

  • Vollständig repliziert: Replikate in beiden Zonen sind verfügbar und werden mit den neuesten Laufwerksdaten synchronisiert.
  • Wird aktualisiert: Die zonalen Replikate sind verfügbar, aber eines der zonalen Replikate wird mit den neuesten Laufwerksdaten aktualisiert.
  • Eingeschränkt: Eines der zonalen Replikate ist aufgrund eines Fehlers oder eines Ausfalls nicht synchronisiert.

Wenn das regionale nichtflüchtige Speicher-Volume aktualisiert wird oder beeinträchtigt ist, wird eines der zonalen Replikate nicht mit allen Daten aktualisiert. Jeder Ausfall während dieser Zeit in der Zone des fehlerfreien Replikats führt zu einer Nichtverfügbarkeit des regionalen nichtflüchtigen Speicher-Volumes, bis die fehlerfreie Replikatzone wiederhergestellt ist.

Wenn das regionale nichtflüchtige Speicher-Volume aktualisiert wird, beginnt Google Cloud mit der Reparatur des zonalen Replikats, das aktualisiert wird. Google empfiehlt, dass Sie warten, bis das betroffene zonale Replikat mit den Daten auf dem Laufwerk aktualisiert wurde. Nachdem das zonale Replikat dann in den Status „Synchronisiert“ gewechselt ist, wird das regionale nichtflüchtige Speicher-Volume entsprechend in einen vollständig replizierten Zustand zurückversetzt. Wenn das regionale nichtflüchtige Speicher-Volume über einen längeren Zeitraum hinweg aktualisiert wird oder beeinträchtigt ist und die RPO-Anforderungen Ihrer Organisation nicht erfüllt, empfehlen wir Ihnen, Snapshots Ihres Laufwerks auf eine der folgenden Arten zu erstellen:

  • Geplante Snapshots aktivieren.
  • Manuellen Snapshot für Ihr regionales nichtflüchtiges Speicher-Volume erstellen.

Nachdem der Snapshot erstellt wurde, können Sie mit diesem Snapshot ein neues regionales nichtflüchtiges Speicher-Volume erstellen. Sie stellen Ihre Daten auf dem neuen regionalen nichtflüchtigen Speicher-Volume wieder her. Das neue Volume beginnt auch in einem vollständig replizierten Zustand mit fehlerfreier Datenreplikation.

Informationen zum Prüfen des Replikationsstatus Ihres regionalen nichtflüchtigen Speichers finden Sie unter Replikationsstatus eines regionalen nichtflüchtigen Speichers bestimmen.

Prüfpunkt zur Replikatwiederherstellung für regionalen nichtflüchtigen Speicher

Ein Prüfpunkt zur Replikatwiederherstellung ist ein Attribut für regionalen nichtflüchtigen Speicher, das den neuesten absturzsicheren Zeitpunkt eines vollständig replizierten Laufwerks darstellt. Compute Engine erstellt automatisch einen einzelnen Prüfpunkt zur Replikatwiederherstellung für jedes regionale nichtflüchtige Speicher-Volume und verwaltet diesen. Wenn ein regionales nichtflüchtiges Speicher-Volume vollständig repliziert wird, aktualisiert Compute Engine den Prüfpunkt etwa alle 10 Minuten, um sicherzustellen, dass der Prüfpunkt aktuell bleibt. Wenn das regionale nichtflüchtige Speicher-Volume beeinträchtigt ist, können Sie in Compute Engine einen Standard-Snapshot aus dem Prüfpunkt zur Replikatwiederherstellung für dieses Laufwerk erstellen. Der resultierende Standard-Snapshot erfasst die Daten aus der neuesten absturzsicheren Version des vollständig replizierten Laufwerks.

In seltenen Fällen, wenn das Laufwerk beeinträchtigt ist, kann auch das zonale Replikat, das mit den neuesten Laufwerksdaten synchronisiert wurde, ausfallen, bevor das nicht mehr synchronisierte Replikat aktualisiert wurde. Sie können das Anhängen des Laufwerks an VMs in keiner der beiden Zonen erzwingen. Das regionale nichtflüchtige Speicher-Volume ist nicht mehr verfügbar und Sie müssen die Daten auf ein neues Laufwerk migrieren. Wenn in einem solchen Fall keine Standard-Snapshots für Ihr Laufwerk verfügbar sind, können Sie die Laufwerksdaten möglicherweise trotzdem aus dem unvollständigen Replikat wiederherstellen, indem Sie einen Standard-Snapshot verwenden, der aus dem Prüfpunkt zur Replikatwiederherstellung erstellt wurde.

Compute Engine erstellt automatisch die Prüfpunkte zur Replikatwiederherstellung für jedes bereitgestellte regionale nichtflüchtige Speicher-Volume. Für die Erstellung dieser Prüfpunkte fallen keine zusätzlichen Gebühren an. Für die Erstellung von Snapshots und VMs fallen jedoch entsprechende Speichergebühren an, wenn Sie diese Prüfpunkte verwenden, um Ihr Laufwerk in funktionierende Zonen zu migrieren.

Daten von regionalem nichtflüchtigem Speicher mithilfe eines Prüfpunkts zur Replikatwiederherstellung wiederherstellen

Failover für regionalen nichtflüchtigen Speicher

Bei einem Ausfall in einer Zone kann nicht mehr auf die Zone zugegriffen werden und die VM in dieser Zone kann keine Lese- oder Schreibvorgänge auf dem Laufwerk ausführen. Damit die VM weiterhin Lese- und Schreibvorgänge auf dem Laufwerk ausführen kann, ermöglicht Compute Engine die Migration von Laufwerksdaten in die andere Zone, in der das Laufwerk ein Replikat hat. Dieser Vorgang wird als regionaler Failover des nichtflüchtigen Speichers bezeichnet. Beim Failover wird die VM vom Laufwerksreplikat in der betroffenen Zone getrennt. Anschließend wird eine neue VM an das Laufwerksreplikat in der anderen Zone angehängt. Compute Engine repliziert die Daten auf Ihrem Laufwerk synchron in die sekundäre Region, um bei einem Ausfall eines einzelnen Replikats einen schnellen Failover sicherzustellen.

Failover durch anwendungsspezifische regionale Steuerungsebene

Die anwendungsspezifische regionale Steuerungsebene ist kein Google Cloud-Dienst. Wenn Sie HA-Dienstarchitekturen entwerfen, müssen Sie eine eigene anwendungsspezifische regionale Steuerungsebene erstellen. Diese Steuerungsebene der Anwendung entscheidet, an welche VM der regionale nichtflüchtige Speicher angehängt sein muss und welche VM die aktuelle primäre VM ist. Wenn ein Fehler in der primären VM oder in der Datenbank des regionalen nichtflüchtigen Speicher-Volumes erkannt wird, kann die anwendungsspezifische regionale Steuerungsebene Ihrer HA-Dienstarchitektur automatisch einen Failover zur Standby-VM in der sekundären Zone initiieren. Während des Failovers hängt die anwendungsspezifische regionale Steuerungsebene das regionale nichtflüchtige Speicher-Volume wieder an die Standby-VM in der sekundären Zone an. Compute Engine leitet dann den gesamten Traffic anhand von Signalen der Systemdiagnose an diese VM weiter.

Die Failover-Gesamtlatenz ohne die Fehlererkennungszeit ist die Summe der folgenden Latenzen:

  • Null Sekunden, um ein regionales nichtflüchtiges Speicher-Volume wieder an eine Standby-VM anzuhängen
  • Zeit, die für die Initialisierung der Anwendung und die Wiederherstellung nach einem Absturz erforderlich ist

Weitere Informationen finden Sie unter Informationen zur anwendungsspezifischen regionalen Steuerungsebene.

Auf der Seite Bausteine der Notfallwiederherstellung werden die Bausteine behandelt, die derzeit in Compute Engine verfügbar sind.

Failover durch erzwungenes Anhängen

Einer der Vorteile von regionalem nichtflüchtigem Speicher ist, dass Sie im unwahrscheinlichen Fall eines zonalen Ausfalls auch Ihre Arbeitslast, die auf regionalem nichtflüchtigem Speicher ausgeführt wird, manuell einen Failover in eine andere Zone durchführen können. Wenn die ursprüngliche Zone ausfällt, können Sie den Trennvorgang erst abschließen, wenn das zonale Replikat wiederhergestellt wurde. In diesem Szenario müssen Sie möglicherweise die neue VM an das sekundäre zonale Replikat anhängen, ohne die VM vom primären zonalen Replikat zu trennen. Dieser Vorgang wird als erzwungenes Anhängen bezeichnet.

Wenn Ihre VM-Instanz in der primären Zone nicht mehr verfügbar ist, können Sie das Anhängen Ihres Laufwerks an eine VM-Instanz in der sekundären Zone erzwingen. Dafür müssen Sie einen der folgenden Schritte ausführen:

  • Starten Sie eine weitere VM-Instanz in derselben Zone, in der sich auch das regionale nichtflüchtige Speicher-Volume befindet, deren Anhängen Sie erzwingen möchten.
  • Halten Sie in dieser Zone eine Hot-Standby-VM-Instanz verfügbar. Ein Hot-Standby ist eine ausgeführte VM-Instanz, die mit der von Ihnen verwendeten VM-Instanz identisch ist. Die beiden Instanzen haben dieselben Daten.

Compute Engine führt den Vorgang zum erzwungenen Anhängen in weniger als einer Minute aus. Das gesamte Recovery Time Objective (RTO) hängt nicht nur vom Speicher-Failover (dem erzwungenen Anhängen des regionalen nichtflüchtigen Speicher-Volumes), sondern auch von anderen Faktoren ab, darunter:

  • Ob Sie zuerst eine sekundäre VM-Instanz erstellen müssen
  • Zeitspanne, in der das zugrunde liegende Dateisystem ein im "Hot"-Verfahren angehängtes Laufwerk erkennt
  • Wiederherstellungszeit der entsprechenden Anwendungen

Weitere Informationen zum Failover Ihrer VM mit erzwungenem Anhängen finden Sie unter Failover für das regionale nichtflüchtige Speicher-Volume mit force-attach.

Regionaler nichtflüchtiger Speicher priorisiert die Arbeitslastverfügbarkeit. Daraus ergeben sich Kompromisse beim Datenschutz im unwahrscheinlichen Fall, dass beide Laufwerksreplikate gleichzeitig nicht mehr verfügbar sind. Weitere Informationen finden Sie unter Ausfälle bei regionalem nichtflüchtigem Speicher verwalten.

Beschränkungen

In den folgenden Abschnitten werden die Einschränkungen aufgeführt, die für regionalen nichtflüchtigen Speicher gelten.

Allgemeine Einschränkungen für regionalen nichtflüchtigen Speicher

  • Sie können regionalen nichtflüchtigen Speicher nur an VMs anhängen, die den Maschinentyp E2, N1, N2 oder N2D verwenden.
  • Sie können keinen regionalen nichtflüchtigen Speicher aus einem Image erstellen.
  • Im schreibgeschützten Modus können Sie einen regionalen abgestimmten nichtflüchtigen Speicher an maximal 10 VM-Instanzen anhängen.
  • Die Mindestgröße eines regionalen nichtflüchtigen Standardspeichers beträgt 200 GiB.
  • Sie können die Größe eines regionalen nichtflüchtigen Speicher-Volumes erhöhen, aber nicht verringern.
  • Regionale nichtflüchtige Speicher-Volumes haben unterschiedliche Leistungsmerkmale als zonale nichtflüchtige Speicher-Volumes. Weitere Informationen finden Sie unter Blockspeicherleistung.
  • Wenn Sie einen regionalen nichtflüchtigen Speicher durch Klonen eines zonalen Laufwerks erstellen, sind die beiden zonalen Replikate zum Zeitpunkt der Erstellung nicht komplett synchron. Nach der Erstellung können Sie den regionalen Laufwerkklon innerhalb von durchschnittlich 3 Minuten verwenden. Sie müssen jedoch möglicherweise einige Minuten warten, bevor das Laufwerk einen vollständig replizierten Zustand erreicht und das Recovery Point Objective (RPO) fast null ist. So prüfen Sie, ob Ihr regionaler nichtflüchtiger Speicher vollständig repliziert wurde

Einschränkungen für den Prüfpunkt zur Replikatwiederherstellung für regionalen nichtflüchtigen Speicher

  • Ein Prüfpunkt zur Replikatwiederherstellung ist Teil der Gerätemetadaten und zeigt Ihnen keine Laufwerksdaten an. Sie können den Prüfpunkt nur dafür verwenden, einen Snapshot Ihres eingeschränkten Laufwerks zu erstellen. Nachdem Sie den Snapshot mit dem Prüfpunkt erstellt haben, können Sie die Daten mit dem Snapshot wiederherstellen.
  • Sie können Snapshots von einem Prüfpunkt zur Replikatwiederherstellung nur dann erstellen, wenn das Laufwerk eingeschränkt ist.
  • Compute Engine aktualisiert den Prüfpunkt zur Replikatwiederherstellung für das Laufwerk nur, wenn es vollständig repliziert wurde.
  • Compute Engine bewahrt nur einen einzigen Prüfpunkt zur Replikatwiederherstellung für ein Laufwerk und nur die neueste Version dieses Prüfpunkts auf.
  • Sie können nicht die genauen Erstellungs- und Aktualisierungszeitstempel eines Prüfpunkts zur Replikatwiederherstellung sehen.
  • Sie können einen Snapshot von Ihrem Prüfpunkt zur Replikatwiederherstellung nur mithilfe der Compute Engine API erstellen.

Nächste Schritte