Hochverfügbarkeit und Replikate

Auf dieser Seite erhalten Sie einen Überblick darüber, wie Memorystore for Redis-Cluster mithilfe von Replikaten Hochverfügbarkeit bietet. Replikate dienen zwei Zwecken – Hochverfügbarkeit und Lesedurchsatz.

Hochverfügbarkeit

Memorystore for Redis-Cluster bietet Hochverfügbarkeit, da ein primärer Redis-Knoten auf einem oder mehreren Replikatknoten repliziert wird. Wir empfehlen die Verwendung von Hochverfügbarkeitskonfigurationen für Produktionsarbeitslasten.

Änderungen an den Daten des primären Knotens werden mithilfe des asynchronen Replikationsprotokolls von Redes in das Replikat kopiert. Aufgrund der asynchronen Natur der Replikation kann ein Replikat je nach Schreibrate auf dem primären Knoten hinter dem primären Knoten zurückliegen. Wenn die primäre Instanz ausfällt, wird automatisch ein Failover der Instanz auf eines der Replikate durchgeführt. Nach einem Failover werden Anfragen automatisch an die neue primäre Instanz und die neuen Replikate weitergeleitet.

Replikate

Memorystore Cluster for Redis unterstützt Instanzen mit 0, 1 oder 2 Replikaten pro Knoten.

Clusterform mit 0 Replikaten pro Knoten

Eine Memorystore-Cluster für Redis-Instanz ohne Replikate, deren Knoten gleichmäßig auf drei Zonen aufgeteilt werden.

Clusterform mit 1 Replikat pro Knoten

Ein Memorystore-Cluster für Redis-Instanz mit einem Replikat pro Knoten und Knoten gleichmäßig auf drei Zonen aufgeteilt.

Clusterform mit 2 Replikaten pro Knoten

Ein Memorystore-Cluster für Redis-Instanz mit zwei Replikaten pro Knoten und Knoten, die gleichmäßig auf drei Zonen aufgeteilt werden.

Automatische Ausfallsicherung

Ein automatischer Failover tritt auf, wenn der primäre Failover fehlschlägt. In diesem Fall wird ein Replikat zur primären Instanz hochgestuft.

Bei einem Failover können Clientanwendungsbefehle um etwa 30 Sekunden verzögert werden. Befehle werden jedoch nicht verworfen und Verbindungen werden nicht unterbrochen.

Das Wiederholen von vorübergehend blockierten Befehlen kann aufgrund der Auslastung des Dienstes zu zusätzlicher Latenz für die Clientanwendung führen.