Hochverfügbarkeit und Lesereplikate

Diese Seite bietet einen Überblick über die Hochverfügbarkeit von Memorystore for Redis-Clustern mithilfe von Lesereplikaten. Replikate dienen zwei Zwecken – Hochverfügbarkeit und Lesedurchsatz.

Hochverfügbarkeit

Memorystore for Redis-Cluster bietet Hochverfügbarkeit, da ein primärer Redis-Knoten auf einem oder mehreren Replikatknoten repliziert wird. Wir empfehlen die Verwendung von Hochverfügbarkeitskonfigurationen für Produktionsarbeitslasten.

Änderungen an den Daten des primären Knotens werden mithilfe des asynchronen Replikationsprotokolls von Redes in das Replikat kopiert. Aufgrund der asynchronen Natur der Replikation kann ein Replikat je nach Schreibrate auf dem primären Knoten hinter dem primären Knoten zurückliegen. Wenn die primäre Instanz ausfällt, wird automatisch ein Failover der Instanz auf eines der Replikate durchgeführt. Nach einem Failover werden Anfragen automatisch an die neue primäre Instanz und die neuen Replikate weitergeleitet.

Lesereplikate

Memorystore Cluster for Redis unterstützt Instanzen mit 0, 1 oder 2 Lesereplikaten pro Knoten.

Clusterform mit 0 Lesereplikaten pro Knoten

Ein Memorystore-Cluster für Redis-Instanz ohne Lesereplikate und Knoten, gleichmäßig auf drei Zonen aufgeteilt.

Clusterform mit 1 Lesereplikat pro Knoten

Ein Memorystore-Cluster für Redis-Instanz mit einem Lesereplikat pro Knoten und Knoten, die gleichmäßig auf drei Zonen aufgeteilt werden.

Clusterform mit 2 Lesereplikaten pro Knoten

Ein Memorystore-Cluster für Redis-Instanz mit zwei Lesereplikaten pro Knoten und Knoten, die gleichmäßig auf drei Zonen aufgeteilt werden.

Automatische Ausfallsicherung

Ein automatischer Failover tritt auf, wenn der primäre Failover fehlschlägt. In diesem Fall wird ein Replikat zur primären Instanz hochgestuft.

Bei einem Failover können Clientanwendungsbefehle um etwa 30 Sekunden verzögert werden. Befehle werden jedoch nicht verworfen und Verbindungen werden nicht unterbrochen.

Das Wiederholen von vorübergehend blockierten Befehlen kann aufgrund der Auslastung des Dienstes zu zusätzlicher Latenz für die Clientanwendung führen.