Ausfallsicherheit von Anwendungen

Auf dieser Seite finden Sie Details zur Anwendungsresilienz von Google Cloud NetApp Volumes.

Ausfallsicherheit von Anwendungen

NetApp Volumes ist zwar hochverfügbar, aber geplante Wartungsereignisse wie Plattform-, Dienst- oder Softwareupdates oder ungeplante Komponentenausfälle im Dienst können zu kurzen Unterbrechungen bei E/A-Vorgängen (Eingabe/Ausgabe) führen.

E/A-Pausen

Die Clientsoftware für das Network File System (NFS) oder den Server Message Block (SMB) in Ihrem Betriebssystem verarbeitet kurze I/O-Pausen. Der Client wartet und versucht die E/A-Vorgänge noch einmal, ohne das Problem an die Anwendung weiterzuleiten. Solche kurzen Pausen gelten als nicht störend, da die Nutzer der Anwendung zwar längere Reaktionszeiten sehen, die Anwendung aber keine I/O-Fehler meldet.

Bei längeren I/O-Pausen hängt das Verhalten vom NFS- oder SMB-Client Ihres Betriebssystems und von möglichen Zeitüberschreitungen ab, die in der Anwendung konfiguriert sind. In den folgenden Abschnitten werden protokollspezifische Details zu I/O-Pausen erläutert.

NFS-I/O-Pausen

Alle Aufrufe einer nicht verfügbaren, hart bereitgestellten NFS-Freigabe werden im NFS-Client blockiert und warten auf unbestimmte Zeit, bis der NFS-Server wieder antwortet. Während der NFS-Client wartet, werden in den Clientprotokollen Meldungen angezeigt, die darauf hinweisen, dass der NFS-Server nicht antwortet.

Aus Anwendungssicht werden I/O-Vorgänge wie Lesen oder Schreiben blockiert und bleiben ausstehend, bis die NFS-Freigabe erfolgreich zurückgegeben wird. Während E/A-Pausen gehen keine E/A-Vorgänge verloren und NetApp-Volumes sorgen für Datenkonsistenz, es sei denn, Sie beenden ausstehende E/A-Vorgänge auf der Clientseite erzwungen.

Clustersoftwareanwendungen zum Automatisieren von Failovers verwenden

Wenn Sie Clustersoftwareanwendungen wie Pacemaker auf den Client-VMs verwenden, um das Failover Ihrer Anwendung zu automatisieren, konfigurieren Sie die Zeitüberschreitungen für NFS-Freigaben so, dass sie Wartungsereignisse von NetApp-Volumes überstehen. Bei solchen Failovern werden ausstehende E/A-Vorgänge auf dem Client abgebrochen und es kann zu verlorenen Transaktionen kommen. Wir empfehlen folgende Zeitüberschreitungen:

Protokolltyp Empfohlene Zeitüberschreitung Hinweise
NFSv3-Freigaben 60 Sekunden (für die Service-Levels „Standard“, „Premium“ und „Extrem“)
120 Sekunden (für den Service Level „Flex“)
Wir empfehlen die Verwendung einer Begrenzungsmethode, bei der die Bereitstellungsoption nolock verwendet wird, anstatt auf NFS-Sperren zu setzen.
NFSv4.1 105 Sekunden (für die Servicelevels „Standard“, „Premium“ und „Extrem“)
165 Sekunden (für den Servicelevel „Flex“)
Das NFSv4.1-Protokoll fügt automatisch eine zuverlässige Sperrung über NFSv3 hinzu (NFSv4.x RFC, Abschnitt 9.6.2), die Sie als Begrenzungsmechanismus verwenden können. Die Wiederherstellung des Schlossstatus dauert zusätzlich 45 Sekunden.

SMB-Freigabe-E/A-Pausen

Im Gegensatz zu NFS verwenden SMB-Sitzungen eine Verbindung, die ein Zeitlimit haben kann. NetApp-Volumes bleiben in den meisten Fällen unter den Zeitüberschreitungen.

Zeitüberschreitungen für Sitzungen

Die Sitzungsüberschreitung wird auf dem Client festgelegt. Das Standardzeitlimit für Windows-Clients beträgt 60 Sekunden. Sie können den Befehl Get-SmbClientConfiguration/Set-SmbClientConfiguration mit dem Parameter SessionTimeout ausführen, um die Sitzungstimeout zu lesen oder zu ändern.

Wenn eine Sitzungsüberschreitung auftritt, wird die SMB-Sitzung unterbrochen und der Anwendung, die die E/A ausführt, wird ein E/A-Fehler gemeldet. Der Datei-Explorer oder Microsoft 365-Anwendungen stellen in der Regel wieder eine Verbindung her, sobald der Nutzer wieder auf die SMB-Freigabe zugreift. Bei E/A-Fehlern versuchen einige Anwendungen, eine Verbindung herzustellen und den fehlgeschlagenen E/A-Vorgang noch einmal auszuführen, andere nicht. Lesen Sie in der Dokumentation des Anwendungsanbieters nach, wie die Anwendung mit SMB-Zeitüberschreitungen umgeht und wie sie resilient auf SMB-Freigaben zugreifen kann.

CA-Freigaben (Continuous Availability) sind eine SMB3.x-Funktion, die die Failover-Resilienz für datenbankähnliche Anwendungen verbessert. NetApp Volumes unterstützt kontinuierlich verfügbare Freigaben für Microsoft SQL Server und FSLogix.

Die Fehlerwiederherstellung wird mit jeder neuen SMB-Version verbessert. NetApp Volumes unterstützt SMB 2.1, 3.0 und 3.1.1. Verwenden Sie nach Möglichkeit die neueste unterstützte SMB-Version. Windows 10/Server 2016 und höher unterstützen die neueste SMB-Version 3.1.1.

Anwendungsbasierte Vorsichtsmaßnahmen für SMB

Für bestimmte SMB-basierte Anwendungen ist das SMB-transparente Failover erforderlich. Das transparente SMB-Failover ermöglicht Wartungsvorgänge auf SMB-Volumes innerhalb von NetApp-Volumes, ohne die Verbindung zu Serveranwendungen zu unterbrechen, die Daten speichern und darauf zugreifen. NetApp Volumes unterstützt die Option für SMB-Freigaben mit kontinuierlicher Verfügbarkeit, damit bestimmte Anwendungen das SMB-transparente Failover unterstützen. Die Verwendung von SMB-freigegebenen Dateien, die kontinuierlich verfügbar sind, wird nur für die folgenden Arbeitslasten unterstützt:

  • FSLogix-Nutzerprofilcontainer

  • Microsoft SQL Server (kein Linux SQL Server)

Benutzerdefinierte Anwendungen werden von SMB-Freigaben mit kontinuierlicher Verfügbarkeit nicht unterstützt.

Gelegentlich kann es zu geplanten Wartungsereignissen wie Plattform- und Dienstsoftware-Upgrades kommen. Wartungsereignisse gelten aus Sicht eines Dateiprotokolls (NFS oder SMB) als nicht störend, solange die Anwendung die bei diesen Ereignissen auftretenden I/O-Pausen verarbeiten kann.

Bei den Service-Levels „Standard“, „Premium“ und „Extreme“ sind die I/O-Pausen in der Regel kurz und liegen zwischen wenigen Sekunden und 30 Sekunden.

Bei der Flex-Dienstebene können die I/O-Pausen bis zu 70 Sekunden dauern.

Nächste Schritte

Weitere Informationen zu den Sicherheitsanforderungen für Google Cloud NetApp-Volumes