Consideraciones sobre la resiliencia de la aplicación

En esta página, se proporcionan detalles sobre la resiliencia de las aplicaciones de Google Cloud NetApp Volumes.

Consideraciones sobre la resiliencia de la aplicación

Si bien NetApp Volumes tiene alta disponibilidad, los eventos de mantenimiento planificados, como las actualizaciones de plataforma, las actualizaciones de servicio, las actualizaciones de software o las fallas de componentes no planificadas en el servicio, pueden provocar breves pausas en las operaciones de entrada y salida (E/S).

Pausas de E/S

El software cliente del sistema de archivos de red (NFS) o el bloque de mensajes del servidor (SMB) dentro de tu sistema operativo controla las pausas de E/S cortas. El cliente espera y vuelve a intentar las operaciones de E/S sin informar el problema a la aplicación. Estas pausas breves se consideran no disruptivas porque, si bien los usuarios de la aplicación pueden ver tiempos de respuesta más largos, la aplicación no informa errores de E/S.

En el caso de las pausas de E/S más largas, el comportamiento depende del cliente NFS o SMB del sistema operativo y de los posibles tiempos de espera configurados en la aplicación. En las siguientes secciones, se analizan los detalles específicos del protocolo para las pausas de E/S.

Pausas de E/S de NFS

Todas las llamadas a un recurso compartido de NFS activado de forma permanente y no disponible se bloquean en el cliente de NFS y esperan indefinidamente hasta que el servidor NFS vuelva a responder. Mientras el cliente NFS espera, aparecen mensajes en los registros del cliente que indican que el servidor NFS no responde.

Desde la perspectiva de la aplicación, las operaciones de E/S, como la lectura o la escritura, se bloquean y permanecen pendientes hasta que se muestra correctamente el recurso compartido de NFS. Durante las pausas de E/S, no se pierde ninguna operación de E/S, y NetApp Volumes garantiza la coherencia de los datos, a menos que detengas de forma forzosa las operaciones de E/S pendientes en el lado del cliente.

Usa aplicaciones de software de clústeres para automatizar las conmutaciones por error

Si usas aplicaciones de software de clúster, como Pacemaker, en las VMs cliente para automatizar el resguardo de tu aplicación, configura los tiempos de espera de los archivos compartidos de NFS para que resistan los eventos de mantenimiento de los volúmenes de NetApp. Estas conmutaciones por error abortan las operaciones de E/S pendientes en el cliente y pueden provocar la pérdida de transacciones. Te recomendamos los siguientes tiempos de espera:

Tipo de protocolo Tiempo de espera recomendado Notas
Recursos compartidos de NFSv3 60 segundos (para los niveles de servicio Estándar, Premium y Extreme)
120 segundos (para el nivel de servicio Flex)
Te recomendamos que uses un método de protección, que usa la opción de activación nolock en lugar de depender de los bloqueos de NFS.
NFSv4.1 105 segundos (para los niveles de servicio Standard, Premium y Extreme)
165 segundos (para el nivel de servicio Flex)
El protocolo NFSv4.1 agrega automáticamente bloqueos confiables sobre NFSv3 (RFC de NFSv4.x, sección 9.6.2), que puedes usar como mecanismo de protección. La recuperación del estado de bloqueo agrega 45 segundos adicionales.

Pausas de E/S de los recursos compartidos de SMB

A diferencia de NFS, las sesiones de SMB usan una conexión que puede agotar el tiempo de espera. NetApp Volumes se mantiene por debajo de los tiempos de espera en la mayoría de los casos.

Tiempos de espera de las sesiones

El tiempo de espera de la sesión se define en el cliente. El tiempo de espera predeterminado para los clientes de Windows es de 60 segundos. Puedes ejecutar el comando Get-SmbClientConfiguration/Set-SmbClientConfiguration con el parámetro SessionTimeout para leer o cambiar el tiempo de espera de la sesión.

Si se produce un tiempo de espera de la sesión, esta se interrumpe y se informa un error de E/S a la aplicación que realiza la E/S. Por lo general, las aplicaciones del Explorador de archivos o Microsoft 365 se vuelven a conectar en cuanto el usuario vuelve a acceder al recurso compartido SMB. Cuando se producen errores de E/S, algunas aplicaciones intentan volver a conectarse y reintentar la operación de E/S fallida, mientras que otras no. Consulta la documentación del proveedor de la aplicación para obtener información sobre cómo la aplicación controla los tiempos de espera de SMB y puede funcionar de manera resiliente en los recursos compartidos de SMB.

Los recursos compartidos de disponibilidad continua (CA) son una función de SMB3.x que mejora la resiliencia de la conmutación por error para aplicaciones similares a bases de datos. NetApp Volumes admite recursos compartidos de disponibilidad continua para Microsoft SQL Server y FSLogix.

La recuperación de fallas mejora con cada versión nueva de SMB. NetApp Volumes admite SMB 2.1, 3.0 y 3.1.1. Si es posible, usa la versión más reciente de SMB compatible. Windows 10/Server 2016 y versiones posteriores admiten la versión más reciente de SMB 3.1.1.

Precauciones basadas en la aplicación de las pymes

Algunas aplicaciones basadas en pymes requieren la conmutación por error transparente de SMB. La conmutación por error transparente de SMB permite operaciones de mantenimiento en volúmenes SMB dentro de NetApp Volumes sin interrumpir la conectividad a las aplicaciones de servidor que almacenan y acceden a los datos. NetApp Volumes admite la opción de recursos compartidos de disponibilidad continua de SMB para garantizar que aplicaciones específicas admitan la conmutación por error transparente de SMB. El uso de recursos compartidos de disponibilidad continua de SMB solo admite las siguientes cargas de trabajo:

  • Contenedores de perfiles de usuario de FSLogix

  • Microsoft SQL Server (no Linux SQL Server)

Los recursos compartidos de disponibilidad continua de SMB no admiten aplicaciones personalizadas.

En ocasiones, pueden ocurrir eventos de mantenimiento planificados, como actualizaciones de la plataforma y del software de servicio. Los eventos de mantenimiento se consideran no disruptivos desde la perspectiva de un protocolo de archivos (NFS o SMB), siempre y cuando la aplicación pueda controlar las pausas de E/S que puedan ocurrir durante estos eventos.

En el caso de los niveles de servicio Standard, Premium y Extreme, las pausas de E/S suelen ser breves y varían de unos pocos segundos a 30 segundos.

En el nivel de servicio Flex, las pausas de E/S pueden ser de hasta 70 segundos.

¿Qué sigue?

Obtén información sobre las consideraciones de seguridad de Google Cloud NetApp Volumes.