应用弹性注意事项

本页详细介绍了 Google Cloud NetApp Volumes 应用弹性。

应用弹性注意事项

虽然 NetApp Volumes 具有高可用性,但平台更新、服务升级、软件升级或服务中的非预期组件故障等计划内维护事件可能会导致输入和输出 (I/O) 操作短暂暂停。

I/O 暂停

操作系统中的网络文件系统 (NFS) 或服务器消息块 (SMB) 客户端软件会处理短暂的 I/O 暂停。客户端会等待并重试 I/O 操作,而不会将问题提交给应用。此类短暂暂停被视为不会造成干扰,因为虽然应用的用户可能会看到较长的响应时间,但应用不会报告 I/O 错误。

对于较长的 I/O 暂停,行为取决于操作系统的 NFS 或 SMB 客户端以及应用中配置的潜在超时。以下各部分将讨论 I/O 暂停的协议专用详细信息。

NFS I/O 暂停

对不可用的硬装载 NFS 共享的所有调用都会在 NFS 客户端中被阻塞,并会无限期等待 NFS 服务器再次响应。在 NFS 客户端等待期间,客户端日志中会显示消息,指示 NFS 服务器未响应。

从应用角度来看,读取或写入等 I/O 操作会被阻塞,并会一直处于待处理状态,直到 NFS 共享成功返回为止。在 I/O 暂停期间,除非您在客户端强制停止未完成的 I/O 操作,否则不会丢失任何 I/O 操作,并且 NetApp 卷会确保数据一致性。

使用集群软件应用自动进行故障切换

如果您在客户端虚拟机上使用集群软件应用(例如 Pacemaker)来自动进行应用故障转移,请为 NFS 共享配置超时,以应对 NetApp 卷维护事件。此类故障转移会中止客户端上的未完成 I/O 操作,并可能导致交易丢失。我们建议您设置以下超时:

协议类型 建议的超时时间 备注
NFSv3 共享 60 秒(适用于标准、高级和极速服务等级)
120 秒(适用于灵活服务等级)
我们建议您使用围栏方法,该方法使用 nolock 挂载选项,而不是依赖于 NFS 锁。
NFSv4.1 105 秒(适用于标准、高级和极致服务等级)
165 秒(适用于灵活服务等级)
NFSv4.1 协议会自动在 NFSv3 上添加可靠锁定(NFSv4.x RFC,第 9.6.2 节),您可以将其用作隔离机制。 锁定状态恢复会额外增加 45 秒。

SMB 共享 I/O 暂停

与 NFS 不同,SMB 会话使用可能会超时的连接。在大多数情况下,NetApp Volumes 不会超时。

会话超时

在客户端定义的会话超时。Windows 客户端的默认超时时间为 60 秒。您可以使用 SessionTimeout 参数运行 Get-SmbClientConfiguration/Set-SmbClientConfiguration 命令,以读取或更改会话超时设置。

如果发生会话超时,SMB 会话会中断,并向执行 I/O 的应用报告 I/O 错误。通常,只要用户再次访问 SMB 共享,文件资源管理器或 Microsoft 365 应用就会立即重新连接。遇到 I/O 错误时,某些应用会尝试重新连接并重试失败的 I/O 操作,而其他应用则不会。请参阅应用供应商的文档,了解应用如何处理 SMB 超时,以及如何在 SMB 共享上弹性运行。

持续可用 (CA) 共享是 SMB3.x 的一项功能,可提高类似数据库的应用的故障切换弹性。NetApp Volumes 支持为 Microsoft SQL Server 和 FSLogix 创建持续可用的共享。

随着每个新 SMB 版本的发布,失败恢复功能都会得到改进。NetApp Volumes 支持 SMB 2.1、3.0 和 3.1.1。请尽可能使用最新的受支持 SMB 版本。Windows 10/Server 2016 及更高版本支持最新的 SMB 版本 3.1.1。

基于 SMB 应用的注意事项

某些基于 SMB 的应用需要 SMB 透明故障切换。SMB 透明故障切换可让您在 NetApp Volumes 中的 SMB 卷上执行维护操作,而不会与存储和访问数据的服务器应用中断连接。NetApp Volumes 支持 SMB 持续可用共享选项,以确保特定应用支持 SMB 透明故障切换。使用 SMB 持续可用共享仅支持以下工作负载:

  • FSLogix 用户个人资料容器

  • Microsoft SQL Server(而非 Linux SQL Server)

SMB 持续可用共享不支持自定义应用。

计划内的维护事件(例如平台升级和服务软件升级)可能会偶尔发生。从文件协议(NFS 或 SMB)的角度来看,只要应用能够处理这些事件期间可能发生的 I/O 暂停,维护事件就被视为非干扰性事件。

对于“标准”“高级”和“极致”服务等级,I/O 暂停时间通常较短,介于几秒到 30 秒之间。

对于“灵活”服务等级,I/O 暂停时间最多可达 70 秒。

后续步骤

了解 Google Cloud NetApp Volumes 的安全注意事项