Considerações sobre a resiliência das aplicações

Esta página fornece detalhes sobre a resiliência da aplicação Google Cloud NetApp Volumes.

Considerações sobre a resiliência das aplicações

Embora o NetApp Volumes esteja altamente disponível, os eventos de manutenção planeada, como atualizações da plataforma, atualizações de serviços, atualizações de software ou falhas de componentes não planeadas no serviço, podem levar a breves pausas nas operações de entrada e saída (E/S).

Pausas de E/S

O software cliente do Sistema de Arquivos de Rede (NFS) ou do bloco de mensagens do servidor (SMB) no interior do seu sistema operativo processa pausas curtas de E/S. O cliente aguarda e tenta novamente as operações de I/O sem apresentar o problema à aplicação. Essas pausas curtas são consideradas não disruptivas porque, embora os utilizadores da aplicação possam ver tempos de resposta mais longos, a aplicação não comunica erros de E/S.

Para pausas de E/S mais longas, o comportamento depende do cliente NFS ou SMB do seu sistema operativo e dos potenciais limites de tempo configurados na aplicação. As secções seguintes abordam detalhes específicos do protocolo para pausas de E/S.

Pausas de E/S de NFS

Todas as chamadas para uma partilha NFS montada de forma rígida e indisponível são bloqueadas no cliente NFS e aguardam indefinidamente até o servidor NFS responder novamente. Enquanto o cliente NFS aguarda, aparecem mensagens nos registos do cliente que indicam que o servidor NFS não está a responder.

Do ponto de vista da aplicação, as operações de I/O, como leitura ou escrita, são bloqueadas e permanecem pendentes até que a partilha do NFS seja devolvida com êxito. Durante as pausas de I/O, nenhuma operação de I/O é perdida e os volumes NetApp garantem a consistência dos dados, a menos que pare forçosamente as operações de I/O pendentes do lado do cliente.

Use aplicações de software de cluster para automatizar as comutações por falha

Se usar aplicações de software de cluster, como o Pacemaker, nas VMs do cliente para automatizar a comutação por falha da sua aplicação, configure os limites de tempo para partilhas NFS de modo a resistir a eventos de manutenção de volumes NetApp. Essas comutações por falha anulam as operações de I/O pendentes no cliente e podem resultar em transações perdidas. Recomendamos os seguintes limites de tempo:

Tipo de protocolo Tempo limite recomendado Notas
Partilhas NFSv3 60 segundos (para os níveis de serviço Standard, Premium e Extreme)
120 segundos (para o nível de serviço Flex)
Recomendamos que use um método de vedação, que usa a opção de montagem nolock, em vez de depender de bloqueios NFS.
NFSv4.1 105 segundos (para os níveis de serviço Standard, Premium e Extreme)
165 segundos (para o nível de serviço Flex)
O protocolo NFSv4.1 adiciona automaticamente um bloqueio fiável sobre o NFSv3 (RFC NFSv4.x, secção 9.6.2), que pode usar como um mecanismo de vedação. A recuperação do estado de bloqueio adiciona 45 segundos.

Pausas de E/S de partilha do SMB

Ao contrário do NFS, as sessões SMB usam uma ligação que pode expirar. Na maioria dos casos, os volumes do NetApp permanecem abaixo dos limites de tempo.

Limites de tempo da sessão

O tempo limite da sessão é definido no cliente. O limite de tempo predefinido para clientes Windows é de 60 segundos. Pode executar o comando Get-SmbClientConfiguration/Set-SmbClientConfiguration usando o parâmetro SessionTimeout para ler ou alterar o limite de tempo da sessão.

Se ocorrer um limite de tempo da sessão, a sessão SMB é interrompida e é comunicado um erro de E/S à aplicação que está a fazer a E/S. O Explorador de ficheiros ou as aplicações do Microsoft 365 normalmente voltam a ligar-se assim que o utilizador acede novamente à partilha SMB. Quando ocorrem erros de E/S, algumas aplicações tentam restabelecer a ligação e repetir a operação de E/S com falha, enquanto outras não o fazem. Consulte a documentação do fornecedor da aplicação para saber como a aplicação processa os limites de tempo do SMB e pode funcionar de forma resiliente em partilhas SMB.

As partilhas continuamente disponíveis (CA) são uma funcionalidade do SMB3.x que melhora a resiliência da comutação por falha para aplicações semelhantes a bases de dados. Os volumes NetApp suportam partilhas disponíveis continuamente para o Microsoft SQL Server e o FSLogix.

A recuperação de falhas melhora com cada nova versão do SMB. Os volumes NetApp suportam SMB 2.1, 3.0 e 3.1.1. Se possível, use a versão SMB mais recente suportada. O Windows 10/Server 2016 e versões posteriores suportam a versão 3.1.1 mais recente do SMB.

Precauções baseadas em aplicações para PMEs

Determinadas aplicações baseadas em SMB requerem a funcionalidade de comutação em alternativa transparente de SMB. A funcionalidade de comutação em caso de falha transparente do SMB permite operações de manutenção em volumes SMB nos volumes NetApp sem interromper a conetividade com aplicações de servidor que armazenam e acedem a dados. Os volumes NetApp suportam a opção de partilhas SMB continuamente disponíveis para garantir que aplicações específicas suportam a comutação em caso de falha transparente do SMB. A utilização de partilhas disponíveis continuamente de SMB suporta apenas as seguintes cargas de trabalho:

  • Contentores de perfis de utilizadores do FSLogix

  • Microsoft SQL Server (não Linux SQL Server)

As partilhas SMB disponíveis continuamente não suportam aplicações personalizadas.

Os eventos de manutenção planeados, como as atualizações da plataforma e as atualizações do software de serviço, podem ocorrer ocasionalmente. Os eventos de manutenção são considerados não disruptivos do ponto de vista de um protocolo de ficheiros (NFS ou SMB), desde que a aplicação consiga processar as pausas de E/S que possam ocorrer durante estes eventos.

Para os níveis de serviço Standard, Premium e Extreme, as pausas de E/S são normalmente curtas e variam entre alguns segundos e 30 segundos.

Para o nível de serviço Flex, as pausas de E/S podem durar até 70 segundos.

O que se segue?

Leia acerca das considerações de segurança do Google Cloud NetApp Volumes.