Testar e otimizar o desempenho da instância

Esta página descreve o desempenho médio esperado e as configurações de desempenho recomendadas para o Filestore. Ela também mostra como testar o desempenho das instâncias do Filestore.

Desempenho esperado

Cada nível de serviço do Filestore fornece um nível diferente de desempenho. O desempenho de qualquer instância pode variar dos números esperados devido a vários fatores, como o uso de armazenamento em cache, o número de VMs clientes, o tipo de máquina das VMs de clientes e a carga de trabalho testada.

As tabelas a seguir mostram o desempenho esperado das instâncias do Filestore com base no nível de serviço e na capacidade configurada:

Desempenho Capacidade (TiB) IOPS de leitura/gravação Capacidade de leitura/gravação (MiB/s)
BASIC_HDD 1–10 600/1.000 100/100
BASIC_HDD 10–63,9 1.000/5.000 180/120
BASIC_SSD 2,5–63,9 60.000/25.000 1.200/350
ZONAL (por zona, banda de baixa capacidade) 1 9.200/2.600 260/88
ZONAL (por zona, banda de baixa capacidade) 9,75 89.700/25.350 2.535/858
HIGH_SCALE_SSD (agora zonal, banda de alta capacidade) 10 92.000/26.000 2.600/880
HIGH_SCALE_SSD (agora zonal, banda de alta capacidade) 100 920.000/260.000 26.000/8.800
ENTERPRISE 1 12.000/4.000 120/100
ENTERPRISE 10 120.000/40.000 1.200/1.000

A tabela acima mostra o desempenho esperado nas capacidades máxima e mínima para o nível zonal com uma banda de capacidade mais alta (anteriormente SSD de alta escala) e o nível empresarial. Entre esses limites, o desempenho é escalonado linearmente à medida que as capacidades aumentam. Por exemplo, se você dobrar a capacidade da instância empresarial de 1 TiB para 2 TiB, o desempenho esperado da instância vai dobrar de 12.000/4.000 IOPS de leitura/gravação para 24.000/8.000 IOPS de leitura/gravação.

Em cenários de cliente único e de poucos clientes, é preciso aumentar o número de conexões TCP com a opção de ativação nconnect para atingir o desempenho máximo do NFS. Recomendamos especificar até conexões 7 para o nível de serviço zonal e até 2 para o nível empresarial. Em geral, quanto maior a capacidade de compartilhamento de arquivos e menor a conexão de VMs de clientes, melhor será o desempenho ao especificar mais conexões com nconnect.

Tipo de máquina de cliente recomendado

Recomendamos ter um tipo de máquina do Compute Engine, como n2-standard-8, que forneça uma largura de banda de saída de 16 Gbps. Essa largura de banda de saída permite que o cliente atinja uma largura de banda de leitura de aproximadamente 16 Gbps para cargas de trabalho compatíveis com cache. Para mais contexto, consulte Largura de banda da rede.

Opções de ativação do cliente Linux

Recomendamos o uso das seguintes opções de montagem NFS, especialmente hard, async e rsize e wsize, para alcançar o melhor desempenho nas instâncias de VM do cliente Linux. Para mais informações sobre as opções de montagem do NFS, consulte nfs.

Opção padrão Descrição
hard O cliente NFS repete solicitações NFS indefinidamente.
timeo=600 O cliente NFS aguarda 600 segundos (60 segundos) antes de tentar novamente uma solicitação NFS.
retrans=3 O cliente NFS tenta fazer solicitações NFS três vezes antes de realizar outras ações de recuperação.
rsize=262144 O cliente NFS pode receber no máximo 262.144 bytes do servidor NFS por solicitação READ.
Observação: para instâncias de nível básico, defina o valor de rsize como 1048576.
wsize=1048576 O cliente NFS pode enviar no máximo 1.048.576 bytes (1 MiB) para o servidor NFS por solicitação WRITE.
resvport O cliente NFS usa uma porta de origem com privilégios ao se comunicar com o servidor NFS para esse ponto de montagem.
async O cliente NFS atrasa o envio de gravações de aplicativos para o servidor NFS até que determinadas condições sejam atendidas.
Cuidado: o uso da opção sync reduz significativamente o desempenho.

Desempenho de VM de um único e vários clientes

Os níveis de serviço escalonáveis do Filestore são otimizados para desempenho para várias VMs de clientes, e não para uma única VM cliente.

Para instâncias empresariais e de nível zonal, pelo menos quatro VMs de cliente são necessárias para aproveitar o desempenho total. Isso garante que todas as VMs no cluster do Filestore de base sejam utilizadas por completo.

Para maior contexto, o menor cluster escalonável do Filestore tem quatro VMs. Cada VM cliente se comunica com apenas uma VM de cluster do Filestore, independentemente do número de conexões NFS por cliente especificado usando a opção de ativação nconnect. Se você estiver usando uma única VM do cliente, as operações de leitura e gravação serão executadas apenas em uma única VM de cluster do Filestore.

Melhorar o desempenho nos recursos do Google Cloud

As operações em vários recursos do Google Cloud, como a cópia de dados do Cloud Storage para uma instância do Filestore usando gsutil, podem ser lentas. Para ajudar a reduzir os problemas de desempenho, tente o seguinte:

  • Verifique se o bucket do Cloud Storage, a VM do cliente e a instância do Filestore estão na mesma região.

    Regiões birregionais oferecem uma opção de desempenho máximo para dados armazenados no Cloud Storage. Ao usar essa opção, verifique se os outros recursos residem em uma das regiões únicas que compõem a região birregional. Por exemplo, se os dados do Cloud Storage estão em us-central1,us-west1, verifique se a VM do cliente e a instância do Filestore estão em us-central1.

  • Como ponto de referência, verifique o desempenho de uma VM anexada ao DP e compare o desempenho de uma instância do Filestore.

    • Se a VM anexada ao DP tiver um desempenho semelhante ou mais lento em comparação com a instância do Filestore, isso poderá indicar um gargalo de desempenho não relacionado ao Filestore. Tente o seguinte para melhorar o desempenho do valor de referência dos seus recursos que não são do Filestore:

      • Aplique a opção gsutil -m. Essa opção permite que as operações compatíveis, incluindo cp, mv e rsync, sejam executadas em paralelo.

      • Aplique as seguintes configurações de gsutil. Cada um é um boto valores de configuração mutáveis definidos no botoarquivo de configuração. Os usuários podem modificar o arquivo diretamente (recomendado) ou usando a opção -o:

    • Se o desempenho da instância do Filestore for substancialmente mais lento que a VM anexada ao DP, tente distribuir a operação em várias VMs.

      • Isso ajuda a melhorar o desempenho das operações de leitura do Cloud Storage.

      • Para instâncias empresariais e de nível zonal, pelo menos quatro VMs de cliente são necessárias para aproveitar o desempenho total. Isso garante que todas as VMs no cluster subjacente do Filestore sejam totalmente utilizadas. Para mais informações, consulte Desempenho da VM de um e vários clientes.

Como testar o desempenho

Se estiver usando o Linux, utilize a ferramenta fio (em inglês) para comparar as capacidades de leitura e gravação e o IOPS para instâncias de nível básico. Esse método para comparar o desempenho não é recomendado para instâncias de nível empresarial e zonal.

Os exemplos nesta seção mostram comparativos comuns que é possível executar. Para garantir o melhor desempenho, pode ser necessário executar a ferramenta fio de várias instâncias de VM do cliente.

O exemplo a seguir compara a capacidade máxima de gravação:

fio --ioengine=libaio --filesize=32G --ramp_time=2s \
--runtime=5m --numjobs=16 --direct=1 --verify=0 --randrepeat=0 \
--group_reporting --directory=/mnt/nfs  \
--name=write --blocksize=1m --iodepth=64 --readwrite=write

O exemplo a seguir compara a IOPS máxima de gravação:

fio --ioengine=libaio --filesize=32G --ramp_time=2s \
--runtime=5m --numjobs=16 --direct=1 --verify=0 --randrepeat=0 \
--group_reporting --directory=/mnt/nfs  \
--name=randwrite --blocksize=4k --iodepth=256 --readwrite=randwrite

O exemplo a seguir compara as capacidades máximas de leitura:

fio --ioengine=libaio --filesize=32G --ramp_time=2s \
--runtime=5m --numjobs=16 --direct=1 --verify=0 --randrepeat=0 \
--group_reporting --directory=/mnt/nfs  \
--name=read --blocksize=1m --iodepth=64 --readwrite=read

O exemplo a seguir compara a IOPS máxima de leitura:

fio --ioengine=libaio --filesize=32G --ramp_time=2s \
--runtime=5m --numjobs=16 --direct=1 --verify=0 --randrepeat=0 \
--group_reporting --directory=/mnt/nfs  \
--name=randread --blocksize=4k --iodepth=256 --readwrite=randread

A seguir