Veja neste documento do Framework da arquitetura do Google Cloud recomendações para otimizar o desempenho dos seus recursos de rede e APIs no Google Cloud.
Níveis de serviço de rede
Os níveis de serviço de rede permitem otimizar o custo de rede e o desempenho das suas cargas de trabalho. Escolha um destes níveis:
- O nível Premium usa o backbone global altamente confiável do Google para ajudar você a conseguir latência e perda de pacotes mínimas. O tráfego entra e sai da rede do Google em um ponto de presença (PoP, na sigla em inglês) de borda global próximo do usuário final. Recomendamos o uso do nível Premium como padrão para um desempenho ideal. O nível Premium oferece suporte a endereços IP externos regionais e globais para VMs e balanceadores de carga.
- O nível Standard está disponível apenas para recursos que usam endereços IP externos regionais. O tráfego entra e sai da rede do Google em um PoP de borda mais próximo do local do Google Cloud em que a carga de trabalho é executada. O preço do nível Standard é menor que o do nível Premium. O nível Standard é adequado para tráfego que não é sensível à perda de pacotes e que não tem requisitos de baixa latência.
Você pode ver a latência da rede dos níveis Standard e Premium de cada região da nuvem no Painel de desempenho do Network Intelligence Center.
Quadros enormes
As redes de nuvem privada virtual (VPC) têm uma
unidade máxima de transmissão
(MTU)
padrão de 1460 bytes. No entanto, é possível configurar as redes VPC para que sejam compatíveis com uma MTU de até 8896
(frames jumbo).
Com uma MTU mais alta, a rede precisa de menos pacotes para enviar a mesma quantidade de dados, reduzindo assim a largura de banda usada pelos cabeçalhos TCP/IP. Isso leva a uma largura de banda efetiva maior para a rede.
Para mais informações sobre a MTU intraVPC e a MTU máxima de outras conexões, consulte a página Unidade máxima de transmissão na documentação da VPC.
Desempenho da VM
As VMs do Compute Engine têm uma largura de banda de saída máxima que, em parte, depende do tipo de máquina. Um aspecto da escolha de um tipo de máquina apropriado é considerar a quantidade de tráfego que você espera que a VM gere.
A página Largura de banda da rede contém uma discussão e uma tabela de larguras de banda de rede para os tipos de máquina do Compute Engine.
Se os requisitos de largura de banda entre VMs forem muito altos, considere as VMs compatíveis com a rede Tier_1.
Cloud Load Balancing
Veja nesta seção as práticas recomendadas para otimizar o desempenho das instâncias do Cloud Load Balancing.
Implantar aplicativos perto dos usuários
Provisione os back-ends do seu aplicativo perto do local em que você espera que o tráfego de usuários chegue ao balanceador de carga. Quanto mais próximos os usuários ou aplicativos de clientes estiverem dos servidores de carga de trabalho, menor será a latência da rede entre os usuários e a carga de trabalho. Para minimizar a latência de clientes em diferentes partes do mundo, pode ser necessário implantar os back-ends em várias regiões. Saiba mais em Práticas recomendadas para a seleção de regiões do Compute Engine.
Escolher um tipo de balanceador de carga adequado
O tipo de balanceador de carga escolhido para o aplicativo pode determinar a latência que os usuários enfrentam. Saiba como avaliar e otimizar a latência do aplicativo para diferentes tipos de balanceador de carga em Otimizar a latência do aplicativo com balanceamento de carga.
Ativar o armazenamento em cache
Para acelerar a disponibilização de conteúdo, ative o armazenamento em cache e o Cloud CDN como parte da configuração padrão do balanceador de carga HTTP externo. Verifique se os servidores de back-end estão configurados para enviar os cabeçalhos de resposta necessários para que as respostas estáticas sejam armazenadas em cache.
Usar HTTP quando HTTPS não for necessário
O Google criptografa automaticamente o tráfego entre balanceadores de carga de proxy e back-ends no nível do pacote. A criptografia no nível do pacote adiciona a criptografia da camada 7 usando HTTPS entre o balanceador de carga e os back-ends Considere usar HTTP em vez de HTTPS ou HTTP/2 para o tráfego entre o balanceador de carga e os back-ends. Ao usar HTTP, também é possível reduzir o uso da CPU das VMs de back-end. No entanto, quando o back-end for um grupo de endpoints de rede (NEG, na sigla em inglês) da Internet, use HTTPS ou HTTP/2 para o tráfego entre o balanceador de carga e o back-end. Isso ajuda a garantir o tráfego seguro na Internet pública. Para um melhor desempenho, recomendamos comparar os padrões de tráfego do aplicativo.
Network Intelligence Center
O Network Intelligence Center do Google Cloud fornece uma visão abrangente do desempenho da rede do Google Cloud em todas as regiões. O Network Intelligence Center ajuda a determinar se os problemas de latência são causados por problemas no projeto ou na rede. Também é possível usar essas informações para selecionar as regiões e zonas em que você precisa implantar suas cargas de trabalho para otimizar o desempenho da rede.
Use as seguintes ferramentas do Network Intelligence Center para monitorar e analisar o desempenho da rede das suas cargas de trabalho no Google Cloud:
O Painel de desempenho mostra a latência entre as regiões do Google Cloud e entre regiões e locais individuais na Internet. O Painel de desempenho pode ajudar a determinar onde colocar cargas de trabalho para a melhor latência e determinar quando um problema do aplicativo pode ocorrer devido a problemas de rede subjacentes.
A Topologia de rede oferece um panorama visual das redes de nuvem privada virtual (VPC), da conectividade híbrida com as redes no local e da conectividade com os serviços gerenciados pelo Google. A Topologia de rede fornece métricas operacionais em tempo real que podem ser usadas para analisar e entender o desempenho da rede e identificar padrões de tráfego anormais.
O Network Analyzer é uma ferramenta automática de monitoramento e diagnóstico de configurações. Ele verifica as configurações de rede VPC em regras de firewall, rotas, dependências de configuração e conectividade de serviços e aplicativos. Também ajuda a identificar falhas de rede, além de fornecer análises de causas raiz e recomendações. O Network Analyzer traz insights prioritários para analisar problemas com a configuração da rede, como a alta utilização de endereços IP em uma sub-rede.
Gateway de API e Apigee
Veja nesta seção algumas recomendações para otimizar o desempenho das APIs que você implanta no Google Cloud usando o Gateway de API e a Apigee.
O Gateway de API permite criar e gerenciar APIs para back-ends sem servidor do Google Cloud, incluindo funções do Cloud Run, Cloud Run e App Engine. Esses serviços são gerenciados e são escalonados automaticamente. No entanto, conforme os aplicativos implantados nesses serviços são escalonados, pode ser necessário aumentar as cotas e limitações de taxa para o Gateway de API.
A Apigee fornece os seguintes painéis de análise para ajudar você a monitorar o desempenho das APIs gerenciadas:
- Painel de desempenho do proxy de API: monitore os padrões de tráfego e os tempos de processamento do proxy de API.
- Painel de desempenho do destino: visualize padrões de tráfego e métricas de desempenho em destinos de back-end do proxy de API.
- Painel de desempenho do cache: monitore as métricas de desempenho do cache da Apigee, como a taxa média de ocorrência em cache e o tempo médio no cache.
Se você usar a integração com a Apigee, considere os limites de configuração do sistema ao criar e gerenciar suas integrações.
A seguir
Confira as práticas recomendadas para otimizar o desempenho dos recursos de computação, armazenamento, banco de dados e análise:
- Otimize o desempenho da computação.
- Otimize o desempenho do armazenamento.
- Otimize o desempenho do banco de dados.
- Otimizar o desempenho da análise.