Gerenciar capacidade e cota

Last reviewed 2023-08-21 UTC

Este documento no Framework da arquitetura do Google Cloud mostra como avaliar e planejar sua capacidade e cota na nuvem.

Em data centers convencionais, você costuma gastar períodos todo trimestre analisando os requisitos de recursos atuais e prevendo os futuros. Pense em questões físicas, logísticas e relacionadas a recursos humanos. Preocupações como espaço em rack, resfriamento, eletricidade, largura de banda, cabeamento, tempos de compras, tempos de envio e quantos engenheiros estão disponíveis para a instalação de racks e pilhas de novos equipamentos precisam ser considerados. Também é preciso gerenciar ativamente a capacidade e as distribuições de carga de trabalho para que os jobs com uso intensivo de recursos, como os pipelines do Hadoop, não interfiram com os serviços, como servidores da Web, que precisam ser altamente disponíveis.

Por outro lado, ao usar o Google Cloud, você concede a maior parte do planejamento de capacidade ao Google. Usar a nuvem significa que você não precisa provisionar e manter recursos inativos quando eles não forem necessários. Por exemplo, é possível criar, escalonar verticalmente e reduzir instâncias da VM conforme necessário. Como a cobrança é feita pelo que usa, é possível otimizar os gastos, incluindo o excesso de capacidade necessária apenas nos picos de tráfego. Para ajudar você a economizar, o Compute Engine fornecerá recomendações de tipo de máquina se detectar que você usou instâncias de VM subutilizadas que podem ser redimensionadas ou excluídas.

Avaliar os requisitos da capacidade da nuvem

Para gerenciar sua capacidade com eficiência, você precisa conhecer os requisitos de capacidade da sua organização.

Para avaliar os requisitos de capacidade, comece identificando suas principais cargas de trabalho na nuvem. Avalie o uso médio e máximo dessas cargas de trabalho e as necessidades de capacidade atuais e futuras delas.

Identifique as equipes que usam essas cargas de trabalho principais. Trabalhe com eles para estabelecer um processo de planejamento da demanda interna. Use esse processo para entender as necessidades atuais e previstas de recursos da nuvem.

Analise o padrão de carga e a distribuição de chamadas. Use fatores como os últimos 30 dias de pico, por hora e por minuto na análise.

Use o Cloud Monitoring para ver o desempenho, o tempo de atividade e a integridade geral dos aplicativos e da sua infraestrutura.

Veja suas métricas de utilização da infraestrutura

Para facilitar o planejamento da capacidade, colete e armazene dados históricos sobre o uso dos recursos da nuvem pela sua organização.

Verifique as métricas de utilização da infraestrutura. Por exemplo, para as principais cargas de trabalho, avalie o seguinte:

  • Uso médio e máximo
  • Picos em padrões de uso
  • Picos sazonais com base nos requisitos de negócios, como períodos de festas de fim de ano para varejistas
  • Quanto do provisionamento em excesso é necessário para preparar os eventos de pico e lidar rapidamente com possíveis picos de tráfego

Verifique se sua organização configurou alertas para receber notificações automaticamente quando você estiver perto de atingir as limitações de cota e capacidade.

Use as ferramentas de monitoramento do Google para ter insights sobre o uso e a capacidade do aplicativo. Por exemplo, é possível definir métricas personalizadas com o Monitoring. Use essas métricas personalizadas para definir tendências de alerta. O monitoramento também fornece painéis flexíveis e ferramentas de visualização avançadas para ajudar a identificar problemas que venham a surgir.

Criar um processo para o planejamento da capacidade

Estabeleça um processo de planejamento de capacidade e documente este plano.

Ao criar esse plano, faça o seguinte:

  1. executar testes de carga para determinar quanta carga o sistema pode processar ao atingir as metas de latência, considerando uma quantidade fixa de recursos. Os testes de carga precisam usar uma combinação de tipos de solicitação que corresponda aos perfis de tráfego de produção dos usuários ativos. Não use uma combinação uniforme ou aleatória de operações. Inclua picos de uso no seu perfil de tráfego.
  2. Crie um modelo de capacidade. Um modelo de capacidade é um conjunto de fórmulas para calcular os recursos incrementais necessários por aumento de unidade na carga de serviço, conforme determinado no teste de carga.
  3. Preveja o tráfego futuro e considere o crescimento. Consulte o artigo Medir a carga futura para um resumo de como o Google cria previsões de tráfego.
  4. Aplicar o modelo de capacidade à previsão para determinar as futuras necessidades de recursos.
  5. Estime o custo dos recursos que sua organização precisa. Em seguida, receba a aprovação do orçamento da sua organização financeira. Essa etapa é essencial porque a empresa pode fazer comparações de custo e de risco em diversos produtos. Essas contrapartidas podem significar adquirir capacidade menor ou maior do que a necessidade prevista para um determinado produto com base em prioridades de negócios.
  6. Trabalhe com seu provedor de nuvem para receber a quantidade correta de recursos no momento certo com cotas e reservas. Envolve equipes de infraestrutura para planejamento de capacidade e faz com que as operações criem planos de capacidade com intervalos de confiança.
  7. Repita as etapas anteriores a cada trimestre ou duas.

Para orientações mais detalhadas sobre o processo de planejamento da capacidade e otimização do uso de recursos, consulte Planejamento da capacidade.

Certifique-se de que suas cotas atendam aos requisitos de capacidade

O Google Cloud usa cotas para restringir a quantidade de um determinado recurso compartilhado do Google Cloud que você pode usar. Cada cota representa um recurso contável específico, como chamadas de API para um determinado serviço, o número de balanceadores de carga usados simultaneamente por seu projeto ou o número de projetos que você pode criar. Elas garantem, por exemplo, que alguns clientes ou projetos não monopolizem núcleos de CPU em uma determinada região ou zona.

Ao revisar sua cota, considere os seguintes detalhes:

  • Planeje os requisitos de capacidade de seus projetos com antecedência para evitar a limitação inesperada do consumo de recursos.
  • Configure sua cota e capacidade para lidar com uma falha na região completa.
  • Use cotas para limitar o consumo de um recurso específico. Por exemplo, é possível definir uma cota máxima de uso por consulta por meio da API BigQuery para garantir que um projeto não exceda o limite de gastos do BigQuery.
  • Planeje picos de uso e inclua esses picos como parte do seu plano de cotas. Os picos de uso podem ser variações esperadas ao longo do dia, eventos de pico de tráfego inesperados ou eventos de pico de tráfego e lançamento conhecidos. Para mais detalhes sobre como planejar eventos de pico de tráfego e lançamento, leia a próxima seção em excelência operacional: Planejar eventos de pico de tráfego e lançamento.

Se as cotas atuais não forem suficientes, gerencie-as usando o console do Google Cloud. Se você precisar de uma grande capacidade, entre em contato com a equipe de vendas do Google Cloud. No entanto, você precisa saber que muitos serviços também têm limites não relacionados ao sistema de cotas. Consulte Como trabalhar com cotas para mais informações.

Verifique suas cotas regularmente. Envie solicitações de cota antes que elas sejam necessárias. Confira Como trabalhar com cotas para mais detalhes sobre como as solicitações de cotas são avaliadas e como as solicitações são aprovadas ou negadas.

Há várias maneiras de visualizar e gerenciar sua cota do Google Cloud:

A seguir