Um componente crítico da preparação para eventos é o planeamento da capacidade, em que determina a quantidade de recursos na nuvem necessários para garantir que as suas cargas de trabalho têm o que precisam para funcionar eficazmente, sem aprovisionamento excessivo e pagamento desnecessário pelo que não precisa.
A capacidade é a quantidade total de um recurso específico que está disponível e é partilhada por todos os clientes. No entanto, para garantir que alguns clientes ou projetos não monopolizam os recursos, Google Cloud restringe a quantidade de um determinado recurso Google Cloud partilhado que pode usar com quotas.
Cada quota representa um recurso específico, como chamadas API para um determinado serviço, o número de VMs usadas pelo seu projeto num determinado momento, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar.
Embora muitos serviços tenham quotas predefinidas para alguns recursos, as quotas que se aplicam às suas aplicações são específicas para si, para o seu projeto ou para a sua organização. Ativar a faturação para o seu projeto aumenta as quotas da maioria dos serviços. As quotas também podem aumentar à medida que a sua utilização do Google Cloud se expande ao longo do tempo.
À medida que se prepara para o seu evento de tráfego elevado ou época de pico, tem de garantir que as suas quotas correspondem aos requisitos de recursos para não encontrar falhas inesperadas.
Recomendamos que faça o seguinte:
Use as ferramentas do Cloud Monitoring para ter visibilidade da utilização e da capacidade da sua aplicação, bem como do estado geral das suas aplicações e infraestrutura.
Avalie as utilizações médias e de pico das suas principais cargas de trabalho na nuvem e as respetivas necessidades de capacidade atuais e futuras para determinar a quantidade de aprovisionamento excessivo necessária para se preparar para picos de tráfego.
Execute testes de carga para determinar a quantidade de carga que o sistema consegue processar ao mesmo tempo que cumpre os respetivos objetivos de latência, dada uma quantidade fixa de recursos.
Use o Capacity Planner
O Planeador de capacidade permite-lhe ver a utilização histórica e prevista das suas instâncias de máquinas virtuais (VMs), volumes de discos persistentes e GPUs. Também pode ver reservas, reservar recursos antecipadamente e gerir os limites de quota do seu projeto, verificando a proximidade do limite e configurando pedidos de aumento automático da quota. Para mais informações, consulte o artigo Veja os dados de utilização e previsão no planeador de capacidade.
Ative o ajustador de quotas
O ajustador de quotas monitoriza o consumo de recursos e envia proativamente pedidos de ajuste de quotas em seu nome para que não tenha de fazer pedidos manuais. Para mais informações, consulte o artigo Como funciona o ajuste de quota.
Peça um ajuste de quota
Se as suas quotas não forem suficientes para o que precisa, pode pedir um ajuste da quota. Existem três formas principais de enviar uma solicitação de aumento da quota:
- Através da Google Cloud consola
- Através de um registo de apoio ao cliente
- Diretamente com a equipa da conta ou o TAM
Se precisar de uma solicitação de aumento da quota resolvida rapidamente, deve considerar usar a Google Cloud consola. No entanto, se o pedido exigir mais análise, pode ter de trabalhar com a equipa da sua conta.
Para ajustar um valor de quota através da Google Cloud consola, consulte Ver e gerir quotas.
A maioria dos pedidos de aumento de quota é avaliada por sistemas automatizados. A decisão baseia-se em critérios que incluem a disponibilidade de recursos, o tempo de utilização Google Cloude outros fatores. As solicitações que não cumprem os critérios são recusadas. Se o seu pedido for recusado, pode tentar pedir o aumento da quota criando um registo de apoio técnico ou contactando a equipa da conta ou o TAM.
Crie uma reserva
As reservas ajudam a garantir que tem os recursos do Compute Engine disponíveis para criar VMs com o mesmo hardware (memória e vCPUs) e recursos opcionais (GPUs e discos SSD locais) sempre que precisar deles.
Uma reserva a pedido é aprovisionada no momento em que a solicita, se a capacidade pedida estiver disponível. Uma reserva futura permite-lhe pedir capacidade antecipadamente e oferece-lhe um elevado nível de garantia na obtenção e proteção da capacidade para eventos de grande escala. Recomendamos que adquira reservas futuras com bastante antecedência do seu evento. Para mais informações, consulte o seguinte:
- Reservas de recursos zonais do Compute Engine
- Crie uma reserva para um único projeto
- Crie pedidos de reserva futuros para um único projeto