Um componente crítico da preparação para eventos é o planejamento de capacidade, em que você determina a quantidade de recursos de nuvem necessários para garantir que suas cargas de trabalho tenham o que precisam para operar de maneira eficaz, sem provisionamento excessivo e pagamento desnecessário pelo que não é preciso.
A capacidade é a quantidade total de um recurso específico disponível e compartilhado entre todos os clientes. No entanto, para garantir que alguns clientes ou projetos não monopolizem os recursos,o Google Cloud restringe a quantidade de um recurso Google Cloud compartilhado específico que você pode usar com cotas.
Cada cota representa um recurso específico, como chamadas de API para um determinado serviço, o número de VMs usadas pelo seu projeto em um determinado momento, o número de balanceadores de carga usados simultaneamente pelo seu projeto ou o número de projetos que você pode criar.
Muitos serviços têm cotas padrão para alguns recursos, mas as cotas que se aplicam aos seus aplicativos são específicas para você, seu projeto ou sua organização. Ativar o faturamento do projeto aumenta as cotas para a maioria dos serviços. As cotas também podem aumentar à medida que você usa o Google Cloud .
Ao se preparar para o evento de alto tráfego ou a alta temporada, verifique se as cotas correspondem aos requisitos de recursos para que você não encontre falhas inesperadas.
Portanto, recomendamos que você faça o seguinte:
Use as ferramentas do Cloud Monitoring para ter visibilidade do uso e da capacidade dos aplicativos, além da integridade geral deles e da infraestrutura.
Avalie a utilização média e máxima das principais cargas de trabalho na nuvem e as necessidades de capacidade atuais e futuras delas para determinar quanto provisionamento em excesso é necessário para se preparar para picos de tráfego.
Execute testes de carga para determinar quanta carga o sistema pode processar ao atingir as metas de latência, considerando uma quantidade fixa de recursos.
Usar o Planejador de Capacidade
Com o Planejador de Capacidade, é possível conferir o uso histórico e previsto de instâncias de máquina virtual (VM), volumes de disco permanente e GPUs. Você também pode conferir reservas, reservar recursos com antecedência e gerenciar os limites de cota do projeto. Para isso, verifique se você está perto do limite e configure solicitações automáticas de aumento de cota. Para mais informações, consulte Conferir dados de uso e previsão no Planejador de Capacidade.
Ativar o ajustador de cotas
O ajustador de cotas monitora o consumo de recursos e envia solicitações de ajuste de cota em seu nome para que você não precise fazer solicitações manuais. Para mais informações, consulte Como o ajustador de cota funciona.
Solicitar um ajuste de cota
Se as cotas não forem suficientes para o que você precisa, solicite um ajuste. Há três maneiras principais de enviar um pedido de aumento de cota:
- Pelo console do Google Cloud
- Em um caso de suporte
- Diretamente com sua equipe de conta ou TAM
Se você precisar de uma resposta rápida para um pedido de aumento de cota, considere usar o console Google Cloud . No entanto, se a solicitação exigir mais análise, talvez seja necessário trabalhar com a equipe da conta.
Para ajustar um valor de cota no console do Google Cloud , consulte Visualizar e gerenciar cotas.
A maioria das solicitações de aumento de cota é avaliada por sistemas automatizados. A decisão deles é baseada em critérios, incluindo a disponibilidade de recursos, o período em que você usou Google Cloude outros fatores. As solicitações que não atenderem aos critérios serão negadas. Se o pedido for negado, tente solicitar o aumento de cota criando um caso de suporte ou entrando em contato com a equipe de contas ou o TAM.
Criar uma reserva
As reservas garantem que você tenha os recursos do Compute Engine disponíveis para criar VMs com o mesmo hardware (memória e vCPUs) e recursos opcionais (GPUs e discos SSD locais) sempre que precisar.
Uma reserva imediata é provisionada no momento em que você a solicita, se a capacidade solicitada estiver disponível. Com uma reserva adiantada, você solicita capacidade com antecedência e tem um alto nível de garantia de conseguir e proteger a capacidade para eventos com pico de escala. Recomendamos que você faça reservas adiantadas com bastante antecedência. Para ver mais informações, consulte os tópicos a seguir:
- Reservas de recursos zonais do Compute Engine
- Criar uma reserva para um único projeto
- Criar solicitações de reserva adiantada para um único projeto