Antes de ocorrer o evento de capacidade máxima, faça a gestão e otimize os recursos usados pelas suas Google Cloud cargas de trabalho. Isto envolve o dimensionamento adequado dos recursos com base na utilização e na procura reais, a utilização do dimensionamento automático para a atribuição dinâmica de recursos e a revisão das recomendações de arquitetura e segurança. O Cloud Monitoring e o Recommender (Active Assist) podem ajudar a identificar oportunidades para otimizar os seus recursos da nuvem. Ao usar estas ferramentas, pode aceder a estatísticas sobre a utilização de recursos e tomar decisões informadas antes do evento.
Reveja as Google Cloud práticas recomendadas
Muitos problemas de eventos de capacidade máxima podem ser evitados seguindo as práticas recomendadas para o Google Cloud produto que está a usar. Seguem-se exemplos de alguns guias de práticas recomendadas:
Geral | |
BigQuery | |
Cloud Storage | |
Compute Engine | |
Dataflow | |
Dataproc | |
Google Kubernetes Engine |
Reveja a escalabilidade
O dimensionamento automático pode garantir que as suas aplicações baseadas na nuvem têm os recursos de que precisam para processar cargas de trabalho variáveis, evitando o aprovisionamento excessivo e custos desnecessários. Google Cloud oferece várias opções de dimensionamento automático específicas do produto, incluindo as seguintes:
- Os grupos de instâncias geridas (GIGs) do Compute Engine são grupos de VMs que são geridos e dimensionados como uma única entidade. Com os MIGs, pode definir políticas de escalabilidade automática que especificam o número mínimo e máximo de VMs a manter no grupo, bem como as condições que acionam a escalabilidade automática.
- A escala automática do Google Kubernetes Engine (GKE) ajusta dinamicamente os recursos do cluster para corresponderem às necessidades da sua aplicação. Oferece ferramentas que podem otimizar a utilização de recursos, garantir o desempenho das aplicações e simplificar a gestão de clusters.
- O Cloud Run oferece dimensionamento automático incorporado, que ajusta automaticamente o número de instâncias com base no tráfego recebido.
Antes do evento, recomendamos que aumente a escala manualmente. Embora possa ter a escalabilidade automática configurada, devido à velocidade do tráfego de eventos, a escalabilidade automática pode não conseguir acompanhar a procura. Por isso, pré-aqueça os recursos antecipadamente, incluindo o seguinte:
- Máquinas virtuais
- Coloca em cache se quiser pré-carregar
- Componentes sem servidor para evitar inícios a frio
Reveja as recomendações do Assistente ativas
O Active Assist refere-se ao portefólio de ferramentas usadas no Google Cloud para gerar recomendações e estatísticas que ajudam a otimizar os seus Google Cloud projetos. Para mais informações, consulte o artigo O que é o Active Assist.
Reveja as versões dos seus produtos
Certifique-se de que todos os seus produtos e serviços na nuvem estão atualizados com a versão estável mais recente.
Reveja alertas e painéis de controlo
Identifique e resolva proativamente problemas avaliando os alertas e os painéis de controlo disponibilizados através das ferramentas de observabilidade do Google Cloud e de soluções de terceiros.
Verifique as métricas, os registos e os rastreios do Google Cloud Observability para obter estatísticas sobre a utilização de recursos, as caraterísticas de desempenho e o estado geral dos seus recursos. Monitorize métricas importantes que se alinham com os indicadores de estado do sistema, como a utilização da CPU, a utilização da memória, o tráfego de rede, a E/S de disco e os tempos de resposta da aplicação. Também deve considerar métricas específicas da empresa. Ao acompanhar estas métricas, pode identificar potenciais gargalos, problemas de desempenho e restrições de recursos. Além disso, pode configurar alertas para notificar proativamente as equipas relevantes sobre potenciais problemas ou anomalias.
Para alertas, foque-se em métricas críticas, defina limites adequados para minimizar o cansaço de alertas e garanta respostas atempadas a problemas significativos. Esta abordagem segmentada permite-lhe manter proativamente a fiabilidade da carga de trabalho. Para mais informações, consulte a Vista geral dos alertas.