Faça a gestão e monitorização da sua infraestrutura do Google Cloud

Last reviewed 2024-11-20 UTC

Depois de implementar uma aplicação na produção no Google Cloud, pode ter de modificar a infraestrutura que usa. Por exemplo, pode ter de alterar os tipos de máquinas das suas VMs ou alterar a classe de armazenamento dos contentores do Cloud Storage. Esta parte do Google Cloud guia de fiabilidade da infraestrutura resume as diretrizes de gestão de alterações que pode seguir para reduzir o risco de fiabilidade dos recursos de infraestrutura. Esta parte também descreve como pode monitorizar a disponibilidade da infraestrutura. Google Cloud

Implemente alterações de infraestrutura progressivamente

Quando precisar de alterar a sua Google Cloud infraestrutura, sempre que possível, implemente as alterações na produção de forma progressiva. Por exemplo, se precisar de alterar os tipos de máquinas das VMs, implemente as alterações em algumas VMs numa zona e monitorize os efeitos das alterações. Se observar problemas, reverta rapidamente a infraestrutura para o estado estável anterior. Diagnostique e resolva os problemas e, em seguida, reinicie o processo de implementação progressiva. Depois de verificar se a sua carga de trabalho é executada como esperado, implemente gradualmente as alterações em toda a sua infraestrutura.

Controlar alterações aos recursos globais

Quando modifica recursos globais, como redes VPC e equilibradores de carga globais, tenha especial cuidado para validar as alterações antes de as implementar na produção.

Uma vez que os recursos globais são resilientes a interrupções de zonas e regiões, pode decidir usar instâncias únicas de determinados recursos globais na sua arquitetura. Nestas implementações, os recursos globais podem tornar-se pontos únicos de falha. Por exemplo, se configurar inadvertidamente uma regra de encaminhamento do seu equilibrador de carga global, o front-end pode deixar de receber ou processar pedidos de utilizadores. Efetivamente, a aplicação não está disponível para os utilizadores neste caso, embora o back-end esteja intacto. Para evitar estas situações, exerça um controlo rigoroso sobre as alterações aos recursos globais. Por exemplo, no processo de revisão de alterações, pode classificar quaisquer modificações aos recursos globais como alterações de alto risco que os revisores adicionais têm de validar e aprovar.

Monitorize a disponibilidade da infraestrutura de Google Cloud

Pode monitorizar o estado atual dos Google Cloud serviços em todas as regiões através do Google Cloud painel de controlo de estado do serviço. Também pode ver um histórico das falhas de infraestrutura (denominadas incidentes) para cada serviço. A página de histórico fornece os detalhes de cada incidente, como a duração do incidente, as zonas e as regiões afetadas, os serviços afetados e quaisquer soluções alternativas recomendadas.

Também pode ver incidentes relevantes para o seu projeto através do Personalized Service Health. O Service Health também lhe permite pedir informações sobre incidentes através de uma API com base no projeto ou na organização, e configurar alertas.

A Google fornece atualizações regulares sobre o estado de cada incidente, incluindo uma hora estimada para a próxima atualização. Pode receber atualizações de estado de incidentes de forma programática através de um feed RSS. Para mais informações, consulte o artigo Incidentes e o Google Cloud painel de controlo do estado do serviço.