Esse princípio no pilar de confiabilidade do Google Cloud Framework de arquitetura ajuda você a definir metas de confiabilidade que sejam tecnicamente viáveis para suas cargas de trabalho no Google Cloud.
Esse princípio é relevante para a área de foco de escopo da confiabilidade.
Visão geral do princípio
Projete seus sistemas para que sejam confiáveis o suficiente para a satisfação do usuário. Pode parecer contra-intuitivo, mas uma meta de 100% de confiabilidade geralmente não é a estratégia mais eficaz. Uma confiabilidade maior pode resultar em um custo significativamente maior, tanto em termos de investimento financeiro quanto de possíveis limitações na inovação. Se os usuários já estão satisfeitos com o nível atual de serviço, os esforços para aumentar ainda mais a satisfação podem gerar um baixo retorno do investimento. Em vez disso, você pode usar melhor os recursos em outro lugar.
Você precisa determinar o nível de confiabilidade que deixa seus usuários satisfeitos e o ponto em que o custo das melhorias incrementais começa a ser maior que os benefícios. Ao determinar esse nível de confiabilidade suficiente, você pode alocar recursos de forma estratégica e se concentrar em recursos e melhorias que tragam mais valor aos usuários.
Recomendações
Para definir metas de confiabilidade realistas, considere as recomendações nas subseções a seguir.
Aceitar algumas falhas e priorizar componentes
Procure ter alta disponibilidade, como 99,99% de atividade, mas não defina uma meta de 100% de disponibilidade. Reconheça que algumas falhas são inevitáveis.
A diferença entre o tempo de atividade de 100% e a meta de 99,99% é a margem de falha. Essa lacuna é chamada de orçamento de erros. O margem de erro pode ajudar você a correr riscos e inovar, o que é fundamental para qualquer empresa se manter competitiva.
Priorize a confiabilidade dos componentes mais importantes do sistema. Aceite que componentes menos críticos podem ter uma tolerância maior a falhas.
Equilibre a confiabilidade e o custo
Para determinar o nível de confiabilidade ideal do sistema, faça análises de custo-benefício completas.
Considere fatores como requisitos do sistema, as consequências de falhas e a tolerância de risco da sua organização para o aplicativo específico. Considere as métricas de recuperação de desastres, como o objetivo de tempo de recuperação (RTO) e o objetivo de ponto de recuperação (RPO). Decida qual nível de confiabilidade é aceitável dentro do orçamento e de outras restrições.
Procure maneiras de melhorar a eficiência e reduzir custos sem comprometer os recursos essenciais de confiabilidade.