Framework Well-Architected: pilar da fiabilidade

Last reviewed 2024-12-30 UTC

O pilar da fiabilidade no Google Cloud Well-Architected Framework fornece princípios e recomendações para ajudar a conceber, implementar e gerir cargas de trabalho fiáveis no Google Cloud.

Este documento destina-se a arquitetos da nuvem, programadores, engenheiros de plataformas, administradores e engenheiros de fiabilidade do site.

A fiabilidade é a capacidade de um sistema executar consistentemente as funções pretendidas nas condições definidas e manter o serviço ininterrupto. As práticas recomendadas para a fiabilidade incluem redundância, design tolerante a falhas, monitorização e processos de recuperação automáticos.

Como parte da fiabilidade, a resiliência é a capacidade do sistema de resistir e recuperar de falhas ou interrupções inesperadas, mantendo o desempenho. AsGoogle Cloud funcionalidades, como as implementações multirregionais, as cópias de segurança automáticas e as soluções de recuperação de desastres, podem ajudar a melhorar a resiliência do seu sistema.

A fiabilidade é importante para a sua estratégia de nuvem por vários motivos, incluindo os seguintes:

  • Tempo de inatividade mínimo: o tempo de inatividade pode levar à perda de receita, à diminuição da produtividade e a danos na reputação. As arquiteturas resilientes podem ajudar a garantir que os sistemas continuam a funcionar durante falhas ou a recuperar de forma eficiente de falhas.
  • Experiência do utilizador melhorada: os utilizadores esperam interações integradas com a tecnologia. Os sistemas resilientes podem ajudar a manter um desempenho e uma disponibilidade consistentes, e oferecem um serviço fiável mesmo durante uma elevada procura ou problemas inesperados.
  • Integridade de dados: as falhas podem causar perda ou corrupção de dados. Os sistemas resilientes implementam mecanismos como cópias de segurança, redundância e replicação para proteger os dados e garantir que permanecem precisos e acessíveis.
  • Continuidade da empresa: a sua empresa depende da tecnologia para operações críticas. As arquiteturas resilientes podem ajudar a garantir a continuidade após uma falha catastrófica, o que permite que as funções empresariais continuem sem interrupções significativas e suporta uma recuperação rápida.
  • Conformidade: muitos setores têm requisitos regulamentares para a disponibilidade do sistema e a proteção de dados. As arquiteturas resilientes podem ajudar a cumprir estes padrões, garantindo que os sistemas permanecem operacionais e seguros.
  • Custos mais baixos a longo prazo: as arquiteturas resilientes requerem investimento inicial, mas a resiliência pode ajudar a reduzir os custos ao longo do tempo, evitando inatividade dispendiosa, evitando correções reativas e permitindo uma utilização mais eficiente dos recursos.

Mentalidade organizacional

Para tornar os seus sistemas fiáveis, precisa de um plano e de uma estratégia estabelecida. Esta estratégia tem de incluir formação e a autoridade para dar prioridade à fiabilidade juntamente com outras iniciativas.

Defina uma expetativa clara de que toda a organização é responsável pela fiabilidade, incluindo o desenvolvimento, a gestão de produtos, as operações, a engenharia de plataformas e a engenharia de fiabilidade de sites (EFS). Mesmo os grupos focados na empresa, como o marketing e as vendas, podem influenciar a fiabilidade.

Todas as equipas têm de compreender os objetivos de fiabilidade e os riscos das respetivas aplicações. As equipas têm de ser responsáveis pelo cumprimento destes requisitos. Os conflitos entre a fiabilidade e o desenvolvimento regular de funcionalidades dos produtos têm de ser priorizados e encaminhados em conformidade.

Planeie e faça a gestão da fiabilidade de forma holística em todas as suas funções e equipas. Considere configurar um centro de excelência em nuvem (CCoE) que inclua um pilar de fiabilidade. Para mais informações, consulte o artigo Otimize o percurso da sua organização na nuvem com um centro de excelência na nuvem.

Principais áreas para a fiabilidade

As atividades que realiza para conceber, implementar e gerir um sistema fiável podem ser categorizadas nas seguintes áreas de foco. Cada um dos princípios e recomendações de fiabilidade neste pilar é relevante para uma destas áreas de foco.

  • Âmbito: para compreender o seu sistema, faça uma análise detalhada da respetiva arquitetura. Tem de compreender os componentes, como funcionam e interagem, como os dados e as ações fluem através do sistema e o que pode correr mal. Identificar potenciais falhas, gargalos e riscos, o que ajuda a tomar medidas para mitigar esses problemas.
  • Observação: para ajudar a evitar falhas do sistema, implemente uma observação e uma monitorização abrangentes e contínuas. Através desta observação, pode compreender as tendências e identificar potenciais problemas de forma proativa.
  • Resposta: para reduzir o impacto das falhas, responda adequadamente e recupere de forma eficiente. As respostas automáticas também podem ajudar a reduzir o impacto das falhas. Mesmo com planeamento e controlos, podem ocorrer falhas.
  • Aprendizagem: para ajudar a evitar a recorrência de falhas, aprenda com cada experiência e tome as medidas adequadas.

Princípios fundamentais

As recomendações no pilar de fiabilidade da framework bem arquitetada são mapeadas para os seguintes princípios essenciais:

Colaboradores

Autores:

Outros colaboradores: