O pilar de excelência operacional no Google Cloud Well-Architected Framework fornece recomendações para operar cargas de trabalho de forma eficiente no Google Cloud. A excelência operacional na nuvem envolve a conceção, a implementação e a gestão de soluções na nuvem que oferecem valor, desempenho, segurança e fiabilidade. As recomendações neste pilar ajudam a melhorar continuamente e a adaptar as cargas de trabalho para satisfazer as necessidades dinâmicas e em constante evolução na nuvem.
O pilar de excelência operacional é relevante para os seguintes públicos-alvo:
- Gestores e líderes: uma estrutura para estabelecer e manter a excelência operacional na nuvem e garantir que os investimentos na nuvem geram valor e apoiam os objetivos da empresa.
- Equipas de operações na nuvem: orientações para gerir incidentes e problemas, planear a capacidade, otimizar o desempenho e gerir as alterações.
- Engenheiros de fiabilidade de sites (EFS): práticas recomendadas que ajudam a alcançar níveis elevados de fiabilidade dos serviços, incluindo monitorização, resposta a incidentes e automatização.
- Arquitetos e engenheiros da nuvem: requisitos operacionais e práticas recomendadas para as fases de conceção e implementação, para ajudar a garantir que as soluções são concebidas para a eficiência operacional e a escalabilidade.
- Equipas de DevOps: orientações sobre automatização, pipelines de CI/CD e gestão de alterações para ajudar a permitir uma entrega de software mais rápida e fiável.
Para alcançar a excelência operacional, deve adotar a automatização, a orquestração e as estatísticas orientadas por dados. A automatização ajuda a eliminar o trabalho repetitivo. Também simplifica e cria restrições em torno de tarefas repetitivas. A orquestração ajuda a coordenar processos complexos. As estatísticas baseadas em dados permitem a tomada de decisões com base em provas. Ao usar estas práticas, pode otimizar as operações na nuvem, reduzir os custos, melhorar a disponibilidade dos serviços e aumentar a segurança.
A excelência operacional na nuvem vai além da proficiência técnica nas operações na nuvem. Inclui uma mudança cultural que incentiva a aprendizagem contínua e a experimentação. As equipas têm de ter autonomia para inovar, iterar e adotar uma mentalidade de crescimento. Uma cultura de excelência operacional fomenta um ambiente de colaboração onde os indivíduos são incentivados a partilhar ideias, desafiar pressupostos e impulsionar a melhoria.
Para ver princípios e recomendações de excelência operacional específicos para cargas de trabalho de IA e ML, consulte o artigo Perspetiva de IA e ML: excelência operacional no Well-Architected Framework.
Princípios fundamentais
As recomendações no pilar de excelência operacional da Well-Architected Framework estão mapeadas para os seguintes princípios essenciais:
- Garanta a prontidão operacional e o desempenho com o CloudOps: Certifique-se de que as soluções na nuvem cumprem os requisitos operacionais e de desempenho definindo objetivos de nível de serviço (SLOs) e realizando uma monitorização abrangente, testes de desempenho e planeamento da capacidade.
- Faça a gestão de incidentes e problemas: minimize o impacto dos incidentes na nuvem e evite a recorrência através de observabilidade abrangente, procedimentos claros de resposta a incidentes, retrospetivas exaustivas e medidas preventivas.
- Faça a gestão e a otimização dos recursos da nuvem: otimize e faça a gestão dos recursos da nuvem através de estratégias como o dimensionamento adequado, a escalabilidade automática e a utilização de ferramentas de monitorização de custos eficazes.
- Automatize e faça a gestão das alterações: automatize processos, simplifique a gestão de alterações e alivie a carga de trabalho manual.
- Melhorar e inovar continuamente: focar-se nas melhorias contínuas e na introdução de novas soluções para se manter competitivo.
Colaboradores
Autores:
- Ryan Cox | Principal Architect
- Hadrian Knotz | Enterprise Architect
Outros colaboradores:
- Daniel Lees | Arquiteto de segurança da nuvem
- Filipe Gracio, PhD | Engenheiro de clientes, especialista em IA/AA
- Gary Harmson | Principal Architect
- Jose Andrade | Customer Engineer, SRE Specialist
- Kumar Dhanagopal | Cross-Product Solution Developer
- Nicolas Pintaux | Customer Engineer, Application Modernization Specialist
- Radhika Kanakam | Program Lead, Google Cloud Well-Architected Framework
- Samantha He | Redatora técnica
- Zach Seils | Especialista em redes
- Wade Holmes | Global Solutions Director