Esta página foi traduzida pela API Cloud Translation.

Framework com boa arquitetura: pilar de excelência operacional

Last reviewed 2024-10-31 UTC

O pilar de excelência operacional no Google Cloud Well-Architected Framework fornece recomendações para operar cargas de trabalho de maneira eficiente no Google Cloud. A excelência operacional na nuvem envolve projetar, implementar e gerenciar soluções de nuvem que oferecem valor, desempenho, segurança e confiabilidade. As recomendações neste pilar ajudam você a melhorar e adaptar continuamente as cargas de trabalho para atender às necessidades dinâmicas e em constante evolução na nuvem.

O pilar de excelência operacional é relevante para os seguintes públicos-alvo:

Gerentes e líderes: um framework para estabelecer e manter a excelência operacional na nuvem e garantir que os investimentos em nuvem gerem valor e apoiem os objetivos de negócios.
Equipes de operações na nuvem: orientações para gerenciar incidentes e problemas, planejar a capacidade, otimizar o desempenho e gerenciar mudanças.
Engenheiros de confiabilidade do site (SREs): práticas recomendadas que ajudam a alcançar altos níveis de confiabilidade do serviço, incluindo monitoramento, resposta a incidentes e automação.
Arquitetos e engenheiros de nuvem: requisitos operacionais e práticas recomendadas para as fases de design e implementação, ajudando a garantir que as soluções sejam projetadas para eficiência operacional e escalonabilidade.
Equipes de DevOps: orientações sobre automação, pipelines de CI/CD e gerenciamento de mudanças para ajudar a acelerar e tornar mais confiável a entrega de software.

Para alcançar a excelência operacional, é preciso adotar a automação, a orquestração e os insights baseados em dados. Automation ajuda a eliminar o trabalho. Ele também simplifica e cria mecanismos de proteção para tarefas repetitivas. A orquestração ajuda a coordenar processos complexos. Os insights baseados em dados permitem a tomada de decisões com base em evidências. Ao usar essas práticas, você pode otimizar as operações na nuvem, reduzir custos, melhorar a disponibilidade do serviço e aumentar a segurança.

A excelência operacional na nuvem vai além da proficiência técnica em operações de nuvem. Isso inclui uma mudança cultural que incentiva o aprendizado e a experimentação contínuos. As equipes precisam ter autonomia para inovar, iterar e adotar uma mentalidade de crescimento. Uma cultura de excelência operacional promove um ambiente colaborativo em que as pessoas são incentivadas a compartilhar ideias, questionar premissas e impulsionar melhorias.

Para princípios e recomendações de excelência operacional específicos para cargas de trabalho de IA e ML, consulte Perspectiva de IA e ML: excelência operacional no framework bem arquitetado.

Princípios básicos

As recomendações no pilar de excelência operacional do Well-Architected Framework são mapeadas para os seguintes princípios básicos:

Garantia de prontidão operacional e desempenho com CloudOps: garanta que as soluções de nuvem atendam aos requisitos operacionais e de desempenho definindo objetivos de nível de serviço (SLOs) e realizando monitoramento abrangente, testes de desempenho e planejamento de capacidade.
Gerenciar incidentes e problemas: minimize o impacto de incidentes na nuvem e evite recorrências com observabilidade abrangente, procedimentos claros de resposta a incidentes, retrospectivas completas e medidas preventivas.
Gerenciar e otimizar recursos de nuvem: otimize e gerencie recursos de nuvem com estratégias como dimensionamento adequado, escalonamento automático e usando ferramentas eficazes de monitoramento de custos.
Automatizar e gerenciar mudanças: automatize processos, simplifique o gerenciamento de mudanças e alivie o trabalho manual.
Melhoria e inovação contínuas: concentre-se em melhorias contínuas e na introdução de novas soluções para manter a competitividade.

Colaboradores

Autores:

Ryan Cox | Arquiteto principal
Hadrian Knotz | Arquiteto corporativo

Outros colaboradores:

Daniel Lees | Arquiteto de segurança do Cloud
Filipe Gracio, PhD | Engenheiro de clientes, especialista em IA/ML
Gary Harmson | Arquiteto principal
Jose Andrade | Engenheiro de clientes, especialista em SRE
Kumar Dhanagopal | Desenvolvedor de soluções para vários produtos
Nicolas Pintaux | Engenheiro de clientes, especialista em modernização de aplicativos
Radhika Kanakam | Líder de programa, Google Cloud Well-Architected Framework
Samantha He | Redatora técnica
Zach Seils | Especialista em rede
Wade Holmes | Diretor global de soluções

Avançar

Garantia de prontidão operacional e desempenho com CloudOps