O pilar de excelência operacional no Framework de arquiteturaGoogle Cloud oferece recomendações para operar cargas de trabalho de forma eficiente no Google Cloud. A excelência operacional na nuvem envolve o design, a implementação e o gerenciamento de soluções de nuvem que ofereçam valor, desempenho, segurança e confiabilidade. As recomendações neste pilar ajudam você a melhorar continuamente e adaptar as cargas de trabalho para atender às necessidades dinâmicas e em constante evolução na nuvem.
O pilar de excelência operacional é relevante para os seguintes públicos:
- Gestores e líderes: um modelo para estabelecer e manter a excelência operacional na nuvem e garantir que os investimentos em nuvem tragam valor e apoiem os objetivos de negócios.
- Equipes de operações de nuvem: orientações para gerenciar incidentes e problemas, planejar a capacidade, otimizar o desempenho e gerenciar mudanças.
- Engenheiros de confiabilidade do site (SREs): práticas recomendadas que ajudam a alcançar altos níveis de confiabilidade do serviço, incluindo monitoramento, resposta a incidentes e automação.
- Arquitetos e engenheiros de nuvem: requisitos operacionais e práticas recomendadas para as fases de design e implementação, para ajudar a garantir que as soluções sejam projetadas para eficiência operacional e escalonabilidade.
- Equipes de DevOps: orientações sobre automação, pipelines de CI/CD e gerenciamento de mudanças para ajudar a acelerar e tornar mais confiável a entrega de softwares.
Para alcançar a excelência operacional, é preciso adotar a automação, a orquestração e os insights orientados por dados. A automação ajuda a eliminar o trabalho. Ele também simplifica e cria proteções em torno de tarefas repetitivas. A orquestração ajuda a coordenar processos complexos. Os insights baseados em dados permitem a tomada de decisões baseadas em evidências. Ao usar essas práticas, é possível otimizar as operações na nuvem, reduzir custos, melhorar a disponibilidade do serviço e aumentar a segurança.
A excelência operacional na nuvem vai além da proficiência técnica nas operações de nuvem. Ela inclui uma mudança cultural que incentiva o aprendizado e a experimentação contínuos. As equipes precisam ter autonomia para inovar, iterar e adotar uma mentalidade de crescimento. Uma cultura de excelência operacional promove um ambiente colaborativo em que as pessoas são incentivadas a compartilhar ideias, desafiar suposições e impulsionar melhorias.
Para princípios e recomendações de excelência operacional específicos para cargas de trabalho de IA e ML, consulte Perspectiva de IA e ML: excelência operacional no framework de arquitetura.
Princípios básicos
As recomendações no pilar de excelência operacional do Framework de arquitetura são mapeadas para os seguintes princípios básicos:
- Garantir a prontidão operacional e o desempenho usando o CloudOps: garanta que as soluções de nuvem atendam aos requisitos operacionais e de desempenho definindo objetivos de nível de serviço (SLO) e realizando monitoramento, testes de desempenho e planejamento de capacidade abrangentes.
- Gerenciar incidentes e problemas: minimizar o impacto de incidentes na nuvem e evitar recorrências com observabilidade abrangente, procedimentos claros de resposta a incidentes, retrospectivas completas e medidas preventivas.
- Gerenciar e otimizar recursos da nuvem: otimizar e gerenciar recursos da nuvem com estratégias como dimensionamento correto, autoescalonamento e uso de ferramentas eficazes de monitoramento de custos.
- Automatizar e gerenciar a mudança: automatize processos, simplifique a gestão de mudanças e reduza a carga de trabalho manual.
- Melhoria e inovação contínuas: se concentre em melhorias contínuas e na introdução de novas soluções para se manter competitivo.
Colaboradores
Autores:
- Ryan Cox | Arquiteto principal
- Hadrian Knotz | Arquiteto corporativo
Outros colaboradores:
- Daniel Lees | Arquiteto de segurança do Cloud
- Filipe Gracio, PhD | Engenheiro de clientes
- Gary Harmson | Engenheiro de clientes
- Jose Andrade | Engenheiro de clientes de infraestrutura corporativa
- Kumar Dhanagopal | Desenvolvedor de soluções para vários produtos
- Nicolas Pintaux | Engenheiro de clientes, especialista em modernização de aplicativos
- Radhika Kanakam | Gerente de programa sênior, GTM do Cloud
- Zach Seils | Especialista em rede
- Wade Holmes | Diretor de soluções globais