Professional Cloud DevOps Engineer
Guia do exame de certificação
Um Professional Cloud DevOps Engineer implementa processos e recursos ao longo do ciclo de vida de desenvolvimento de sistemas usando ferramentas e metodologias recomendadas pelo Google. Isso permite a entrega eficiente de software e infraestrutura equilibrando a confiabilidade com a velocidade de entrega. Isso também otimiza e mantém sistemas e serviços de produção.
Esta versão do exame Professional Cloud DevOps Engineer dá menos ênfase nos componentes culturais da Engenharia de confiabilidade do site (SRE) do que a versão anterior.
Seção 1: inicialização e manutenção de uma organização do Google Cloud (cerca de 15% do exame)
1.1 Projetar a hierarquia de recursos geral de uma organização. Inclui as seguintes considerações:
● Projetos e pastas
● Rede compartilhada
● Monitoramento e geração de registros de vários projetos
● Papéis do Identity and Access Management (IAM) e políticas no nível da organização
● Criar e gerenciar contas de serviço
● Organizar recursos usando uma abordagem centrada no aplicativo (por exemplo, App Hub)
1.2 Como gerenciar a infraestrutura. Inclui as seguintes considerações:
● Infraestrutura como ferramenta de código (por exemplo, Cloud Foundation Toolkit, Config Connector, Terraform e Helm)
● Como fazer alterações na infraestrutura usando as práticas e os modelos recomendados pelo Google
● Automação com scripts (por exemplo, Python, Go)
1.3 Como projetar uma pilha de arquitetura de CI/CD em ambientes híbridos, multicloud e do Google Cloud. Inclui as seguintes considerações:
● Integração contínua (CI) com o Cloud Build
● Entrega contínua (CD) com o Cloud Deploy, incluindo o Kustomize e o Skaffold
● Ferramentas de terceiros amplamente usadas (por exemplo, Jenkins, Git, Argo CD, Packer)
● Segurança das ferramentas de CI/CD
1.4 Como gerenciar vários ambientes (como preparo e produção). Inclui as seguintes considerações:
● Como determinar o número e a finalidade dos ambientes
● Como gerenciar ambientes temporários
● Gerenciamento de configurações e políticas
● Como gerenciar clusters do Google Kubernetes Engine (GKE) em uma empresa
● Práticas seguras de upgrade e aplicação de patches
1.5 Como ativar ambientes de desenvolvimento seguros na nuvem. Inclui as seguintes considerações:
● Como configurar e gerenciar ambientes de desenvolvimento de nuvem (por exemplo, Cloud Workstations, Cloud Shell)
● Como inicializar ambientes com as ferramentas necessárias (por exemplo, imagens personalizadas, ambiente de desenvolvimento integrado, SDK Cloud)
● Como usar a IA para ajudar no desenvolvimento e nas operações (por exemplo, Cloud Code, Gemini Code Assist)
Seção 2: criar e implementar pipelines de CI/CD para aplicativos e infraestrutura (cerca de 27% do exame)
2.1 Como projetar e gerenciar pipelines de CI/CD. Inclui as seguintes considerações:
● Gerenciamento de artefatos com o Artifact Registry
● Implantação em ambientes híbridos e multicloud (por exemplo, GKE Enterprise)
● Acionadores de pipelines de CI/CD
● Testar uma nova versão do aplicativo no pipeline
● Configurar processos de implantação (por exemplo, fluxos de aprovação)
● CI/CD de aplicativos sem servidor
● Aplicação de práticas de CI/CD à infraestrutura (por exemplo, clusters do GKE, grupos gerenciados de instâncias, configuração do Cloud Service Mesh)
2.2 Como implementar pipelines de CI/CD. Inclui as seguintes considerações:
● Auditoria e rastreamento de implantações (por exemplo, Artifact Registry, Cloud Build, Cloud Deploy e Registros de auditoria do Cloud)
● Estratégias de implantação (por exemplo, canário, azul/verde, contínua, divisão de tráfego)
● Solução de problemas e mitigação de problemas de implantação
2.3 Gerenciar configurações e secrets de CI/CD. Inclui as seguintes considerações:
● Gerenciamento de chaves (por exemplo, Cloud Key Management Service)
● Gerenciamento de secrets (por exemplo, Secret Manager, Certificate Manager)
● Injeção de secret de build e ambiente de execução
2.4 Proteger o pipeline de implantação de CI/CD. Inclui as seguintes considerações:
● Análise de vulnerabilidade com o Artifact Registry
● Segurança da cadeia de suprimentos de software (por exemplo, Autorização binária, framework dos Níveis da cadeia de suprimentos para artefatos de software [SLSA])
● Políticas do IAM com base no ambiente
Seção 3: aplicar práticas de engenharia de confiabilidade do site a aplicativos (cerca de 23% do exame)
3.1 Como balancear a mudança, velocidade e confiabilidade do serviço. Inclui as seguintes considerações:
● Definir SLIs (por exemplo, disponibilidade, latência), SLOs e SLAs
● Margens de erro
● Custo de oportunidade de risco e confiabilidade (por exemplo, número de "noves")
3.2 Gerenciar o ciclo de vida do serviço. Inclui as seguintes considerações:
● Gerenciamento de serviços (por exemplo, introdução de um novo serviço usando uma lista de verificação de integração pré-serviço, plano de lançamento ou plano de implantação, implantação, manutenção e desativação)
● Planejamento de capacidade (por exemplo, cotas, limites)
● Escalonamento automático (por exemplo, grupos gerenciados de instâncias, Cloud Run, GKE)
3.3 Minimizar o impacto de incidentes para os usuários. Inclui as seguintes considerações:
● Redução/redirecionamento do tráfego
● Adicionar capacidade
● Estratégias de reversão
Seção 4: implementar práticas de observabilidade (cerca de 20% do exame)
4.1 Gerenciar registros. Inclui as seguintes considerações:
● Coletar e importar registros (por exemplo, Agente do Cloud Logging, Registros de auditoria do Cloud, Registros de fluxo de VPC, Cloud Service Mesh)
● Otimização de geração de registros (por exemplo, filtragem, amostragem, exclusões, custo, considerações sobre a origem)
● Como exportar registros (por exemplo, BigQuery, Pub/Sub, para auditoria)
● Como manter registros
● Como analisar registros
● Como lidar com dados sensíveis (por exemplo, informações de identificação pessoal [PII] e informações protegidas de saúde [PHI])
4.2 Como gerenciar métricas. Inclui as seguintes considerações:
● Coletar e analisar métricas (por exemplo, aplicativo, plataforma, rede, Cloud Service Mesh, Google Cloud Managed Service para Prometheus, híbrida/multicloud)
● Criar métricas personalizadas a partir de registros
● Usar o Metrics Explorer para análise de métrica ad hoc
● Criar de monitores sintéticos
4.3 Como gerenciar painéis e alertas. Inclui as seguintes considerações:
● Gerenciar painéis (por exemplo, criar, filtrar, compartilhar, playbooks)
● Configurar alertas e políticas de alertas (por exemplo, SLIs, SLOs, controle de custos)
● Ferramentas de alerta de terceiros amplamente usadas
Seção 5: otimizar o desempenho e solucionar problemas (cerca de 15% do exame)
5.1 Solução de problemas. Inclui as seguintes considerações:
● Problemas de infraestrutura
● Problemas no aplicativo
● Problemas de pipeline de CI/CD
● Problemas de observabilidade
● Problemas de desempenho e latência
5.2 Implementar ferramentas de depuração no Google Cloud. Inclui as seguintes considerações:
● Instrumentação do aplicativo
● Cloud Trace
● Error Reporting
5.3 Otimizar a utilização e os custos de recursos. Inclui as seguintes considerações:
● Custos de observabilidade
● Máquinas virtuais (VMs) spot
● Planejamento de custos de infraestrutura (por exemplo, descontos por compromisso de uso, descontos por uso prolongado, níveis de rede)
● Recomendadores do Google Cloud (por exemplo, custo, segurança, desempenho, capacidade de gerenciamento, confiabilidade)