Professional Cloud DevOps Engineer
Guía para el examen de certificación
Los Professional Cloud DevOps Engineers se encargan de los procesos a lo largo del ciclo de vida de desarrollo de los sistemas mediante las metodologías y herramientas recomendadas por Google. Compilan e implementan canalizaciones de entrega de infraestructura y software, optimizan y mantienen sistemas y servicios de producción, y equilibran la confiabilidad de los servicios con la velocidad de entrega.
Sección 1: Inicia una organización de Google Cloud para DevOps (aprox. el 17% del examen)
1.1 Diseña la jerarquía general de recursos para una organización. Se incluyen las siguientes consideraciones:
● Proyectos y carpetas
● Herramientas de redes compartidas
● Roles de administración de identidades y accesos (IAM) y políticas a nivel de la organización
● Crear y administrar cuentas de servicio
1.2 Administra la infraestructura como código Se incluyen las siguientes consideraciones:
● Implementar la infraestructura como herramientas de código (p. ej., Cloud Foundation Toolkit, Config Connector, Terraform o Helm)
● Realizar cambios en la infraestructura con las prácticas recomendadas y la infraestructura recomendada por Google como planos de código
● Crear una arquitectura inmutable
1.3 Diseña una pila de arquitectura de CI/CD en entornos híbridos, de múltiples nubes y de Google Cloud. Se incluyen las siguientes consideraciones:
● Implementar la IC con Cloud Build
● Implementar la CD con Google Cloud Deploy
● Implementa herramientas de terceros muy utilizadas (p. ej., Jenkins, Git, ArgoCD o Packer)
● Implementar herramientas de seguridad de CI/CD
1.4 Administración de múltiples entornos (p. ej., etapa de pruebas o producción). Se incluyen las siguientes consideraciones:
● Determinar la cantidad de entornos y su propósito.
● Crear entornos de forma dinámica para cada rama de funciones con Google Kubernetes Engine (GKE) y Terraform.
● Administración de la configuración
Sección 2: Compila e implementa canalizaciones de CI/CD para un servicio (aprox. el 23% del examen)
2.1 Diseña y administra canalizaciones de CI/CD. Se incluyen las siguientes consideraciones:
● Administrar artefactos con Artifact Registry
● Implementar en entornos híbridos y de múltiples nubes (p. ej., Anthos GKE)
● Implementar activadores de canalizaciones de CI/CD
● Probar una nueva versión de la aplicación en la canalización
● Configurar procesos de implementación (p. ej.: flujos de aprobación)
● Implementar CI/CD de aplicaciones sin servidores
2.2 Implementa canalizaciones de CI/CD. Se incluyen las siguientes consideraciones:
● Auditar y realizar un seguimiento de las implementaciones (p. ej., Artifact Registry, Cloud Build, Google Cloud Deploy o Cloud Audit Logs).
● Utilizar estrategias de implementación (p. ej., detección de fallos, azul-verde, progresiva o de división de tráfico).
● Implementar estrategias de reversión
● Utilizar la solución de problemas de implementación
2.3 Administra la configuración y los Secrets de CI/CD. Se incluyen las siguientes consideraciones:
● Implementar métodos de almacenamiento seguro y servicios de rotación de claves (p. ej., Cloud Key Management Service o Secret Manager).
● Administra Secrets
● Implementar la inyección de Secrets en tiempo de ejecución de compilación
2.4 Protege la canalización de implementación de CI/CD. Se incluyen las siguientes consideraciones:
● Análisis de vulnerabilidades con Artifact Registry
● Autorización binaria
● Proteger las políticas de IAM por entorno
Sección 3: Aplicación de las prácticas de ingeniería de confiabilidad de sitios a un servicio (aprox. el 23% del examen)
3.1 Balancea los cambios, la velocidad y la confiabilidad del servicio. Se incluyen las siguientes consideraciones:
● Descubrir SLI (p. ej., disponibilidad y latencia)
● Definir los SLOs y comprende los ANS
● Porcentajes de error aceptables
● Automatiza el trabajo manual.
● Aprender costos de oportunidad y riesgo de confiabilidad (p. ej., la cantidad de “nueves”)
3.2 Administra el ciclo de vida del servicio. Se incluyen las siguientes consideraciones:
● Administrar servicios (p. ej., presentación de un servicio nuevo mediante análisis previos [lista de tareas de integración previa al servicio, plan de lanzamiento o plan de implementación], implementación, mantenimiento y retiro)
● Planificar la capacidad (p. ej., administración de cuotas y límites)
● Ajustar la escala automática con grupos de instancias administrados, Cloud Run, Cloud Functions o GKE
● Implementar bucles de retroalimentación para mejorar un servicio
3.3 Garantiza la buena comunicación y colaboración para las operaciones Se incluyen las siguientes consideraciones:
● Prevenir el agotamiento (p. ej.,: configuración de procesos de automatización para evitar el agotamiento)
● Fomentar una cultura de aprendizaje y libre de culpas
● Establecer la propiedad conjunta de los servicios para eliminar los entornos aislados de los equipos
3.4 Mitiga el impacto del incidente en los usuarios Se incluyen las siguientes consideraciones:
● Implementar la comunicación durante un incidente
● Desviar o redireccionar tráfico
● Agregar capacidad
3.5 Realiza un análisis de resultados. Se incluyen las siguientes consideraciones:
● Documentar las causas principales
● Crear y priorizar elementos de acción
● Comunicar el proceso post mortem a las partes interesadas
Sección 4: Implementación de estrategias de supervisión de servicios (aprox. el 21% del examen)
4.1 Administra registros. Se incluyen las siguientes consideraciones:
● Recopilar registros estructurados y no estructurados de Compute Engine, GKE y plataformas sin servidores mediante Cloud Logging
● Configurar el agente de Cloud Logging
● Recopilar registros desde fuera de Google Cloud
● Enviar registros de aplicaciones directamente a la API de Cloud Logging
● Implementar niveles de registro (p .ej., información, error, depuración, error irrecuperable)
● Optimizar registros (p. ej., registros multilínea, excepciones, tamaño y costo)
4.2 Administra métricas con Cloud Monitoring. Se incluyen las siguientes consideraciones:
● Recopilar y analizar métricas de aplicaciones y plataformas
● Recopilar métricas de redes y la malla de servicios
● Usar el Explorador de métricas para un análisis ad hoc
● Crear métricas personalizadas a partir de registros
4.3 Administra paneles y alertas en Cloud Monitoring. Se incluyen las siguientes consideraciones:
● Crear un panel de supervisión
● Filtrar y compartir paneles
● Configurar alertas
● Definir políticas de alertas basadas en SLOs y SLI
● Automatizar la definición de la política de alertas mediante Terraform
● Usar el servicio administrado de Google Cloud para Prometheus a fin de recopilar métricas y configurar la supervisión y las alertas
4.4 Administra la plataforma de Cloud Logging. Se incluyen las siguientes consideraciones:
● Habilitar los registros de acceso a los datos (p. ej.,: registros de auditoría de Cloud).
● Habilitar los registros de flujo de VPC
● Ver registros en la consola de Google Cloud
● Usar filtros de registro básicos o avanzados
● Excluir registros en comparación con la exportación de registros
● Exportar a nivel de proyecto en comparación con las exportaciones a nivel de la organización
● Administrar y visualizar las exportaciones de registros
● Enviar registros a una plataforma de registros externa
● Filtrar y ocultar datos sensibles (p. ej., información de identificación personal [PII], información de salud protegida [PHI])
4.5 Implementa controles de acceso de registro y supervisión. Se incluyen las siguientes consideraciones:
● Restringir el acceso a los registros de auditoría y a los registros de flujo de VPC con Cloud Logging
● Restringir la configuración de exportación con Cloud Logging
● Permitir la escritura de métricas y registros con Cloud Monitoring
Sección 5: Optimización del rendimiento del servicio (aprox. el 16% del examen)
5.1 Identifica los problemas de rendimiento del servicio. Se incluyen las siguientes consideraciones:
● Usar Google Cloud's operations suite para identificar la utilización de recursos en la nube
● Interpretar la telemetría de la malla de servicios
● Solucionar problemas de cargas de trabajo implementadas
● Solucionar problemas de implementación y tiempo de ejecución de las aplicaciones
● Solucionar problemas de red (p. ej., registros de flujo de VPC, registros de firewall, latencia y detalles de la red de vista)
5.2 Implementa herramientas de depuración en Google Cloud. Se incluyen las siguientes consideraciones:
● Instrumentación de aplicaciones
● Cloud Logging
● Cloud Trace
● Error Reporting
● Cloud Profiler
● Cloud Monitoring
5.3 Optimiza la utilización de recursos y de costos. Se incluyen las siguientes consideraciones:
● Implementar máquinas virtuales (VMs) interrumpibles o interrumpibles
● Utilizar los descuentos por compromiso de uso (p. ej., flexibles, basados en recursos)
● Descuentos por uso continuo
● Niveles de red
● Utilizar las recomendaciones de tamaño