Obtén un cupón de certificación, acceso a todas las capacitaciones on demand y USD 500 en créditos de Google Cloud a través de Innovators Plus. Explora todos los beneficios.

Professional Cloud DevOps Engineer

Guía para el examen de certificación

Los Professional Cloud DevOps Engineers se encargan de los procesos a lo largo del ciclo de vida de desarrollo de los sistemas mediante las metodologías y herramientas recomendadas por Google. Compilan e implementan canalizaciones de entrega de infraestructura y software, optimizan y mantienen sistemas y servicios de producción, y equilibran la confiabilidad de los servicios con la velocidad de entrega.


Sección 1: Inicia una organización de Google Cloud para DevOps.

   1.1 Diseña la jerarquía general de recursos para una organización. Se incluyen las siguientes consideraciones:

        ● Proyectos y carpetas

        ● Herramientas de redes compartidas

        ● Roles de administración de identidades y accesos (IAM) y políticas a nivel de la organización

        ● Crear y administrar cuentas de servicio

   1.2 Administra la infraestructura como código Se incluyen las siguientes consideraciones:

        ● Implementar la infraestructura como herramientas de código (p. ej., Cloud Foundation Toolkit, Config Connector, Terraform o Helm)

        ● Realizar cambios en la infraestructura con las prácticas recomendadas y la infraestructura recomendada por Google como planos de código

        ● Crear una arquitectura inmutable

   1.3 Diseña una pila de arquitectura de CI/CD en entornos híbridos, de múltiples nubes y de Google Cloud. Se incluyen las siguientes consideraciones:

        ● Implementar la IC con Cloud Build

        ● Implementar la CD con Google Cloud Deploy

        ● Implementa herramientas de terceros muy utilizadas (p. ej., Jenkins, Git, ArgoCD o Packer)

        ● Implementar herramientas de seguridad de CI/CD

   1.4 Administración de múltiples entornos (p. ej., etapa de pruebas o producción). Se incluyen las siguientes consideraciones:

        ● Determinar la cantidad de entornos y su propósito.

        ● Crear entornos de forma dinámica para cada rama de funciones con Google Kubernetes Engine (GKE) y Terraform.

        ● Anthos Config Management

Sección 2: Implementación y compilación de canalizaciones de IC/EC para un servicio

   2.1 Diseña y administra canalizaciones de CI/CD. Se incluyen las siguientes consideraciones:

        ● Administrar artefactos con Artifact Registry

        ● Implementar en entornos híbridos y de múltiples nubes (p. ej., Anthos GKE)

        ● Implementar activadores de canalizaciones de CI/CD

        ● Probar una nueva versión de la aplicación en la canalización

        ● Configurar procesos de implementación (p. ej.: flujos de aprobación)

        ● Implementar CI/CD de aplicaciones sin servidores

   2.2 Implementa canalizaciones de CI/CD. Se incluyen las siguientes consideraciones:

        ● Auditar y realizar un seguimiento de las implementaciones (p. ej., Artifact Registry, Cloud Build, Google Cloud Deploy o Cloud Audit Logs).

        ● Utilizar estrategias de implementación (p. ej., detección de fallos, azul-verde, progresiva o de división de tráfico).

        ● Implementar estrategias de reversión

        ● Utilizar la solución de problemas de implementación

   2.3 Administra la configuración y los Secrets de CI/CD. Se incluyen las siguientes consideraciones:

        ● Implementar métodos de almacenamiento seguro y servicios de rotación de claves (p. ej., Cloud Key Management Service o Secret Manager).

      ●  Admonistra Secrets

        ● Implementar la inyección de Secrets en tiempo de ejecución de compilación

   2.4 Protege la canalización de implementación de CI/CD. Se incluyen las siguientes consideraciones:

        ● Análisis de vulnerabilidades con Artifact Registry

        ● Autorización binaria

        ● Proteger las políticas de IAM por entorno

Sección 3: Aplica las prácticas de ingeniería de confiabilidad de sitios a un servicio

   3.1 Balancea los cambios, la velocidad y la confiabilidad del servicio. Se incluyen las siguientes consideraciones:

        ● Descubrir SLI (p. ej., disponibilidad y latencia)

        ● Definir los SLOs y comprende los ANS

        ● Porcentajes de error aceptables

Automatiza el trabajo manual.

        ● Aprender costos de oportunidad y riesgo de confiabilidad (p. ej., la cantidad de “nueves”)

   3.2 Administra el ciclo de vida del servicio. Se incluyen las siguientes consideraciones:

        ● Administrar servicios (p. ej., presentación de un servicio nuevo mediante análisis previos [lista de tareas de integración previa al servicio, plan de lanzamiento o plan de implementación], implementación, mantenimiento y retiro)

        ● Planificar la capacidad (p. ej., administración de cuotas y límites)

        ● Ajustar la escala automática con grupos de instancias administrados, Cloud Run, Cloud Functions o GKE

        ● Implementar bucles de retroalimentación para mejorar un servicio

   3.3 Garantiza la buena comunicación y colaboración para las operaciones Se incluyen las siguientes consideraciones:

        ● Prevenir el agotamiento (p. ej.,: configuración de procesos de automatización para evitar el agotamiento)

        ● Fomentar una cultura de aprendizaje y libre de culpas

        ● Establecer la propiedad conjunta de los servicios para eliminar los entornos aislados de los equipos

   3.4 Mitiga el impacto del incidente en los usuarios Se incluyen las siguientes consideraciones:

        ● Implementar la comunicación durante un incidente

        ● Desviar o redireccionar tráfico

        ● Agregar capacidad

   3.5 Realiza un análisis de resultados. Se incluyen las siguientes consideraciones:

        ● Documentar las causas principales

        ● Crear y priorizar elementos de acción

        ● Comunicar el proceso post mortem a las partes interesadas

Sección 4: Implementa estrategias de supervisión de servicios.

   4.1 Administra registros. Se incluyen las siguientes consideraciones:

        ● Recopilar registros estructurados y no estructurados de Compute Engine, GKE y plataformas sin servidores mediante Cloud Logging

        ● Configurar el agente de Cloud Logging

        ● Recopilar registros desde fuera de Google Cloud

        ● Enviar registros de aplicaciones directamente a la API de Cloud Logging

        ● Implementar niveles de registro (p .ej., información, error, depuración, error irrecuperable)

        ● Optimizar registros (p. ej., registros multilínea, excepciones, tamaño y costo)

   4.2 Administra métricas con Cloud Monitoring. Se incluyen las siguientes consideraciones:

        ● Recopilar y analizar métricas de aplicaciones y plataformas

        ● Recopilar métricas de redes y la malla de servicios

        ● Usar el Explorador de métricas para un análisis ad hoc

        ● Crear métricas personalizadas a partir de registros

   4.3 Administra paneles y alertas en Cloud Monitoring. Se incluyen las siguientes consideraciones:

        ● Crear un panel de supervisión

        ● Filtrar y compartir paneles

        ● Configurar alertas

        ● Definir políticas de alertas basadas en SLOs y SLI

        ● Automatizar la definición de la política de alertas mediante Terraform

        ● Usar el servicio administrado de Google Cloud para Prometheus a fin de recopilar métricas y configurar la supervisión y las alertas

   4.4 Administra la plataforma de Cloud Logging. Se incluyen las siguientes consideraciones:

        ● Habilitar los registros de acceso a los datos (p. ej.,: registros de auditoría de Cloud).

        ● Habilitar los registros de flujo de VPC

        ● Ver registros en la consola de Google Cloud

        ● Usar filtros de registro básicos o avanzados

        ● Excluir registros en comparación con la exportación de registros

        ● Exportar a nivel de proyecto en comparación con las exportaciones a nivel de la organización

        ● Administrar y visualizar las exportaciones de registros

        ● Enviar registros a una plataforma de registros externa

        ● Filtrar y ocultar datos sensibles (p. ej., información de identificación personal [PII], información de salud protegida [PHI])

   4.5 Implementa controles de acceso de registro y supervisión. Se incluyen las siguientes consideraciones:

        ● Restringir el acceso a los registros de auditoría y a los registros de flujo de VPC con Cloud Logging

        ● Restringir la configuración de exportación con Cloud Logging

        ● Permitir la escritura de métricas y registros con Cloud Monitoring

Sección 5: Optimiza el rendimiento del servicio.

   5.1 Identifica los problemas de rendimiento del servicio. Se incluyen las siguientes consideraciones:

        ● Usar Google Cloud's operations suite para identificar la utilización de recursos en la nube

        ● Interpretar la telemetría de la malla de servicios

        ● Solucionar problemas de cargas de trabajo implementadas

        ● Solucionar problemas de implementación y tiempo de ejecución de las aplicaciones

        ● Solucionar problemas de red (p. ej., registros de flujo de VPC, registros de firewall, latencia y detalles de la red de vista)

   5.2 Implementa herramientas de depuración en Google Cloud. Se incluyen las siguientes consideraciones:

        ● Instrumentación de aplicaciones

Cloud Logging:

Cloud Trace

        ●  Error Reporting

        ●  Cloud Profiler

        ●  Cloud Monitoring

   5.3 Optimiza la utilización de recursos y de costos. Se incluyen las siguientes consideraciones:

        ● Implementar máquinas virtuales (VMs) interrumpibles o interrumpibles

        ● Utilizar los descuentos por compromiso de uso (p. ej., flexibles, basados en recursos)

        ● Descuentos por uso continuo

        ● Níveles de red

        ● Utilizar las recomendaciones de tamaño