Ingeniero de datos profesional

Guía para el examen de certificación

Ingeniero de datos profesional

Caso de éxito de muestra

Durante el examen de certificación para ingenieros de datos, es posible que algunas de las preguntas traten de un caso de éxito en el que se describe un negocio ficticio y un concepto de solución. El propósito de estos casos de éxito es proporcionar un contexto adicional para ayudarte a elegir tus respuestas. Revisa algunos de los casos de éxito de muestra que pueden aparecer en el examen.

Descripción del puesto

Un profesional certificado por Google como ingeniero de datos hace posible la toma de decisiones basada en datos gracias a la recopilación, la transformación y la visualización de datos. El ingeniero de datos debe ser capaz de diseñar, construir y mantener sistemas de procesamiento de datos, y también solucionar sus problemas, con especial énfasis en la seguridad, la confiabilidad, la tolerancia a los errores, la escalabilidad, la fidelidad y la eficiencia de esos sistemas. El ingeniero de datos también debe tener la capacidad de analizar los datos para obtener información valiosa sobre los resultados del negocio, generar modelos estadísticos que respalden la toma de decisiones, y crear modelos de aprendizaje automático que simplifiquen y automaticen los procesos clave del negocio.

Regístrate para dar el examen

Guía para el examen de certificación

Sección 1: Diseño de sistemas de procesamiento de datos

1.1 Diseño de representaciones flexibles de datos. Se incluyen las siguientes consideraciones:

  • futuros avances en la tecnología de datos
  • cambios en los requisitos del negocio
  • conocimiento del estado actual y cómo migrar el diseño a un estado futuro
  • modelado de datos
  • concesiones
  • sistemas distribuidos
  • diseño de esquemas

1.2 Diseño de canalizaciones de datos. Se incluyen las siguientes consideraciones:

  • futuros avances en la tecnología de datos
  • cambios en los requisitos del negocio
  • conocimiento del estado actual y cómo migrar el diseño a un estado futuro
  • modelado de datos
  • concesiones
  • disponibilidad del sistema
  • sistemas distribuidos
  • diseño de esquemas
  • fuentes comunes de error (p. ej., quitar el sesgo de selección)

1.3 Diseño de la infraestructura de procesamiento de datos. Se incluyen las siguientes consideraciones:

  • futuros avances en la tecnología de datos
  • cambios en los requisitos del negocio
  • conocimiento del estado actual y cómo migrar el diseño a un estado futuro
  • modelado de datos
  • concesiones
  • disponibilidad del sistema
  • sistemas distribuidos
  • diseño de esquemas
  • planificación de capacidad
  • tipos diferentes de arquitecturas: agentes de mensajes, colas de mensajes, middleware, orientadas a servicios

Sección 2: Construcción y mantenimiento de estructuras y bases de datos

2.1 Construcción y mantenimiento de representaciones flexibles de datos

2.2 Compilación y mantenimiento de canalizaciones. Se incluyen las siguientes consideraciones:

  • limpieza de datos
  • lotes y transmisión
  • transformación
  • importación y adquisición de datos
  • pruebas y control de calidad
  • conexión a nuevas fuentes de datos

2.3 Construcción y mantenimiento de infraestructuras de procesamiento. Se incluyen las siguientes consideraciones:

  • aprovisionamiento de recursos
  • supervisión de canalizaciones
  • ajuste de canalizaciones
  • pruebas y control de calidad

Sección 3: Análisis de datos y habilitación del aprendizaje automático

3.1 Análisis de datos. Se incluyen las siguientes consideraciones:

  • recopilación y etiquetado de los datos
  • visualización de los datos
  • reducción de la dimensionalidad
  • limpieza o normalización de los datos
  • definición de las métricas de éxito

3.2 Aprendizaje automático. Se incluyen las siguientes consideraciones:

  • selección o ingeniería de las características
  • selección de algoritmos
  • depuración de un modelo

3.3 Implementación del modelo de aprendizaje automático. Se incluyen las siguientes consideraciones:

  • optimización del rendimiento y el costo
  • aprendizaje en línea o dinámico

Sección 4: Modelado de procesos empresariales para el análisis y la optimización

4.1 Asignación de los requisitos del negocio a las representaciones de datos. Se incluyen las siguientes consideraciones:

  • trabajo con usuarios empresariales
  • recopilación de los requisitos del negocio

4.2 Optimización de las representaciones de datos, y el rendimiento y el costo de la infraestructura de datos. Se incluyen las siguientes consideraciones:

  • escalamiento y cambio de la cantidad de recursos
  • limpieza de datos, sistemas distribuidos
  • algoritmos de alto rendimiento
  • fuentes comunes de error (p. ej., quitar el sesgo de selección)

Sección 5: Garantía de la confiabilidad

5.1 Realización del control de calidad. Se incluyen las siguientes consideraciones:

  • verificación
  • compilación y ejecución de paquetes de verificación
  • supervisión de la canalización

5.2 Evaluación, solución de problemas, y mejora de las representaciones de datos y la infraestructura de procesamiento de datos.

5.3 Recuperación de datos. Se incluyen las siguientes consideraciones:

  • planificación (p. ej., tolerancia a errores)
  • ejecución (p. ej., volver a ejecutar trabajos fallidos, realización de un nuevo análisis retrospectivo)
  • dar énfasis a los planes y procesos de recuperación de datos de pruebas

Sección 6: Visualización de los datos y apoyo de políticas

6.1 Compilación (o selección) de herramientas de informes y visualización de datos. Se incluyen las siguientes consideraciones:

  • automatización
  • asistencia en cuanto a las decisiones
  • resumen de datos (p. ej., traducción hasta la cadena, fidelidad, seguimiento, integridad)

6.2 Apoyo de políticas y publicación de informes y datos.

Sección 7: Diseño para la seguridad y el cumplimiento

7.1 Diseño de infraestructura y procesos de datos seguros. Se incluyen las siguientes consideraciones:

  • Administración de identidades y accesos (IAM)
  • seguridad de los datos
  • pruebas de penetración
  • separación de obligaciones (SoD)
  • control de seguridad

7.2 Diseño para el cumplimiento legal. Se incluyen las siguientes consideraciones:

  • legislación (p. ej., Ley de Responsabilidad y Portabilidad de Seguros Médicos (HIPAA), Ley de Protección de la Privacidad Infantil en Internet (COPPA), entre otras)
  • auditorías