Soluciones de programación del flujo de trabajo

En esta sección, se describen las opciones de Google Cloud que puedes usar para programar flujos de trabajo.

Plantillas de flujo de trabajo de Dataproc

Las plantillas de flujos de trabajo de Dataproc brindan un mecanismo flexible y fácil de usar para administrar y ejecutar flujos de trabajo. Una plantilla de flujo de trabajo es una configuración reutilizable de flujo de trabajo. Define un grafo de trabajos con información sobre dónde ejecutar esos trabajos.

Cloud Scheduler

Cloud Scheduler es un programador de trabajos cron de nivel empresarial completamente administrado. Te permite programar prácticamente cualquier trabajo, incluidos los trabajos por lotes y de macrodatos, y operaciones de infraestructura de Cloud. Proporciona una programación simple basada en el tiempo, por ejemplo, diaria o por hora, sin necesidad de que escribas código.

Ventajas:

  • Habilita la creación de instancias basadas en el tiempo de las plantillas de flujo de trabajo en función de las expresiones cron conocidas.

  • No hay código para escribir

Instructivo: Flujo de trabajo con Cloud Scheduler

Cloud Functions

Cloud Functions es una solución de procesamiento liviana que puedes usar para crear funciones independientes de un solo propósito que respondan a eventos de Cloud sin la necesidad de administrar un entorno de ejecución o servidor. Puedes usar Cloud Functions para iniciar flujos de trabajo en respuesta a eventos de Pub/Sub o cambios de archivos en Cloud Storage. Puedes usar Cloud Functions con Cloud Scheduler para los flujos de trabajo que requieren el cálculo de los parámetros basados en el tiempo.

Ventajas:

  • Habilita la creación de instancias de flujo de trabajo en respuesta a eventos de datos, como archivos nuevos en Cloud Storage o eventos de Pub/Sub.

  • Codificación mínima necesaria con las bibliotecas cliente de Go, Node.js o Python de Dataproc

  • Genera flujos de trabajo y parámetros de flujo de trabajo de forma dinámica

Instructivo: Flujo de trabajo con Cloud Functions

Cloud Composer

Cloud Composer es un servicio administrado de Apache Airflow que puedes usar para crear, programar, supervisar y administrar flujos de trabajo.

Ventajas:

  • Admite la programación basada en el tiempo y los eventos

  • Llamadas simplificadas a Dataproc mediante Operators

  • Genera flujos de trabajo y parámetros de flujo de trabajo de forma dinámica

  • Crea flujos de datos que abarquen varios productos de Google Cloud