Soluzioni di pianificazione del flusso di lavoro

Questa sezione descrive le opzioni di Google Cloud che puoi utilizzare per pianificare le attività di flusso di lavoro.

Modelli di flusso di lavoro Dataproc

I modelli di flusso di lavoro di Dataproc offrono un meccanismo flessibile e facile da usare per la gestione e l'esecuzione dei flussi di lavoro. Un modello di flusso di lavoro è una configurazione del flusso di lavoro riutilizzabile. Definisce un grafico di job con informazioni sul punto di esecuzione di questi job.

Cloud Scheduler

Cloud Scheduler è un servizio di livello aziendale completamente gestito per la pianificazione di cron job. Consente di pianificare praticamente qualsiasi job, inclusi job batch, job per big data e operazioni dell'infrastruttura cloud. Fornisce una semplice programmazione basata sul tempo, ad esempio giornaliera o oraria, senza che tu debba scrivere codice.

Vantaggi:

  • Consente la creazione di istanze dei modelli di flusso di lavoro in base al tempo in base a espressioni cron familiari

  • Nessun codice da scrivere

Tutorial: Flusso di lavoro con Cloud Scheduler

Cloud Functions

Le funzioni Cloud Run sono una soluzione di calcolo leggera che puoi utilizzare per creare funzioni autonome a uso specifico che rispondono a eventi Cloud senza la necessità di gestire un ambiente server o di runtime. Puoi utilizzare le funzioni Cloud Run per avviare Workflows in risposta a eventi Pub/Sub o modifiche ai file in Cloud Storage. Puoi utilizzare le funzioni Cloud Run con Cloud Scheduler per i flussi di lavoro che richiedono il calcolo di parametri basati sul tempo.

Vantaggi:

  • Consente l'inizializzazione del flusso di lavoro in risposta a eventi di dati, ad esempio nuovi file in Cloud Storage o eventi Pub/Sub.

  • Codifica minima richiesta utilizzando le librerie client Dataproc Go, Node.js o Python

  • Generare dinamicamente flussi di lavoro e relativi parametri

Tutorial: Flusso di lavoro con le funzioni Cloud Run

Cloud Composer

Cloud Composer è un servizio Apache Airflow gestito che puoi utilizzare per creare, pianificare, monitorare e gestire i flussi di lavoro.

Vantaggi:

  • Supporta la pianificazione in base al tempo e agli eventi

  • Chiamate semplificate a Dataproc utilizzando gli operatori

  • Generare dinamicamente flussi di lavoro e relativi parametri

  • Crea flussi di dati che abbracciano più prodotti Google Cloud

Tutorial: Flusso di lavoro con Cloud Composer