Questa sezione descrive le opzioni di Google Cloud che puoi utilizzare per pianificare i flussi di lavoro.
Modelli di flusso di lavoro Dataproc
I modelli di flusso di lavoro di Dataproc offrono un meccanismo flessibile e facile da usare per la gestione e l'esecuzione dei flussi di lavoro. Un modello di flusso di lavoro è una configurazione di flusso di lavoro riutilizzabile. Definisce un grafico di job con informazioni su dove eseguire questi job.
Cloud Scheduler
Cloud Scheduler è un servizio di livello aziendale completamente gestito per la pianificazione di cron job. Consente di pianificare praticamente qualsiasi job, inclusi job batch, job per big data e operazioni dell'infrastruttura cloud. Fornisce una semplice programmazione basata sul tempo, ad esempio giornaliera oppure oraria, senza che sia necessario scrivere codice.
Vantaggi:
Abilita la creazione di istanze di modelli di flusso di lavoro basata sul tempo in base a espressioni cron familiari
Nessun codice da scrivere
Tutorial: flusso di lavoro con Cloud Scheduler
Cloud Functions
Cloud Functions è una soluzione di computing leggera che puoi utilizzare per creare funzioni autonome a uso specifico in grado di rispondere agli eventi Cloud senza la necessità di gestire un ambiente server o di runtime. Puoi utilizzare Cloud Functions per avviare Workflows in risposta a eventi Pub/Sub o modifiche ai file in Cloud Storage. Puoi utilizzare Cloud Functions con Cloud Scheduler per i flussi di lavoro che richiedono il calcolo di parametri basati sul tempo.
Vantaggi:
Abilita la creazione di istanze di flussi di lavoro in risposta a eventi relativi ai dati, come nuovi file in Cloud Storage o eventi Pub/Sub.
Codifica minima richiesta utilizzando le librerie client di Dataproc Go, Node.js o Python
Generazione dinamica di flussi di lavoro e parametri del flusso di lavoro
Tutorial: flusso di lavoro con Cloud Functions
Cloud Composer
Cloud Composer è un servizio Apache Airflow gestito che puoi utilizzare per creare, pianificare, monitorare e gestire i flussi di lavoro.
Vantaggi:
Supporta la programmazione basata su eventi e orari
Chiamate a Dataproc semplificate tramite gli operatori
Generazione dinamica di flussi di lavoro e parametri del flusso di lavoro
Crea flussi di dati che coprono più prodotti Google Cloud
Tutorial: flusso di lavoro con Cloud Composer