Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Questa sezione descrive Google Cloud le opzioni che puoi utilizzare per pianificare
i flussi di lavoro.
Modelli di flusso di lavoro Dataproc
I modelli di flusso di lavoro di Dataproc offrono un meccanismo flessibile e facile da usare per la gestione e l'esecuzione dei flussi di lavoro. Un modello di workflow è una configurazione di workflow riutilizzabile. Definisce un grafico di job con informazioni sul punto di esecuzione di questi job.
Cloud Scheduler
Cloud Scheduler è un servizio di livello aziendale completamente gestito per la pianificazione di cron job.
Consente di pianificare praticamente qualsiasi job, inclusi job batch, job per big data e operazioni dell'infrastruttura cloud. Fornisce una semplice pianificazione basata sul tempo, ad esempio giornaliera o oraria, senza richiedere la scrittura di codice.
Vantaggi:
Consente la creazione di istanze dei modelli di workflow in base al tempo utilizzando espressioni cron familiari
Cloud Run Functions è una soluzione di calcolo leggera che puoi utilizzare per creare
funzioni autonome a uso specifico che rispondono a eventi Cloud senza
la necessità di gestire un server o un ambiente di runtime. Puoi utilizzare le funzioni Cloud Run per avviare Workflows in risposta agli eventi Pub/Sub o alle modifiche ai file in Cloud Storage. Puoi utilizzare le funzioni Cloud Run
con Cloud Scheduler per i flussi di lavoro che richiedono il calcolo di
parametri basati sul tempo.
Vantaggi:
Consente l'istanza del flusso di lavoro in risposta a eventi di dati, ad esempio nuovi file in Cloud Storage o eventi Pub/Sub.
Codifica minima richiesta utilizzando le librerie client Dataproc
Go,
Node.js o
Python.
Generare dinamicamente workflow e parametri workflow
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[[["\u003cp\u003eDataproc Workflow Templates offer a reusable configuration for defining and executing a graph of jobs within workflows.\u003c/p\u003e\n"],["\u003cp\u003eCloud Scheduler is a managed cron job scheduler enabling time-based scheduling of workflows without the need to write any code.\u003c/p\u003e\n"],["\u003cp\u003eCloud Run functions allow for workflow instantiation in response to events like new files in Cloud Storage or Pub/Sub events, requiring minimal coding.\u003c/p\u003e\n"],["\u003cp\u003eCloud Composer is a managed Apache Airflow service that supports both time- and event-based scheduling, offering dynamic workflow generation and integration across various Google Cloud products.\u003c/p\u003e\n"]]],[],null,["This section describes Google Cloud options you can use to schedule\nworkflows.\n\nDataproc Workflow Templates\n\nDataproc [Workflow templates](/dataproc/docs/concepts/workflows/overview)\nprovide a flexible and easy-to-use mechanism for managing and executing workflows. A Workflow Template is a reusable workflow configuration. It defines a graph of jobs with information on where to run those jobs.\n\nCloud Scheduler\n\nCloud Scheduler is a fully managed enterprise-grade cron job scheduler.\nIt allows you to schedule virtually any job, including batch, big data jobs,\nand Cloud infrastructure operations. It provides simple time-based\nscheduling, for example, daily or hourly, without requiring you to write code.\n\n**Advantages:**\n\n- Enables time-based instantiation of workflow templates based on familiar\n cron expressions\n\n- No code to write\n\nTutorial: [Workflow using Cloud Scheduler](/dataproc/docs/tutorials/workflow-scheduler)\n\nCloud Functions\n\nCloud Run functions is a lightweight compute solution you can use to create\nsingle-purpose, stand-alone functions that respond to Cloud events without\nthe need to manage a server or runtime environment. You can use\nCloud Run functions to launch Workflows in response to Pub/Sub\nevents or file changes in Cloud Storage. You can use Cloud Run functions\nwith Cloud Scheduler for workflows that require the calculation of\ntime-based parameters.\n\n**Advantages:**\n\n- Enables workflow instantiation in response to data events, such as new files in\n Cloud Storage or Pub/Sub events.\n\n- Minimal coding required using Dataproc\n [Go](https://github.com/googleapis/google-cloud-go),\n [Node.js](https://github.com/googleapis/google-cloud-node), or\n [Python](https://github.com/googleapis/google-cloud-python)\n client libraries\n\n- Dynamically generate workflows and workflow parameters\n\nTutorial: [Workflow using Cloud Run functions](/dataproc/docs/tutorials/workflow-function)\n\nCloud Composer\n\nCloud Composer is a managed Apache Airflow service you can use\nto create, schedule, monitor, and manage workflows.\n\n**Advantages:**\n\n- Supports time- and event-based scheduling\n\n- Simplified calls to Dataproc using Operators\n\n- Dynamically generate workflows and workflow parameters\n\n- Build data flows that span multiple Google Cloud products\n\nTutorial: [Workflow using Cloud Composer](/dataproc/docs/tutorials/workflow-composer)"]]