Vai a
Managed Service for Apache Airflow

Managed Service for Apache Airflow (in precedenza Cloud Composer)

Un servizio di orchestrazione del flusso di lavoro completamente gestito basato su Apache Airflow.

I nuovi clienti ricevono 300 $ di crediti senza costi da spendere su Managed Service for Apache Airflow o altri prodotti Google Cloud.

  • Consente di creare, pianificare e monitorare le pipeline distribuite in ambienti ibridi e multi-cloud

  • Realizzato sulla base del progetto open source Apache Airflow e gestito tramite Python

  • Ti libera dai vincoli ed è facile da usare

  • Nuovo supporto per Apache Airflow 3 (in anteprima)

Vantaggi

Orchestrazione del workflow completamente gestita

La natura gestita di Managed Service for Apache Airflow e la compatibilità con Airflow permettono di concentrarsi sulla creazione, sulla pianificazione e sul monitoraggio dei flussi di lavoro anziché sul provisioning delle risorse.

Si integra con altri prodotti Google Cloud

L'integrazione end-to-end con i prodotti Google Cloud tra cui BigQuery, Dataflow, Managed Service for Apache Spark, Datastore, Cloud Storage e Pub/Sub offre agli utenti la libertà di orchestrare completamente la loro pipeline.

Supporta cloud ibrido e multi-cloud

Crea, pianifica e monitora i tuoi flussi di lavoro attraverso un singolo strumento di orchestrazione, indipendentemente dall'ambiente della pipeline, on-premise, in più cloud o all'interno di Google Cloud.

Funzionalità principali

Funzionalità principali

Cloud ibrido e multi-cloud

Semplifica la transizione al cloud o gestisci un ambiente dati ibrido orchestrando i flussi di lavoro eseguiti sia on-premise, sia nel cloud pubblico. Crea flussi di lavoro che collegano dati, elaborazione e servizi tra diversi cloud, per un ambiente dati unificato.

Open source

Managed Service for Apache Airflow offre agli utenti libertà dal lock-in e portabilità. Questo progetto open source, a cui contribuisce anche Google, libera i clienti dalla dipendenza dal fornitore e fornisce integrazione con una vasta gamma di piattaforme, che continuerà a espandersi di pari passo con la crescita della community di Airflow.

Orchestrazione semplificata

Le pipeline di Managed Service for Apache Airflow sono configurate come grafi diretti aciclici (DAG, Directed Acyclic Graph) tramite Python, perciò sono semplici da usare per chiunque. Il deployment con un clic permette di accedere all'istante a una ricca libreria di connettori e molteplici rappresentazioni grafiche del flusso di lavoro in azione, rendendo più semplice la risoluzione dei problemi. La sincronizzazione automatica dei tuoi grafici aciclici diretti garantisce la puntualità dei job rispetto alla programmazione.

Migliora il modo in cui vengono creati, gestiti e monitorati i workflow dei dati

I miglioramenti principali includono il controllo delle versioni DAG per l'auditability (tracciabilità) e i rollback sicuri, oltre a backfill gestiti dallo scheduler per una rielaborazione più semplice dei dati storici. Una nuova API ed SDK per l'esecuzione delle attività apre la strada al futuro supporto multilingue e agli ambienti di attività isolati. Gli utenti beneficiano di un'interfaccia utente più veloce e moderna basata su React con una navigazione migliorata. La pianificazione basata su eventi pianificati mira a pipeline più reattive e quasi in tempo reale. Edge Executor ottimizza l'esecuzione delle attività in remoto e una interfaccia a riga di comando divisa (airflow/airflowctl) offre un'esperienza di riga di comando più chiara per lo sviluppo e le operazioni.

Documentazione

Documentazione

Google Cloud Basics

Panoramica di Managed Service for Apache Airflow

Scopri una panoramica di un ambiente Managed Service for Apache Airflow e dei prodotti Google Cloud utilizzati per un deployment di Apache Airflow.

Architecture

Utilizza una pipeline CI/CD per il flusso di lavoro di elaborazione dei dati

Scopri come configurare una pipeline CI/CD di integrazione continua/deployment continu per l'elaborazione di dati con prodotti gestiti su Google Cloud.

Pattern

Ambiente Managed Service for Apache Airflow con IP privato

Trova informazioni sull'utilizzo di un ambiente Managed Service for Apache Airflow con IP privato.

Tutorial

Scrittura di DAG (flussi di lavoro)

Scopri come scrivere un grafo diretto aciclico (DAG) di Apache Airflow in esecuzione in un ambiente Managed Service for Apache Airflow.

Tutorial

Google Cloud Skills Boost: Data engineering on Google Cloud

Questo corso di quattro giorni condotto da un istruttore fornisce ai partecipanti un'introduzione pratica alla progettazione e alla creazione di pipeline di dati su Google Cloud.

Non trovi ciò che stai cercando?

Casi d'uso

Casi d'uso

Caso d'uso
Esplora i casi d'uso per Managed Service for Apache Airflow
  • Orchestrazione della pipeline di dati (ETL/ELT): automatizzazione di workflow di dati complessi, inclusi job di estrazione, trasformazione e caricamento (ETL/ELT) e gestione delle dipendenze tra le attività.
  • MLOps e workflow di machine learning: orchestrare il ciclo di vita ML end-to-end, dalla preparazione dei dati e l'addestramento/valutazione del modello al deployment e al monitoraggio.
  • Automazione della business intelligence (BI): pianificazione dell'estrazione dei dati per gli strumenti di BI, automazione della generazione di report e aggiornamento delle dashboard.
  • Automazione dell'infrastruttura e DevOps: automatizzazione delle attività dell'infrastruttura cloud come il provisioning e la disattivazione dei cluster, l'invio di job e la gestione dei processi di rilascio CI/CD.
  • Integrazione dei dati ibrida e multi-cloud: coordinare i flussi di dati tra diverse origini, inclusi altri fornitori di servizi cloud e data center on-premise, per creare set di dati unificati.

Tutte le funzionalità

Tutte le funzionalità

Multi-cloud

Crea flussi di lavoro che collegano dati, elaborazione e servizi tra diversi cloud, per un ambiente dati unificato.

Open source

Managed Service for Apache Airflow offre agli utenti libertà dal lock-in e portabilità.

Ibrido

Semplifica la transizione al cloud o gestisci un ambiente dati ibrido orchestrando i flussi di lavoro eseguiti sia on-premise, sia nel cloud pubblico.

Integrato

Integrazione perfetta con BigQuery, Dataflow, Managed Service for Apache Spark, Datastore, Cloud Storage, Pub/Sub e molti altri ancora, per consentirti di orchestrare i workload Google Cloud end-to-end.

Linguaggio di programmazione Python

Sfrutta le competenze Python esistenti per creare e programmare dinamicamente workflow in Managed Service for Apache Airflow.

Affidabilità

Aumenta l'affidabilità dei tuoi flussi di lavoro tramite grafici di facile utilizzo per il monitoraggio e la risoluzione della causa alla radice di un problema.

Completamente gestito

La natura gestita di Managed Service for Apache Airflow permette di concentrarsi sulla creazione, sulla pianificazione e sul monitoraggio dei workflow anziché sul provisioning delle risorse.

Networking e sicurezza

Durante la creazione dell'ambiente, Managed Service for Apache Airflow fornisce le seguenti opzioni di configurazione: IP privato, VPC condiviso, Controllo di servizio VPC, supporto per la crittografia CMEK e altre ancora.

Prezzi

Prezzi

Managed Service for Apache Airflow utilizza un modello di prezzi basato sul consumo, pertanto paghi in base all'utilizzo, misurato in termini di vCPU l'ora, GB al mese e GB trasferiti al mese. Offriamo varie fasce di prezzo, perché Managed Service for Apache Airflow utilizza numerosi prodotti Google Cloud come componenti di base.

I prezzi sono uniformi per tutti i livelli di consumo e utilizzo sostenuto. Per saperne di più, consulta la pagina dei prezzi.

Fai un passo avanti

Inizia a creare su Google Cloud con 300 $ di crediti senza costi e oltre 20 prodotti sempre senza costi.

Google Cloud