Accéder à
Managed Service pour Apache Airflow

Managed Service pour Apache Airflow (anciennement Cloud Composer)

Service d'orchestration de flux de travail entièrement géré conçu à partir d'Apache Airflow

Les nouveaux clients bénéficient de 300 $ de crédits offerts à dépenser sur Managed Service pour Apache Airflow ou d'autres produits Google Cloud.

  • Créez, planifiez et surveillez vos pipelines dans des environnements hybrides et multicloud

  • Basé sur le projet Open Source Apache Airflow et sur Python

  • Évite d'être dépendant d'un fournisseur et est facile à utiliser

  • Nouvelle prise en charge d'Apache Airflow 3 (bêta)

Avantages

Orchestration des workflows entièrement gérée

Le caractère entièrement géré de Managed Service pour Apache Airflow et la compatibilité avec Airflow vous permettent de vous concentrer sur la création, la planification et la surveillance de vos workflows, plutôt que sur le provisionnement des ressources.

S'intègre à d'autres produits Google Cloud

L'intégration de bout en bout avec les produits Google Cloud tels que BigQuery, Dataflow, Managed Service pour Apache Spark, Datastore, Cloud Storage et Pub/Sub donne aux utilisateurs la liberté d'orchestrer entièrement leur pipeline.

Prend en charge le cloud hybride et le multicloud

Créez, planifiez et surveillez vos workflows à l'aide d'un outil d'orchestration unique, que votre pipeline se trouve sur site, sur plusieurs clouds ou entièrement dans Google Cloud.

Principales fonctionnalités

Principales fonctionnalités

Cloud hybride et multicloud

Simplifiez votre transition vers le cloud ou maintenez un environnement de données hybride en orchestrant des workflows entre des environnements sur site et le cloud public. Créez des workflows qui connectent des données, des traitements et des services sur plusieurs clouds. Vous bénéficiez ainsi d'un environnement de données unifié.

Open Source

Managed Service pour Apache Airflow offre aux utilisateurs une grande portabilité et la possibilité de s'affranchir des fournisseurs. Ce projet Open Source, auquel Google contribue de nouveau, permet aux clients d'éviter d'être dépendants d'un fournisseur, tout en assurant une intégration sur de nombreuses plates-formes, dont le nombre ne cessera de grandir à mesure que la communauté Airflow se développera.

Orchestration simple

Les pipelines Managed Service pour Apache Airflow sont configurés sous forme de graphes orientés acycliques (DAG) à l'aide de Python, ce qui permet à tous les utilisateurs de les gérer facilement. Le déploiement en un clic offre un accès immédiat à une riche bibliothèque de connecteurs et à de nombreuses représentations graphiques de votre workflow en action, ce qui simplifie le dépannage. Grâce à la synchronisation automatique de vos graphes orientés acycliques, vos tâches respectent la planification.

Améliorer la création, la gestion et la surveillance des workflows de données

Les principales améliorations incluent le contrôle des versions des DAG pour l'auditabilité et les rollbacks fiables, ainsi que les backfills gérés par le programmateur pour un retraitement plus simple des données historiques. Une nouvelle API et un nouveau SDK d'exécution des tâches ouvrent la voie à la prise en charge de plusieurs langages et à des environnements de tâches isolés. Les utilisateurs bénéficient d'une interface utilisateur plus rapide et moderne basée sur React, avec une navigation améliorée. La planification événementielle vise à créer des pipelines plus réactifs et en temps quasi réel. L'Edge Executor optimise l'exécution des tâches à distance, et une CLI divisée (airflow/airflowctl) offre une expérience de ligne de commande plus claire pour le développement et les opérations.

Documentation

Documentation

Google Cloud Basics

Présentation de Managed Service pour Apache Airflow

Consultez une présentation d'un environnement Managed Service pour Apache Airflow et des produits Google Cloud utilisés pour un déploiement Apache Airflow.

Architecture

Utiliser un pipeline CI/CD pour votre workflow de traitement des données

Découvrez comment configurer un pipeline d'intégration continue/de déploiement continu (CI/CD) pour traiter les données avec des produits gérés sur Google Cloud.

Pattern

Environnement Managed Service pour Apache Airflow avec adresse IP privée

Trouvez des informations sur l'utilisation d'un environnement Cloud Managed Service pour Apache Airflow avec adresse IP privée.

Tutorial

Écrire des DAG (workflows)

Découvrez comment écrire un graphe orienté acyclique (DAG) Apache Airflow exécuté dans un environnement Managed Service pour Apache Airflow.

Tutorial

Google Cloud Skills Boost : Data Engineering on Google Cloud

Ce cours dirigé sur quatre jours explique, avec des exercices pratiques, comment concevoir et créer des pipelines de données sur Google Cloud.

Vous ne trouvez pas ce que vous cherchez ?

Cas d'utilisation

Cas d'utilisation

Cas d'utilisation
Découvrez les cas d'utilisation de Managed Service pour Apache Airflow
  • Orchestration de pipelines de données (ETL/ELT) : automatisation de workflows de données complexes, y compris les jobs d'extraction, de transformation et de chargement (ETL/ELT), et gestion des dépendances entre les tâches.
  • MLOps et workflows de machine learning : orchestration du cycle de vie du ML de bout en bout, de la préparation des données et de l'entraînement/évaluation des modèles au déploiement et à la surveillance.
  • Automatisation de l'informatique décisionnelle (BI) : planifier l'extraction de données pour les outils de BI, automatiser la génération de rapports et actualiser les tableaux de bord.
  • Automatisation de l'infrastructure et de DevOps : automatisation des tâches d'infrastructure cloud telles que le provisionnement et la mise hors service de clusters, l'envoi de jobs et la gestion des processus de livraison CI/CD
  • Intégration de données hybride et multicloud : coordonner les flux de données provenant de diverses sources, y compris d'autres fournisseurs de services cloud et de centres de données sur site, pour créer des ensembles de données unifiés.

Toutes les fonctionnalités

Toutes les fonctionnalités

Multicloud

Créez des workflows qui connectent des données, des traitements et des services sur plusieurs clouds. Vous bénéficiez ainsi d'un environnement de données unifié.

Open Source

Managed Service pour Apache Airflow offre aux utilisateurs une grande portabilité et la possibilité de s'affranchir des fournisseurs.

Hybride

Simplifiez votre transition vers le cloud ou maintenez un environnement de données hybride en orchestrant des workflows entre des environnements sur site et le cloud public.

Intégré

L'intégration avec BigQuery, Dataflow, Managed Service for Apache Spark, Datastore, Cloud Storage, Pub/Sub et bien d'autres produits vous permet d'orchestrer vos charges de travail Google Cloud de bout en bout.

Langage de programmation Python

Utilisez vos compétences en Python pour créer et planifier de manière dynamique des workflows dans Managed Service pour Apache Airflow.

Fiabilité

Améliorez la fiabilité de vos workflows grâce à des graphiques simples d'utilisation qui vous permettent d'assurer une surveillance efficace et d'identifier les causes fondamentales des problèmes.

Entièrement géré

Le caractère entièrement géré de Managed Service pour Apache Airflow vous permet de vous concentrer sur la création, la planification et la surveillance de vos workflows, plutôt que sur le provisionnement des ressources.

Mise en réseau et sécurité

Lors de la création d'un environnement, Managed Service pour Apache Airflow propose les options de configuration suivantes : adresse IP privée, VPC partagé, VPC Service Controls, prise en charge du chiffrement CMEK et plus encore.

Tarification

Tarifs

La tarification de Managed Service pour Apache Airflow est basée sur la consommation, mesurée en vCPU/heure, Go/mois et Go transférés/mois. Nous proposons plusieurs unités de tarification, car Managed Service pour Apache Airflow utilise plusieurs produits Google Cloud comme composants.

La tarification est uniforme sur tous les niveaux de consommation et d'utilisation soutenue. Pour plus d'informations, accédez à la page des tarifs.

Passez à l'étape suivante

Commencez à créer sur Google Cloud avec 300 $ de crédits inclus et plus de 20 produits toujours sans frais.

Google Cloud