跳转到
Managed Service for Apache Airflow

Managed Service for Apache Airflow(以前称为 Cloud Composer)

基于 Apache Airflow 构建的全托管式工作流编排服务。

新客户可获享 $300 赠金,可用于抵扣在 Managed Service for Apache Airflow 或其他 Google Cloud 产品的相关费用。

  • 编写、安排和监控跨越混合环境和多云端环境的流水线

  • 基于 Apache Airflow 开源项目构建,使用 Python 进行运维

  • 摆脱供应商锁定,并且简单易用

  • 新增对 Apache Airflow 3 的支持(预览版)

优势

全代管式工作流编排

Managed Service for Apache Airflow 的托管式特性以及与 Airflow 的兼容性让您可以专心编写、安排和监控工作流,而无需为资源预配分心。

集成其他 Google Cloud 产品

端到端地集成多种 Google Cloud 产品,包括 BigQuery、Dataflow、Managed Service for Apache Spark、Datastore、Cloud Storage 和 Pub/Sub,让用户可以灵活自由地全方位编排流水线。

支持混合云和多云端

无论您的流水线位于本地、多个云环境中,还是完全位于 Google Cloud 内,您都可以仅通过一种编排工具来编写、安排和监控工作流。

主要特性

主要特性

混合云和多云端

通过编排跨本地和公有云的工作流,轻松过渡到云端或维护混合式数据环境。 创建跨多个云连接数据、处理任务和提供服务的工作流,从而实现统一的数据环境。

开源

Managed Service for Apache Airflow 可让用户避免供应商锁定问题并实现可移植性。Google 现在也成为了该开源项目的贡献者。该项目可让客户避免供应商锁定问题,并且可与大量平台集成。随着 Airflow 社区的发展,可集成的平台只会越来越多。

轻松编排

Managed Service for Apache Airflow 流水线配置为使用 Python 的有向无环图 (DAG),让任何用户都能轻松处理。一键式部署让用户可以即时访问丰富的连接器库和运行中的工作流的多种图形表现形式,简化问题排查过程。自动同步的有向无环图可确保您的作业按计划运行。

改进数据工作流的构建、管理和监控方式

主要增强功能包括用于实现可审计性和可靠回滚的 DAG 版本控制,以及用于简化历史数据重新处理的调度器管理的回填。新的任务执行 API 和 SDK 为未来支持多种语言和隔离任务环境奠定了基础。用户可以体验到基于 React 的更快、更现代的界面,以及改进后的导航功能。计划中的事件驱动型调度旨在实现更具响应性、近乎实时的流水线。Edge Executor 可优化远程任务执行,而拆分式 CLI (airflow/airflowctl) 可为开发和运维提供更清晰的命令行体验。

文档

文档

Google Cloud Basics

Managed Service for Apache Airflow 概览

概要了解 Managed Service for Apache Airflow 环境以及用于 Apache Airflow 部署的 Google Cloud 产品。

Architecture

将 CI/CD 流水线用于数据处理工作流

探索如何设置一个持续集成/持续部署 (CI/CD) 流水线,以便通过 Google Cloud 上的托管式产品处理数据。

Pattern

专用 IP Managed Service for Apache Airflow 环境

了解关于使用专用 IP Cloud Managed Service for Apache Airflow 环境的信息。

Tutorial

编写 DAG(工作流)

了解如何编写在 Managed Service for Apache Airflow 环境中运行的 Apache Airflow 有向无环图 (DAG)。

Tutorial

Google Cloud Skills Boost:Google Cloud 上的数据工程

这是一个为期四天、由讲师指导的课程,为参与者介绍如何在 Google Cloud 上设计和构建数据流水线,并提供实操机会。

没有看到您需要的内容?

使用场景

使用场景

使用场景
探索 Managed Service for Apache Airflow 的应用场景
  • 数据流水线编排 (ETL/ELT):自动执行复杂的数据工作流,包括提取、转换和加载 (ETL/ELT) 作业,并管理任务之间的依赖关系。
  • MLOps 和机器学习工作流:编排端到端机器学习生命周期,从数据准备和模型训练/评估到部署和监控。
  • 商业智能 (BI) 自动化:为 BI 工具安排数据提取时间,自动生成报告并刷新信息中心。
  • 基础架构和 DevOps 自动化:自动执行云基础架构任务,例如配置和停用集群、提交作业以及管理 CI/CD 发布流程。
  • 混合云和多云数据集成:协调跨不同来源(包括其他云服务提供商和本地数据中心)的数据流,以创建统一的数据集。

所有特性

所有特性

多云端

创建跨云端连接数据、处理任务和服务的工作流,从而实现统一的数据环境。

开源

Managed Service for Apache Airflow 可让用户避免供应商锁定问题并实现可移植性。

混合

通过编排跨本地和公有云的工作流,轻松过渡到云端或维护混合式数据环境。

集成

内置与 BigQueryDataflowManaged Service for Apache SparkDatastoreCloud StoragePub/Sub 及更多产品的集成,让您能够编排端到端的 Google Cloud 工作负载。

Python 编程语言

利用已有的 Python 技能在 Managed Service for Apache Airflow 中动态编写和安排工作流。

可靠性

通过易于使用的图表来监控和排查问题的根本原因,提高工作流的可靠性。

全代管式

Managed Service for Apache Airflow 特性使您可以专心编写、安排和监控工作流,而无需在资源的预配上费神。

网络和安全

在创建环境期间,Managed Service for Apache Airflow 提供以下配置选项:专用 IP共享 VPCVPC Service ControlsCMEK 加密支持等。

价格

价格

Managed Service for Apache Airflow 的价格基于用量,因此您只需为使用的资源付费,具体计费单位为 vCPU/小时、GB/月和传输的 GB/月。由于 Managed Service for Apache Airflow 用到了多个 Google Cloud 产品,因此有多种价格单位。

无论用量水平和持续使用情况如何,价格都是统一的。如需了解详情,请参阅价格页面。

迈出下一步

获享 $300 赠金以及 20 多种提供“始终免费”用量的产品,开始在 Google Cloud 上构建项目。