基于 Apache Airflow 构建的全托管式工作流编排服务。
新客户可获享 $300 赠金,可用于抵扣在 Managed Service for Apache Airflow 或其他 Google Cloud 产品的相关费用。
编写、安排和监控跨越混合环境和多云端环境的流水线
基于 Apache Airflow 开源项目构建,使用 Python 进行运维
摆脱供应商锁定,并且简单易用
新增对 Apache Airflow 3 的支持(预览版)
优势
全代管式工作流编排
Managed Service for Apache Airflow 的托管式特性以及与 Airflow 的兼容性让您可以专心编写、安排和监控工作流,而无需为资源预配分心。
集成其他 Google Cloud 产品
端到端地集成多种 Google Cloud 产品,包括 BigQuery、Dataflow、Managed Service for Apache Spark、Datastore、Cloud Storage 和 Pub/Sub,让用户可以灵活自由地全方位编排流水线。
支持混合云和多云端
无论您的流水线位于本地、多个云环境中,还是完全位于 Google Cloud 内,您都可以仅通过一种编排工具来编写、安排和监控工作流。
主要特性
通过编排跨本地和公有云的工作流,轻松过渡到云端或维护混合式数据环境。 创建跨多个云连接数据、处理任务和提供服务的工作流,从而实现统一的数据环境。
Managed Service for Apache Airflow 可让用户避免供应商锁定问题并实现可移植性。Google 现在也成为了该开源项目的贡献者。该项目可让客户避免供应商锁定问题,并且可与大量平台集成。随着 Airflow 社区的发展,可集成的平台只会越来越多。
Managed Service for Apache Airflow 流水线配置为使用 Python 的有向无环图 (DAG),让任何用户都能轻松处理。一键式部署让用户可以即时访问丰富的连接器库和运行中的工作流的多种图形表现形式,简化问题排查过程。自动同步的有向无环图可确保您的作业按计划运行。
主要增强功能包括用于实现可审计性和可靠回滚的 DAG 版本控制,以及用于简化历史数据重新处理的调度器管理的回填。新的任务执行 API 和 SDK 为未来支持多种语言和隔离任务环境奠定了基础。用户可以体验到基于 React 的更快、更现代的界面,以及改进后的导航功能。计划中的事件驱动型调度旨在实现更具响应性、近乎实时的流水线。Edge Executor 可优化远程任务执行,而拆分式 CLI (airflow/airflowctl) 可为开发和运维提供更清晰的命令行体验。
文档
使用场景
所有特性
| 多云端 | 创建跨云端连接数据、处理任务和服务的工作流,从而实现统一的数据环境。 |
| 开源 | Managed Service for Apache Airflow 可让用户避免供应商锁定问题并实现可移植性。 |
| 混合 | 通过编排跨本地和公有云的工作流,轻松过渡到云端或维护混合式数据环境。 |
| 集成 | 内置与 BigQuery、Dataflow、Managed Service for Apache Spark、Datastore、Cloud Storage、Pub/Sub 及更多产品的集成,让您能够编排端到端的 Google Cloud 工作负载。 |
| Python 编程语言 | 利用已有的 Python 技能在 Managed Service for Apache Airflow 中动态编写和安排工作流。 |
| 可靠性 | 通过易于使用的图表来监控和排查问题的根本原因,提高工作流的可靠性。 |
| 全代管式 | Managed Service for Apache Airflow 特性使您可以专心编写、安排和监控工作流,而无需在资源的预配上费神。 |
| 网络和安全 | 在创建环境期间,Managed Service for Apache Airflow 提供以下配置选项:专用 IP、共享 VPC、VPC Service Controls、CMEK 加密支持等。 |