Apache Airflow をベースに構築された、フルマネージドのワークフロー オーケストレーション サービス。
新規のお客様には、Managed Service for Apache Airflow または他の Google Cloud プロダクトで使用できる無料クレジット $300 分を差し上げます。
ハイブリッドおよびマルチクラウド環境にまたがるパイプラインを作成、スケジューリング、モニタリング
Apache Airflow のオープンソースのプロジェクト上に構築され、Python を使用して運用
特定のベンダーに依存する必要がなくなり、使用も簡単
Apache Airflow 3(プレビュー版)の新しいサポート
利点
フルマネージドのワークフロー オーケストレーション
Managed Service for Apache Airflow はフルマネージド サービスであり、Airflow は互換性に優れているため、リソースのプロビジョニングに気をとられず、ワークフローの作成、スケジューリング、モニタリングに専念できます。
他の Google Cloud プロダクトとの統合
BigQuery、Dataflow、Managed Service for Apache Spark、Datastore、Cloud Storage、Pub/Sub などの Google Cloud プロダクトとのエンドツーエンドの統合により、ユーザーはパイプラインを自由かつ完全にオーケストレートできます。
ハイブリッドとマルチクラウドに対応
パイプラインがオンプレミスにあるか、複数のクラウドにまたがっているか、あるいは Google Cloud 内ですべて完結しているかにかかわらず、単一のオーケストレーション ツールでワークフローを作成、スケジューリング、モニタリングできます。
主な機能
オンプレミスとパブリック クラウドにまたがるワークフローをオーケストレートすることで、クラウドへの移行が容易になり、ハイブリッド データ環境を維持することもできます。 複数のクラウドにまたがってデータ接続、処理、サービスを提供するワークフローを作成し、統一的なデータ環境を提供します。
Managed Service for Apache Airflow は、特定のベンダーへの依存を回避し、ポータビリティを確保できます。Google も貢献しているこのオープンソース プロジェクトは、特定のベンダーに依存することなく、さまざまなプラットフォームと組み合わせて利用できます。対象のプラットフォームは、Airflow コミュニティが拡大するにつれて増えていきます。
Managed Service for Apache Airflow のパイプラインは、Python を使用して有向非巡回グラフ(DAG)として構成されており、あらゆるユーザーが簡単に使用できます。デプロイはワンクリックで完了するため、すぐにコネクタの豊富なライブラリにアクセスし、実行中のワークフローをさまざまな形式でグラフィカルに表示できます。これにより、トラブルシューティングが容易になります。また、有向非巡回グラフは自動的に同期されるため、ジョブをスケジュールに沿って確実に実行できます。
主な機能強化には、監査性と確実なロールバックのための DAG バージョニング、履歴データの再処理を簡素化するスケジューラ主導のバックフィルなどがあります。新しいタスク実行 API と SDK は、将来の多言語サポートと分離されたタスク環境への道を開きます。ユーザーは、ナビゲーションが改善された、より高速でモダンな React ベースの UI を利用できます。計画されているイベント ドリブンなスケジューリングは、よりリアクティブで準リアルタイムのパイプラインを目指しています。Edge Executor はリモートタスクの実行を最適化し、分割された CLI(airflow/airflowctl)は開発と運用でより明確なコマンドライン エクスペリエンスを提供します。
ドキュメント
ユースケース
すべての機能
| マルチクラウド | 複数のクラウドにまたがってデータ接続、処理、サービスを提供するワークフローを作成し、統一的なデータ環境を提供します。 |
| オープンソース | Managed Service for Apache Airflow は、特定のベンダーへの依存を回避し、ポータビリティを確保できます。 |
| ハイブリッド | オンプレミスとパブリック クラウドにまたがるワークフローをオーケストレートすることで、クラウドへの移行が容易になり、ハイブリッド データ環境を維持することもできます。 |
| 統合 | BigQuery、Dataflow、Managed Service for Apache Spark、Datastore、Cloud Storage、Pub/Sub などのプロダクトとの統合が組み込まれており、Google Cloud ワークロードをエンドツーエンドでオーケストレートできます。 |
| プログラミング言語に Python を採用 | 既存の Python のスキルを活用して、Managed Service for Apache Airflow で動的にワークフローを作成し、スケジューリングできます。 |
| 信頼性 | 使いやすいチャートで環境のモニタリングや問題のトラブルシューティングができるため、ワークフローの信頼性が向上します。 |
| フルマネージド | Managed Service for Apache Airflow はマネージド サービスであるため、リソースのプロビジョニングに煩わされることなく、ワークフローの作成、スケジューリング、モニタリングに専念できます。 |
| ネットワークとセキュリティ | 環境を作成する際、Managed Service for Apache Airflow では、プライベート IP、共有 VPC、VPC Service Controls、CMEK 暗号化サポートなどの構成オプションを利用できます。 |