Google Cloud Next Tokyo:7/30、31 東京ビッグサイトにて開催!
移動
Managed Service for Apache Airflow

Managed Service for Apache Airflow(旧 Cloud Composer)

Apache Airflow をベースに構築された、フルマネージドのワークフロー オーケストレーション サービス。

新規のお客様には、Managed Service for Apache Airflow または他の Google Cloud プロダクトで使用できる無料クレジット $300 分を差し上げます。

  • ハイブリッドおよびマルチクラウド環境にまたがるパイプラインを作成、スケジューリング、モニタリング

  • Apache Airflow のオープンソースのプロジェクト上に構築され、Python を使用して運用

  • 特定のベンダーに依存する必要がなくなり、使用も簡単

  • Apache Airflow 3(プレビュー版)の新しいサポート

利点

フルマネージドのワークフロー オーケストレーション

Managed Service for Apache Airflow はフルマネージド サービスであり、Airflow は互換性に優れているため、リソースのプロビジョニングに気をとられず、ワークフローの作成、スケジューリング、モニタリングに専念できます。

他の Google Cloud プロダクトとの統合

BigQuery、Dataflow、Managed Service for Apache Spark、Datastore、Cloud Storage、Pub/Sub などの Google Cloud プロダクトとのエンドツーエンドの統合により、ユーザーはパイプラインを自由かつ完全にオーケストレートできます。

ハイブリッドとマルチクラウドに対応

パイプラインがオンプレミスにあるか、複数のクラウドにまたがっているか、あるいは Google Cloud 内ですべて完結しているかにかかわらず、単一のオーケストレーション ツールでワークフローを作成、スケジューリング、モニタリングできます。

主な機能

主な機能

ハイブリッド クラウドとマルチクラウド

オンプレミスとパブリック クラウドにまたがるワークフローをオーケストレートすることで、クラウドへの移行が容易になり、ハイブリッド データ環境を維持することもできます。 複数のクラウドにまたがってデータ接続、処理、サービスを提供するワークフローを作成し、統一的なデータ環境を提供します。

オープンソース

Managed Service for Apache Airflow は、特定のベンダーへの依存を回避し、ポータビリティを確保できます。Google も貢献しているこのオープンソース プロジェクトは、特定のベンダーに依存することなく、さまざまなプラットフォームと組み合わせて利用できます。対象のプラットフォームは、Airflow コミュニティが拡大するにつれて増えていきます。

容易なオーケストレーション

Managed Service for Apache Airflow のパイプラインは、Python を使用して有向非巡回グラフ(DAG)として構成されており、あらゆるユーザーが簡単に使用できます。デプロイはワンクリックで完了するため、すぐにコネクタの豊富なライブラリにアクセスし、実行中のワークフローをさまざまな形式でグラフィカルに表示できます。これにより、トラブルシューティングが容易になります。また、有向非巡回グラフは自動的に同期されるため、ジョブをスケジュールに沿って確実に実行できます。

データ ワークフローの構築、管理、モニタリング方法を強化

主な機能強化には、監査性と確実なロールバックのための DAG バージョニング、履歴データの再処理を簡素化するスケジューラ主導のバックフィルなどがあります。新しいタスク実行 API と SDK は、将来の多言語サポートと分離されたタスク環境への道を開きます。ユーザーは、ナビゲーションが改善された、より高速でモダンな React ベースの UI を利用できます。計画されているイベント ドリブンなスケジューリングは、よりリアクティブで準リアルタイムのパイプラインを目指しています。Edge Executor はリモートタスクの実行を最適化し、分割された CLI(airflow/airflowctl)は開発と運用でより明確なコマンドライン エクスペリエンスを提供します。

ドキュメント

ドキュメント

Google Cloud Basics

Managed Service for Apache Airflow の概要

Managed Service for Apache Airflow 環境の概要と、Apache Airflow のデプロイに使用される Google Cloud プロダクトをご覧ください。

Architecture

データ処理ワークフローに CI/CD パイプラインを使用する

継続的インテグレーション / 継続的デプロイ(CI / CD)のパイプラインを設定し、Google Cloud のマネージド プロダクトでデータを処理する方法をご確認ください。

Pattern

プライベート IP Managed Service for Apache Airflow 環境

プライベート IP Cloud Managed Service for Apache Airflow 環境の使用に関する情報をご確認ください。

Tutorial

DAG(ワークフロー)の作成

Managed Service for Apache Airflow 環境で実行する Apache Airflow 有向非巡回グラフ(DAG)の作成方法をご確認ください。

Tutorial

Google Cloud Skills Boost: Data Engineering on Google Cloud

本コースは 4 日間のクラスルーム トレーニングで、ハンズオンを通して Google Cloud でのデータ パイプラインの設計と構築を学習します。

お探しのものが見つからない場合

ユースケース

ユースケース

ユースケース
Managed Service for Apache Airflow のユースケースを確認する
  • データ パイプラインのオーケストレーション(ETL/ELT): 抽出、変換、読み込み(ETL/ELT)ジョブなどの複雑なデータ ワークフローを自動化し、タスク間の依存関係を管理します。
  • MLOps と ML ワークフロー: データの準備、モデルのトレーニング/評価から、デプロイとモニタリングまで、エンドツーエンドの ML ライフサイクルをオーケストレートします。
  • ビジネス インテリジェンス(BI)の自動化: BI ツール用のデータ抽出のスケジュール設定、レポート生成の自動化、ダッシュボードの更新を行います。
  • インフラストラクチャおよび DevOps の自動化: クラスタのプロビジョニングや廃止、ジョブの送信、CI/CD リリース プロセスの管理など、クラウド インフラストラクチャのタスクを自動化します。
  • ハイブリッドおよびマルチクラウドのデータ統合: 他のクラウド プロバイダやオンプレミス データセンターなど、多様なソース間でデータフローを調整して、統合データセットを作成します。

すべての機能

すべての機能

マルチクラウド

複数のクラウドにまたがってデータ接続、処理、サービスを提供するワークフローを作成し、統一的なデータ環境を提供します。

オープンソース

Managed Service for Apache Airflow は、特定のベンダーへの依存を回避し、ポータビリティを確保できます。

ハイブリッド

オンプレミスとパブリック クラウドにまたがるワークフローをオーケストレートすることで、クラウドへの移行が容易になり、ハイブリッド データ環境を維持することもできます。

統合

BigQueryDataflowManaged Service for Apache SparkDatastoreCloud StoragePub/Sub などのプロダクトとの統合が組み込まれており、Google Cloud ワークロードをエンドツーエンドでオーケストレートできます。

プログラミング言語に Python を採用

既存の Python のスキルを活用して、Managed Service for Apache Airflow で動的にワークフローを作成し、スケジューリングできます。

信頼性

使いやすいチャートで環境のモニタリングや問題のトラブルシューティングができるため、ワークフローの信頼性が向上します。

フルマネージド

Managed Service for Apache Airflow はマネージド サービスであるため、リソースのプロビジョニングに煩わされることなく、ワークフローの作成、スケジューリング、モニタリングに専念できます。

ネットワークとセキュリティ

環境を作成する際、Managed Service for Apache Airflow では、プライベート IP共有 VPCVPC Service ControlsCMEK 暗号化サポートなどの構成オプションを利用できます。

料金

料金

Managed Service for Apache Airflow は従量課金制です。vCPU/時、GB/月、GB(転送量)/月で測定された使用量に基づいて料金が発生します。Managed Service for Apache Airflow は、複数の Google Cloud プロダクトを構成要素として組み合わせて構築されているため、料金単位もそれらに応じて複数に分かれています。

料金は、使用量や継続利用を問わずに一律です。 詳細については、料金のページをご覧ください。

次のステップ

$300 分の無料クレジットと 20 以上の無料枠プロダクトを活用して、Google Cloud で構築を開始しましょう。

  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud