Cloud Data Fusion は、ストリーミング データ パイプライン内の Pub/Sub ソースをサポートしています。
Pub/Sub ソースをストリーミング データ パイプラインに追加する
インスタンスに移動します:
Google Cloud コンソールで、Cloud Data Fusion のページに移動します。
Cloud Data Fusion ウェブ インターフェースでインスタンスを開くには、[Instances] をクリックしてから、[View instance] をクリックします。
Cloud Data Fusion ウェブ インターフェースで、[Studio] をクリックします。
[Data Pipeline - Realtime] を選択します。
[ソース] メニューで、[Pub/Sub] を選択します。Pub/Sub ストリーミング ソースノードがパイプラインに表示されます。
Pub/Sub ノードで [プロパティ] をクリックし、ソースを構成します。詳細については、Pub/Sub ストリーミング ソースをご覧ください。
Windower プラグインのない単一の Pub/Sub ソースのサポート
Cloud Data Fusion バージョン 6.9.1 は、単一の Pub/Sub ストリーミング ソースを持ち、Windower プラグインを持たないリアルタイム パイプラインをサポートしています。
- Pub/Sub ストリーミング ソースには組み込みのサポートがあり、データは少なくとも 1 回処理されます。Spark チェックポインティングを有効にする必要はありません。
- Pub/Sub ストリーミング ソースは、各バッチの先頭で Pub/Sub スナップショットを作成し、各バッチの最後で削除します。
- Pub/Sub スナップショットの作成には費用がかかります。詳細については、Pub/Sub の料金をご覧ください。
- Cloud Audit Logs でスナップショットの作成をモニタリングできます。
Pub/Sub ストリーミング ソースを使用したパイプラインをアップグレードする
Cloud Data Fusion では、6.9.1 以降で作成された Pub/Sub ストリーミング ソースを使用したストリーミング パイプラインの直接アプリケーション アップグレードをサポートしています。
Cloud Data Fusion は、バージョン 6.9.0 以前の Pub/Sub ストリーミング ソースを使用したデータ パイプラインのアップグレードをサポートしていません。代わりに、これらのパイプラインを 6.9.1 にアップグレードしてください。
- インスタンスのアップグレードが予定されている場合、トピックへのデータの公開を停止します。
- パイプラインが公開データの処理を終了するまで待ちます。
- データが完全に処理されたら、パイプラインを停止します。
- インスタンスをアップグレードします。
- 既存のパイプラインを複製し、最新のプラグインに更新します。
- パイプラインをデプロイします。
新しいパイプラインを実行してデータを読み込みます。
新しいバージョンでは、Spark チェックポインティングの代わりに、スナップショットを自動的に使用します。
古いパイプラインを削除します。
次のステップ
- CDAP の Pub/Sub ストリーミング ソースをご覧ください。