データベース

Apache Beam と Cloud Dataflow 用の Firestore コネクタの発表

2021年11月18日

https://storage.googleapis.com/gweb-cloudblog-publish/images/Firestore_Connector.max-2600x2600.jpg

Google Cloud Japan Team

※この投稿は米国時間 2021 年 11 月 9 日に、Google Cloud blog に投稿されたものの抄訳です。

大規模なデータ処理ワークロードは、運用化とオーケストレーションが難しい場合があります。この度、Apache Beam 用のネイティブモードの Firestore コネクタをリリースしました。Firestore ユーザーにとってデータ処理がこれまで以上に容易になりました。Apache Beam は、バッチ処理ストリーミング処理統合モデルで大規模なデータ処理を支援するオープンソースプロジェクトです。 Beam は移植可能で、多種多様なバックエンドランナーと連携し、柔軟なデプロイが可能です。Firestore Beam I/O コネクタは、BigQuery、Bigtable、Datastore を Google データベースとして Apache Beam コネクタと結合します。 Firestore I/O コネクタは、Apache Beam Java SDK のGoogle Cloud Platform IO モジュールに自動的に組み込まれます。

Firestore コネクタは、Google Cloud Dataflow などのさまざまな Apache Beam バックエンドと併用できます。Apache Beam のバックエンドランナーである Dataflow は、開発者が「驚異的並列」の問題を解決するための仕組みを備えています。データベースの各レコードを変更することは、このような問題の一例といえます。Beam パイプラインを使用すると、並列化をオーケストレートする作業の多くを省略でき、開発者が代わりにデータの変換に集中できます。

Firestore コネクタは、他の Beam コネクタと同じように簡単に使用できます。

読み込んでいます...

Google Cloud のユーザーにとって、このコネクタは多くの用途が考えられます。ネイティブモードの Firestore のデータベースにおける異種データの結合、複数のデータベースにまたがるデータの関連付け、大量のエンティティの削除、BigQuery への Firestore データの書き込みなどが考えられます。このコネクタを Apache Beam エコシステムに提供できたことをうれしく思います。また、Firestore コネクタを使用して素晴らしいサービスが構築されることを期待しています。

- Google Cloud スタッフエンジニア Chris Wilcox

投稿先