概要(Google Cloud Dataflow SDK 1.9.1 API)

Google Cloud Dataflow SDK for Java、バージョン 1.9.1

Google Cloud Dataflow SDK for Java は、データ処理パイプラインを表現するための簡単かつ洗練されたプログラミング モデルです。詳細とスタートガイドについては、プロダクト ページをご覧ください。

説明をご覧ください。

パッケージ 
パッケージ 説明
com.google.cloud.dataflow.sdk
バッチとストリーミングの両方の並列データ処理Pipelineを構築する簡単で強力なモデルです。
com.google.cloud.dataflow.sdk.annotations
SDK 全体で使用するアノテーションを定義します。
com.google.cloud.dataflow.sdk.coders
Coders を定義して、データをバイト文字列にエンコードする方法とバイト文字列からデコードする方法を指定します。
com.google.cloud.dataflow.sdk.coders.protobuf
プロトコル バッファ メッセージ、ProtoCoder のための Coder を定義します。
com.google.cloud.dataflow.sdk.io
読み取りと書き込みの共通ストレージ形式(AvroIOBigQueryIOTextIO など)の変換を定義します。
com.google.cloud.dataflow.sdk.io.bigtable
Google Cloud Bigtable からの読み取りと書き込みの変換を定義します。
com.google.cloud.dataflow.sdk.io.datastore
異なるバージョンの Cloud Datastore クライアント ライブラリに対して Google Cloud Datastore から読み取りと書き込みを行うための API を提供します。
com.google.cloud.dataflow.sdk.io.range
位置ベースの有限ソースで動的なワーク リバランシングを実装するためのスレッドセーフ ヘルパーを提供します。
com.google.cloud.dataflow.sdk.options
パイプラインの実行を構成するための PipelineOptions を定義します。
com.google.cloud.dataflow.sdk.runners
異なるモードでパイプラインを実行するためのランナー(DirectPipelineRunnerDataflowPipelineRunner など)を定義します。
com.google.cloud.dataflow.sdk.runners.inprocess
ローカルマシンで制限ありと制限なしの Pipelines を実行する InProcessPipelineRunner を定義します。
com.google.cloud.dataflow.sdk.testing
Dataflow パイプラインの単体テストのためのユーティリティを定義します。
com.google.cloud.dataflow.sdk.transforms
パイプラインのデータを変換するための PTransform を定義します。
com.google.cloud.dataflow.sdk.transforms.display
UI と診断ツール内で使用される display data を提供するコンポーネントにアノテーションをつけるための HasDisplayData を定義します。
com.google.cloud.dataflow.sdk.transforms.join
複数の PCollection を結合するための CoGroupByKey 変換を定義します。
com.google.cloud.dataflow.sdk.transforms.windowing
Defines thePCollection の要素をウィンドウに分割するための Window 変換と、それらの要素が出力の場合に制御するための Trigger を定義します。
com.google.cloud.dataflow.sdk.values
Pipeline でデータを表すための PCollection などのクラスを定義します。

Google Cloud Dataflow SDK for Java は、データ処理パイプラインを表現するための簡単かつ洗練されたプログラミング モデルです。詳細とスタートガイドについては、プロダクト ページをご覧ください。

Google Cloud Dataflow SDK for Java を使用する最も簡単な方法は、Maven Central Repository のリリース済みアーティファクトのいずれかを使用することです。 各リリース バージョンの詳細については、リリースノートをご覧ください。

バージョン番号はメジャー.マイナー.増分の形式を使用し、次のように増加します。

  • メジャー バージョン: 互換性のない API 変更
  • マイナー バージョン: 下位互換性のある方法での新機能の追加
  • 増分バージョン: 前方互換性のあるバグ修正

@Experimental マークの付いた API はいつでも変更される可能性があり、バージョン間で互換性が維持されるとは限らないことに注意してください。